0

我正在处理恒星光曲线(包含 4000 个时间数据点与恒星亮度的 .fits 文件,请参见图形以了解具有不同周期性的几个示例)。我需要以一种允许我通过机器学习对它们执行无监督聚类的方式来表示/拟合这些光曲线。有人建议我使用高度的多项式表示(p = 30...最多几百)或在光曲线上使用傅立叶变换。我发现具有高 p 的 numpy.polyfit 的多项式拟合不能提供良好的拟合,并且我收到警告“RankWarning:Polyfit 可能条件不佳”。也许我应该尝试傅立叶变换,但我不熟悉而且听起来很复杂。

为了机器学习聚类,我如何/应该如何表示/拟合这些数据?我可以使用 p>30 的 np.polyfit 获得良好的结果吗? 在此处输入图像描述

4

1 回答 1

1

对于具有明显“季节性”循环周期的事物,傅里叶变换似乎更合适。

想象一下你得到了更多的数据。您希望表示是稳定的,并且在某种程度上可以预测这种明显的时间模式。多项式不能很好地做到这一点,它可能一直需要新的术语。

但当然还有其他选择:DCT、小波等 - 有整本关于处理此类数据的书籍。

于 2018-05-10T12:27:22.243 回答