我正在处理恒星光曲线(包含 4000 个时间数据点与恒星亮度的 .fits 文件,请参见图形以了解具有不同周期性的几个示例)。我需要以一种允许我通过机器学习对它们执行无监督聚类的方式来表示/拟合这些光曲线。有人建议我使用高度的多项式表示(p = 30...最多几百)或在光曲线上使用傅立叶变换。我发现具有高 p 的 numpy.polyfit 的多项式拟合不能提供良好的拟合,并且我收到警告“RankWarning:Polyfit 可能条件不佳”。也许我应该尝试傅立叶变换,但我不熟悉而且听起来很复杂。
为了机器学习聚类,我如何/应该如何表示/拟合这些数据?我可以使用 p>30 的 np.polyfit 获得良好的结果吗?