我正在使用跨越两个月 [2015 年 11 月和 2015 年 12 月] 的大量时间序列数据,其中包含时间戳观察。总共约600万个样本。我使用数据集中的干净数据部分来训练 One 类 SVM。
这里要注意的是,我已经相应地对数据进行了缩放和规范化,但我正在使用处理过的原始时间戳来训练它。在我训练了 OCSVM 之后 - 在我的测试数据上对其进行测试效果不佳。结果非常不准确。
我认为的原因是因为我正在使用时间戳对其进行训练。但我不确定。
是否更建议进行预处理并获得每小时的平均值然后对其进行训练,而不是按原样进行每次观察?
我一直在尝试在训练之前找到如何处理时间序列数据,但我找不到任何东西。任何建议或参考论文将不胜感激
注意:我在简历上也问过同样的问题。