0

在我的研究中,我面临着数据源的巨大挑战。基本上我有六种类型的事件注册用于后期处理。该事件与过程中使用的一种离子以及该事件在设备上发生的位置有关。图 1 显示了每种偶数类型的平均曲线。

图 1

图 1 平均曲线

我的目标是对寻找这条曲线的离子类型进行分类,以研究曲线,我使用从每条曲线中提取的四个参数:peak value [max value]、和middle length[red line],如图 2 所示。Rising time[green]Base length [ blue]

图 2

提取的特征

我正在使用两种类型的算法来尝试对曲线进行分类K-meansLDA但是目前的结果还不清楚,我没有好的集群和分类器,我也运行了一个SOM算法并且得到了更好的结果,但不是非常令人满意。相信参数不好选。我如何才能很好地指示良好的参数?如何为我的分类器选择正确的参数?在这种情况下有什么好的做法可以使用?

4

1 回答 1

0

一种方法是设计一个比较两件事的实验。例如,您想知道参数是否良好。尝试一组不同的四个参数,例如四个固定时间间隔的幅度(例如,20ms、30ms、40ms 和 50ms 的幅度)。当您将原始参数集与新参数集进行比较时,您将得到结果表明在测试条件下一种方法优于另一种方法。也许一组为分类任务提供了比另一组更多的相关信息。

这假设您有一些具有已知分类的数据。最好使用与测试集分开的不同训练集。

或者,如果您的实验只是 kmeans 与 LDA,哪一个效果更好?好多少?你知道为什么吗?

最后,您将进行大量实验,每个实验都会比较两件事。它可能会帮助您描述您的发现。

于 2017-11-29T12:20:01.330 回答