6

大家下午好,我有一个新问题,希望你们能再次帮助我:

我有一个向量,您可以在下一个链接中找到它:

https://drive.google.com/file/d/0B4WGV21GqSL5Y09GU240N3F1YkU/edit?usp=sharing

绘制的向量如下所示:

在此处输入图像描述

如您所见,图中的某些部分数据具有几乎线性的行为。这就是我所说的:

在此处输入图像描述

我需要的是根据数据中某些部分的线性度找到那些断点。你可能会问自己,当数据的一部分不是线性的时会发生什么,好吧,算法不会占用那部分。

我希望你能帮助我,谢谢。

4

1 回答 1

7

您尝试做的是分段线性时间序列分割。

有很多方法可以解决这个问题,它们的复杂性和准确性各不相同。

这是最简单的一种,称为滑动窗口分割:

function [breaks vals] = segment( data, max_error )
    breaks = [];
    vals = [];
    left = 1;
    for right = 2:length(data)
        err = linear_regresion(data(left:right));
        if max(abs(err)) > max_error
            breaks(end+1) = right-1;
            vals(end+1) = data(right-1);
            left = right;
        end
    end
end

function err = linear_regresion( data )
    n = length(data);
    x = (1:n)' - (n+1)/2;
    y = data - mean(data);
    k = sum(x.*y) ./ sum(x.^2);
    err = y - k*x;
end

linear_regresion这是一个简单的线性回归算法的实现。

在我的示例中,我使用最大绝对误差作为停止标准,但您可以将其替换为任何其他拟合函数,例如mean squared error

以下是使用 分割数据的示例max_error = 0.04

分割结果

您可以在本调查报告中找到更多关于此和其他分割技术的信息。

于 2014-07-21T21:41:38.557 回答