-2

我正在努力根据推特数据创建飓风桑迪的实际移动路径。我的方法如下:

我收集了 2012 年 10 月 28 日至 2012 年 10 月 31 日期间与主题标签“飓风桑迪”相关的所有推文(飓风桑迪于 2012 年 10 月 29 日在新泽西州布里根廷附近登陆)。在接下来的两天里,它影响了许多邻近的州。我将所有收集的推文按时间序列排列,然后将时间排序的推文划分为固定大小的时间窗口。然后,在每个时间窗口,我计算相关的推文,即指向飓风轨迹位置的推文。接下来,我获取相关推文的起源位置并将它们连接起来以获取飓风轨迹。

我面临的问题是如何确定任何推文与飓风所走轨迹的相关性,即如何确定推文是否来自飓风轨迹下的区域。有哪些可能的功能或算法可以做到这一点?

4

1 回答 1

1

你看过数据吗?

Twitter 数据是 99% 的混乱和 1% 的信号。

我怀疑您能否从这些数据中实现目标。特别是,网络可能已经在真正的飓风发生的地方中断了……

于 2014-05-26T18:12:26.557 回答