0

在流式传输推特数据时,我发现地理参考推文(带有纬度和经度的推文)明显减少。是因为Foursquare的信息整合吗?或者还有其他问题吗?

非常感谢!

4

1 回答 1

0

去年,我在按位置应用社会分析工作。我们从 twitter 中抽取了推文,目的是使用地理位置属性来确定区域的情绪。不幸的是,我们发现只有 10-15% 的推文(根据我们自己的发现)实际上是带有地理标记的,这不足以准确描述情绪。相反,我们选择使用位置指示标签。

在说这取决于样本量。我们试图确定诸如建筑物等具有少量活跃 Twitter 用户的区域的情绪。如果您的目标是在更大的区域(例如城镇/城市/国家/地区)内查找推文,那么 10-15% 可能足以满足您的需求。

回答您最初的问题:用户通常是私密的,除非他们明确打算在某个地方签到,所以我的猜测是 10-15% 的地理位置推文是由于用户忘记禁用地理位置或使用新的/不经常使用的设备,它没有被禁用。它也可以归因于foursquare 信息集成,因为我相信用户只是忽略了foursquare 为twitter 提供地理位置信息的事实。

这篇文章读起来很有趣。它概述了 SoCal 大学开发的一个应用程序,它可以帮助用户识别他们是否在推文中泄露敏感/私人位置信息。

于 2015-10-09T16:42:39.003 回答