0

市场上有许多社交媒体监控网站。我很好奇这些网站如何获取如此大量用户的帖子。他们如何知道应该获取哪些用户的帖子?

例如,如果一个网站需要我使用我的 Facebook 帐户登录,它只是获取/分析我或我朋友的帖子。那将是合理的。但我前几天试了几个社交媒体监控服务,发现抓取的数据量非常大,包括各类用户。

服务如何知道他们应该获取哪些用户的数据?如果他们获取某个社交网站的所有帖子,他们是如何实现的?社交网站的 API 不是一直禁止应用获取大量数据吗?

4

1 回答 1

1

Social Radar 应用程序主要是爬虫驱动的。这类似于 Google.com 搜索引擎的工作方式。

谷歌并不真正担心他们正在抓取哪些用户的内容,他们只是将他们能找到的内容编入索引。内容通常是在生态系统中构建的,所以如果你能找到对话的一部分,你通常也可以发现它的其余部分。这在垃圾邮件过滤过程中也是正确和有用的。

API 也被利用,术语因服务而异。

于 2011-08-23T14:45:23.370 回答