6

Alexa 和 Google Analytics 等服务如何能够跟踪访问者的年龄、性别、大学教育等?

http://www.alexa.com/siteinfo/stackoverflow.com

4

3 回答 3

7

Alexa 肯定会从其工具栏用户那里获取流量信息。由于这是一个相对较小且自我选择的人群,这不可避免地会导致样本有偏差(这就是为什么 Alexa 流量与我运行的网站上测量的流量不匹配的原因)。即使使用最好的统计技术来减少偏差,当抽样分布不均匀时,您也永远无法完全摆脱它。

不清楚谷歌是如何做到的,尽管它可能涉及跟踪 cookie。

我最近一直在做的一个项目与这个问题有关。

另一种方法(也有偏差,但不同)是使用 IP 定位服务来查找您网站的每个访问者的大致纬度和经度。然后使用我的项目(完全披露:我运行该站点并且它是商业的):

http://askgeo.com

获取该位置的人口统计信息。AskGeo 实际上提供了几个地理级别(州、县、县分区、城市、邮政编码、人口普查区(几千人)和人口普查区组(大约一千人)的人口统计信息。您可能想使用给定纬度和经度的最低级别(即人口普查区块组)。

该网站返回了大量的人口统计变量。这个想法是使用来自块组级别提供的人口统计变量的软计数。举个例子,如果您尝试跟踪用户的年龄分布,那么您将使用 AskGeo 响应中提供的年龄范围,并且对于给定的样本,您将向每个对应的范围添加一个分数软计数到相应年龄范围内该街区组的人口百分比。例如,以我在旧金山的社区为例。它具有以下年龄分布:

  • CensusAgePercent0To4:7.3%
  • CensusAgePercent5To9:3.5%
  • CensusAgePercent10To: 3.2%

...(略过,你可能明白了)...

  • CensusAgePercentOver85:1.5%

如果您有一个跟踪到该人口普查块组的 IP 地址,您可以将这些百分比中的每一个(作为从 0 到 1 的分数)添加到这些年龄范围的(软)计数器中。(软计数器只是一个允许非整数计数的计数器。)

你可以对种族、性别、收入水平、房屋价值等做同样的事情。

当然,这种方法也有偏见,因为它假设给定块组中的所有人都同样可能访问您的网站。但这是你可以在自己的网站上做的事情,而不仅仅是谷歌和 Alexa,如果你在给定类别中的软计数高于全国平均水平,它仍然可以让你相对了解谁在访问你的网站类别。

比简单直接计数更复杂的技术也可能导致更丰富的结果。

于 2012-05-08T19:34:34.500 回答
0

Alexa 从您有意安装的浏览器工具栏或与某些软件捆绑在一起的浏览器工具栏中获取其信息。它提出问题以了解人口统计参数并跟踪您访问的网站。如果您知道 80% 的网站访问者是女性,并且您有访问该网站的新访问者,您可以认为此人很有可能是女性。如果您知道此人访问的很多网站,您可以猜到很多。

但正如http://netberry.co.uk/alexa-rank-explained.htm所说,您只能依靠来自 Alexa TOP100,000 的信息,因为这样 Alexa 从访问这些网站的少量用户那里获得了足够的信息。他们说“数百万”,但只占总数的一小部分

于 2013-09-16T16:34:17.197 回答
0

我做了一些研究,显然这些人口统计数据的跟踪方式与跟踪电视观众人口统计数据的方式相同。有些人使用他们的(Alexa 的)工具栏进行浏览,该工具栏会跟踪访问过的网站。这些人愿意(?)提供年龄、性别等信息,Alexa 从这个样本中推断出一般人口统计数据。这当然会给偏见留下空间,但这是统计数据的问题。

于 2010-08-25T19:10:30.327 回答