2

问题陈述: 我想创建一个离线数据库来查找在美国销售的最有用的 n 本书的价格/信息(其中 n 可能是 300 万左右)。

问题: 所以,我的问题是(我也对这里的其他方法持开放态度),我试图弄清楚如何使用亚马逊 AWS 下载正在销售的最高销量书籍的列表以及一些关于书(即标题、价格等)。

到目前为止我所做的: 首先,类似的东西已经存在(asellertool.com),但是,我认为这将是一个有趣的项目,坦率地说,我们还不够认真,需要支付 30 美元/月订阅。

现在,如果您有一些想要查找的项目,AWS 很棒(而且很容易),但我似乎无法弄清楚销售排名是如何枚举的。最初,我希望通过 ISBN 列举亚马逊拥有的所有图书项目。但这也不可用。然后我想我可以在那里找到所有 ISBN 号码的列表,但这也是一个死胡同。最后我想我可以创建自己的 ISBN 号码列表,但是当我做了一些粗略的计算时,我想得更好,因为我的解决方案需要大约一年的时间才能通过 100/ 的 10 位数字空间的三分之一第二个(无论如何这都是矫枉过正)。

所以,我又回到了销售排名,目前这似乎也是一个死胡同。因此,如果您有任何想法,我将不胜感激。

4

4 回答 4

1

查看AWS Zone部分Amazon E-Commerce Service

于 2008-12-12T22:14:47.487 回答
1

亚马逊有一个数据馈送服务,您可以使用它包含基于顶级类别的所有产品的 GZipped xml 文件。它每天更新一次,总计大约 20GB/110GB 的压缩/未压缩数据。由于您只需要书籍,因此更多的是 4GB/31GB。唯一的问题是我不确定谁可以使用它以及获得帐户涉及什么。据我所知,他们没有在他们的网站上列出任何关于此的内容,因此您很可能必须联系那里的人以了解更多信息。我们在工作中使用它来处理我们对它们所做的事情,这是我不得不做的一些最疯狂的 xml 处理。

于 2009-07-30T01:55:44.417 回答
0

我想知道您想使用哪一项 Amazon AWS 服务?还是你不知道?

为什么需要离线数据库?为什么不对你需要的所有东西发出请求并做一些临时缓存呢?

于 2008-12-11T10:11:14.133 回答
0

我也不是程序员,但好奇又便宜。Asellerstool 可能很棒,但如果不是亚马逊的免费数据库,它们就不会存在。好吧,我想没有人关心二手书的价格吗?

于 2009-07-19T14:43:40.533 回答