0

我正在寻找弹出的云服务(例如 Amazon/Azure)的详细信息,并且想知道它们是否适合我的应用程序。

我的应用程序基本上有一个大约 500GB 的单表数据库。它以 3-5 GB/天的速度增长。我需要从中提取文本数据,一次大约 100 万行,过滤大约 5 列。提取的数据通常约为 1-5 GB,压缩后可达 100-500MB,然后在网络上可用。

这里有我现有实现的一些细节 一个 400GB 表,一个查询 - 需要调整想法 (SQL2005)

所以,我的问题是:现有的云服务是否适合托管这种类型的应用程序?存储这么多数据和带宽的成本是多少(带宽使用量约为 2GB/天)?

持久性系统是否适合存储这样的大型平面表,它们是否提供在多个列上进行搜索的能力?

我当前的实现在低于 10k 美元的硬件上运行,因此如果成本远高于 5k 美元/年,那么迁移是没有意义的。

4

2 回答 2

1

鉴于海量数据及其增长速度,我认为亚马逊不是一个好的选择。我假设您希望将数据存储在持久存储中。但是使用 EC2,您需要分配给定数量的存储并将其作为磁盘附加。除非您想分配大量空间(然后为未使用的磁盘空间付费),否则您将不得不不断添加更多磁盘。我快速回顾了包络计算,我估计托管费用每年在 2,500 到 10,000 美元之间。由于亚马逊收取的所有可变因素(实例正常运行时间、存储空间、带宽、磁盘 io 等),我很难准确估计。这是EC2 定价

于 2009-03-04T07:21:41.877 回答
0

假设这是非关系数据(不能在单个表上处理关系数据),您可以考虑使用 Azure 表存储,这是一种专为非关系结构化数据设计的存储机制。

您将在此处遇到的问题是 Azure 表只有一个主索引,因此无法按您的需要按 5 列进行索引。除非您将数据存储 5 次,否则每次都按您希望过滤的列进行索引。不确定这是否会非常划算。

Azure 表存储的成本低至每月每 Gig 8c USD,具体取决于您存储的数据量。每笔交易和出口数据也有费用。有关定价的更多信息,请点击此处;http://www.windowsazure.com/en-us/pricing/calculator/advanced/

您需要从哪里访问这些数据?它是如何写入的?

基于此,还可以考虑其他选项,例如 Azure Drives 等。

于 2012-04-30T02:46:30.917 回答