5

对开发者,

我正在为 Azure Data Lake 进行基准测试,我看到在同一区域中读取 ADL 存储和写入 VHD 大约为 7.5 MB/S。PowerShell 和 C# 就是这种情况,代码取自以下示例:

PowerShell 代码来自https://azure.microsoft.com/en-us/documentation/articles/data-lake-store-get-started-powershell/ C# 代码来自https://azure.microsoft.com/en-我们/文档/文章/data-lake-store-get-started-net-sdk/

上述代码示例是否可以用于基准测试,或者是否会提供新的 SDK 以提高吞吐量?此外,当 ADL 存储普遍可用时,是否有预期的吞吐量数字?

谢谢,马克

4

2 回答 2

2

文档中提供的代码可用于构建基准测试。在 Azure Data Lake 普遍可用之前,SDK 将经历一些版本和更新。这些将包括除了功能之外的性能改进。

关于性能基准的主题,我们的一般指导如下。Azure 数据湖服务目前处于预览阶段。我们一直致力于通过此预览阶段改进服务,包括性能。随着我们接近全面可用性,我们将考虑发布有关预期性能结果类型的额外指南。性能结果在很大程度上取决于许多因素,例如测试拓扑、配置和工作负载。因此,如果不检查所有这些,就很难评论您的观察。如果您可以离线联系我们并提供详细信息,我们将很乐意查看。

Amit Kulkarni(项目经理 - Azure 数据湖)

于 2016-05-09T19:51:03.900 回答
0

我开始编写Azure Data Lake Storage 吞吐量分析器并将第一个代码位放在 GitHub 上。

您应该在 Azure VM 上运行该工具,以免测量您的 Internet 连接。

请随时将您的想法和代码贡献添加到我的 GitHub 存储库中。

我希望这有帮助。

于 2016-02-27T07:56:04.827 回答