2

我有点计算受限,因为我不想在拉几个小时的时候杀死数据库或带宽。

我当前的查询是这样的:

SELECT TOP (100000000) mycolumns
FROM mydb
WHERE lower_control_limit> value1
    AND upper_control_limit < value2 ;

我没有得到一个像样的随机样本,但我害怕在返回值之前放置必须遍历数十亿行的命令。我需要在域(行)上的统一随机样本。

从数十亿行大小的商店中提取数亿行的“最佳实践”是什么?

我见过随机的,但我只是担心查询的大小与有限的计算和带宽资源。

4

1 回答 1

0

发现这个:从 SQL Server 表中选择 n 个随机行

 SELECT TOP (100000000) mycolumns
 FROM mydb order by newid()
于 2015-10-08T18:48:41.357 回答