我正在尝试按时间戳查询我的数据集,但我需要为完整的数据集扫描付费。是否可以仅查询特定时间戳并减少分析数据的大小?
请注意,我正在使用 Stackdrive Sink 在我的数据集上实时传输数据。我对架构没有任何控制权。
SELECT
REGEXP_EXTRACT(httpRequest.requestUrl, r"^.+cid=([0-9]*)") as cid,
REGEXP_EXTRACT(httpRequest.requestUrl, r"^.+pid=([0-9]*)") as pid
FROM
`dataset_20190305` -- Date partition - no time
WHERE timestamp >=TIMESTAMP('2019-03-05 16:50:00')