问题标签 [bigquery-udf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-bigquery - 无法在处理位置使用 bigquery udf (bqutil):us-west-2
我们正在尝试在 us-west2 - https://github.com/GoogleCloudPlatform/bigquery-utils/tree/master/udfs/community中使用这些。
我们的数据集models
在 us West 2 中。似乎来自第二个查询编辑器的所有查询都在 us-west 2 中处理,似乎bqutil
不存在?bqutil.fn.levenshtein
在 us-west2(我们的数据集都存在的地方)中处理时,我们如何找到该函数?
sql - 如何在 Google BigQuery 的字符串列中提取所有(包括 int 和 float)数值?
我Table_1
在 Google BigQuery 上有一个表,其中包含一个字符串列str_column
。我想编写一个 SQL 查询(与 Google BigQuery 兼容)来提取所有数值str_column
并将它们作为新的数值列附加到Table_1
. 例如,如果str_column
包含first measurement is 22 and the other is 2.5
; 我需要提取 22 和 2.5 并将它们保存在新列numerical_val_1
和numerical_val_2
. 理想情况下,新数值列的数量应等于 中数值的最大数量str_column
,但如果这太复杂,则提取中的前 2 个数值str_column
(因此提取 2 个新列)也可以。有任何想法吗?
sql - 如何检查两个表在 Big Query 中是否包含相同的信息?
假设我们有一个table_a
包含两个字符串和一个 int 字段的表:
table_a
包括一些数据:
我们还有另一个表 ,table_b
它与 有点相同table_a
。事实上,它table_b
具有与 in 完全相同的字段和值,table_a
并且它还有一个额外的 DATETIME 字段。这个额外的 DATETIME 字段B4
本质上与标准 DATETIME 格式相同,A3
但已转换为标准 DATETIME 格式。
其中的值table_b
是:
注意,table_a
可能table_b
有也可能没有主键。如何检查是否包含相同的信息table_a
?table_b
我的数据库中有几个,table_a
我table_b
为每个创建了等效项;现在我想仔细检查并确保表格包含相同的信息。
google-bigquery - BigQuery:从 JS udf 返回时间戳并抛出“无法强制输出值输入 TIMESTAMP”
我有一个大查询代码。
当我执行此操作时,我收到以下错误:
我觉得这很奇怪,因为 BigQuery 应该能够正确解释它,而且我没有遇到任何其他数据类型的问题。另外,如果我这样做:
它返回:
所以 BigQuery 确实可以正确解析它。我不确定为什么 UDF 不会发生这种情况。在搜索互联网时,我发现了这个问题,正如答案所示,如果我将 return 语句更改为:
它解决了这个问题。但是对于我的一个项目,由于结构列的数量很大,对每个时间戳都执行此操作是不可行的。
所以,我想知道是否有人有更好的选择?
PS:我已经从上面的例子中删除了很多非必要的部分,所以这可能看起来有点抽象。此外,实际用例有点不同和复杂,这就是我需要那个 JS udf 的原因。
java - 具有限制和偏移的 BigQuery 存储读取 API
如何使用 Bigquery Storage Rad Api 应用基于限制和偏移的数据选择?
下面是我尝试从 BigQuery 表中读取数据的示例。它正在获取整个表,我可以提供基于列值的过滤器。但我想应用 LIMIT 和 OFFSET 并为数据获取/读取提供自定义 SQL。可以在 Storage API 中使用吗?
optimization - BigQuery 存储过程 VS BigQuery 脚本
我能够同时使用 Big Query 脚本和 BigQuery 存储过程来执行连接和聚合任务,这更好,这应该是我作为 BigQuery 脚本或 BigQuery 存储过程执行任务的首选。使用一个比另一个有什么优点或缺点。
sql - Bigquery 宏/重复查询部分
我们使用 Bigquery 来计算我们的许多日常指标,但我们也总是对长期平均值(7 天、14 天、28 天、QTD、YTD)感兴趣。
这总是这样完成的(ds:日期):
我不喜欢的是在所有指标查询中基本上重复相同的代码(如果计算了多个指标,有时会重复多次)。有没有推荐的方法来简化这一点,也许使用某种宏或 UDF?