0

我正在使用 Snowplow 进行行为数据跟踪。我可以使用 Snowplow 加载程序(和 mutator)开源代码(https://docs.snowplowanalytics.com/docs/getting-started-on-snowplow-open-source/setup-snowplow- )将数据从 Pub/Sub 消耗到 BigQuery on-gcp/setup-bigquery-destination/),但我想直接使用来自 Pub/Sub 的数据到 Java API。

但是,来自 Pub/Sub 的数据是非结构化的,没有字符串格式的架构。数据包括“\t”作为分隔符以及“{}”来存储一些模式,这可能需要字符串处理来进行数据格式化。

有没有其他更好的方法来将数据从 Pub/Sub 解码到 Java API,而不是编写复杂的字符串处理。谢谢!

4

1 回答 1

1

Snowplow 维护了许多所谓的“分析 SDK”,可让您将丰富的混合 tsv + JSON 格式转换为可用于下游应用程序的纯 JSON。

对于 Java,最好的选择可能是 Scala Analytics SDK:https ://github.com/snowplow/snowplow-scala-analytics-sdk 。

还有用于.NETGoJavaScript的SDK Pythonhttps ://github.com/snowplow/snowplow/tree/master/5-data-modeling/analytics-sdk 。

于 2021-05-12T08:24:32.930 回答