我正在使用 Snowplow 进行行为数据跟踪。我可以使用 Snowplow 加载程序(和 mutator)开源代码(https://docs.snowplowanalytics.com/docs/getting-started-on-snowplow-open-source/setup-snowplow- )将数据从 Pub/Sub 消耗到 BigQuery on-gcp/setup-bigquery-destination/),但我想直接使用来自 Pub/Sub 的数据到 Java API。
但是,来自 Pub/Sub 的数据是非结构化的,没有字符串格式的架构。数据包括“\t”作为分隔符以及“{}”来存储一些模式,这可能需要字符串处理来进行数据格式化。
有没有其他更好的方法来将数据从 Pub/Sub 解码到 Java API,而不是编写复杂的字符串处理。谢谢!