我有一个充满事件数据的 json,我需要使用 iglu webhook 将其发送到 python 中的扫雪机,但无法找到任何可靠的指导。我能够找到的大多数文档都与跟踪特定事件和发送数据有关,但我需要以与填充前瞻性数据相同的方式回填历史数据,因此必须发送一个带有活动历史记录的大型 json一开始。
这可能使用扫雪机/python/iglu 还是我错误地解决了这个问题?
这个问题已经老了,OP可能已经继续了,但我会为其他可能偶然发现它的人留下一个答案。
Snowplow 收集器(例如stream-collector)通过 HTTP 接收数据。理论上,任何发送 HTTP 请求的方法都应该有效,但是有一些特定的 SDK 可以解决常见的用例。特别是对于 Python,有snowplow-python-tracker。您可以在此处参考完整的文档:Snowplow Python Tracker Docs。
您不需要使用 Iglu webhook。您可以通过现有的请求路径将您的 Python 跟踪器实例直接指向您的收集器,这些路径在此处记录。是的,这些路径之一是通过 Iglu webhook 适配器请求请求,但这意味着在您无法控制实例化跟踪器的环境的特定情况下使用,例如第三方供应商系统。