在使用 blob 引用输入时,我们在流分析中看到了一个问题。重新启动流后,它会为加入它的事物打印双精度值。我认为这是在重新启动期间有超过 1 个 blob 处于活动状态的问题。目前,我们从结构为 Output/{date}/{time}/Output.json 的 ADLS 中的文件夹路径中提取文件,最终为 Output/2021/04/16/01/25/Output.json。这些文件具有与流中的数据匹配的键:
IoTData
LEFT JOIN kauiotblobref kio
ON kio.ParentID = IoTData.ConnectionString
我没有看到任何问题,但这些文件实际上每分钟都是由天蓝色函数创建的。因此,在流分析开始期间,它可能会抓取最后一个以及随后创建的那个。(这是我的猜测,但我不确定我们将如何解决这个问题)。
这是该问题在 powerBI 中的视觉效果:
在查看它所捕获的设备的 cosmosDB 时,这很容易解释,有两个条目具有相同的值、assetID、时间戳、不同的 recordID(只是意味着 cosmosDB 将其计为两个单独的事件)。这是不可能的,因为我们无法从设备发送具有相同时间戳的副本。