0

我在独立集群中运行了 Flink 有界作业。然后 Flink 将其分解为 3 个工作。一个工作完成后开始下一个工作大约需要 10 秒。如何减少工作之间的时间?当观察任务流程的细节时,我注意到第二个工作完成了第一个工作已经完成的相同任务,加上新的额外任务,等等 3rb 工作。例如,它反复从每个作业中的文件中读取数据,然后将其加入。为什么会这样?我是 Flink 的新用户。AFAIK,我们无法在 Flink 中缓存数据集。真的需要帮助来了解它是如何工作的。谢谢你。

在此处输入图像描述

这是代码

4

0 回答 0