我们有多个发送数据的源系统。理想情况下,我们应该捕获来自源的原始数据并将其保存在数据湖中。然后我们必须将原始数据处理成结构化格式。现在用户可以通过前端应用程序更新这些数据。
我正在考虑在处理过的数据之上放置一个 rdbms,然后将审计跟踪从 rdbms 拉到数据湖,并合并处理过的数据和审计跟踪以创建最终的报告视图。或者 rdbms 也可以用于分析。
或者我们可以将所有原本在 rdbms 中的数据引入并运行 rdbms 中的更改并将数据从 rdbms 拉到数据湖中。但这对于引入数据湖没有多大意义。
请建议。
谢谢,