我们有 pyspark 代码,我们希望获得相同的属性级别数据沿袭。我听说 Apache spline 可以做到,但是 apache spline 与其他工具的集成并不顺利。另外,我可能没有得到客户的许可来安装共享 cloudera 集群的 apache spline。
是否有任何开源 python 代码库可以帮助解决这种情况?
我们有 pyspark 代码,我们希望获得相同的属性级别数据沿袭。我听说 Apache spline 可以做到,但是 apache spline 与其他工具的集成并不顺利。另外,我可能没有得到客户的许可来安装共享 cloudera 集群的 apache spline。
是否有任何开源 python 代码库可以帮助解决这种情况?