问题标签 [palantir-foundry]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
palantir-foundry - 通过 write_dataframe 添加列描述是否知道它运行的分支?
上下文:我在版本中看到了,1.184.0
后来我可以在转换函数中添加列描述。[相关问题] 例如:
问题:此更新数据集描述是否仅在我运行转换的分支上?
palantir-foundry - 如何在没有 my_compute_function 的情况下访问数据框
如何使用没有 my_compute_function 的数据集。从存储库中的 file1,我想调用另一个文件中定义的函数。在第二个文件中,我想利用数据集 my_input_integration,可能没有 my_compute_function。如何组合来自两个不同存储库文件的数据集。我不想合并到一个文件中,因为我想将第二个文件用作实用程序文件。如果有人能回答这个问题,那就太好了。
存储库文件 1
存储库文件 2
pyspark - 如何创建 python 库以及如何在 palantir Foundry 中导入它
为了概括 python 函数,我想将函数添加到 python 库中,以便我可以在多个存储库中使用这些函数。请任何人回答以下问题。
1) 如何创建我们自己的 python 库 2) 如何跨多个存储库导入这些库
palantir-foundry - Workshop 与 Foundry 中的 Slate 有何不同?
我看到Foundry平台有Slate和Workshop。我可以知道我们可以使用 Workshop 和 Slate 的真实商业案例吗?这些有什么不同,在哪里最适合?任何人都可以对此有所了解吗?
testing - Foundry 转换的 Python 单元测试?
我想在我的转换为 Foundry 时设置测试,通过测试输入并检查输出是否是预期的。是否可以使用虚拟数据集(存储库中的 .csv 文件)调用转换,或者我应该在转换中创建函数以供测试调用(在代码中创建的数据)?
apache-spark - 如何更快地计算我的 Foundry“最新版本”数据集?
我有一个数据集摄取对我的数据行的最新编辑,但它只摄取最近编辑的版本。update_ts
(即它在时间戳列上是增量的)。
原表:
更新后的表格:
摄取后,我需要计算所有先前更新的“最新版本”,同时还要考虑任何新的编辑。
这意味着我每次都在进行增量摄取并运行 SNAPSHOT 输出。这对我的构建来说非常慢,因为我注意到每次我想为我的数据计算最新版本时,我都必须查看所有输出行。
交易 n=1(快照):
交易 n=2(追加):
我怎样才能使这个“最新版本”计算更快?
apache-spark - 如何让我的多连接/多联合数据集计算得更快?
我有一系列约 30 个数据集,所有这些数据集都需要连接在一起才能形成一个宽泛的决赛桌。这个最终表需要大约 5 年的单个表(每年一个表)并将它们联合在一起,然后将这个完整的历史与其他表的完整历史(类似地联合)加入一个大的、历史的、宽的表。
这些第一个每年表的布局如下:
与像这样的其他年份表:
然后将它们联合在一起以创建:
同样,合并后的第二种类型的表会导致以下结果:
我现在想加入table_type_1
ontable_type_2
并primary_key
产生year
一个更宽的表。我注意到这个最终的连接需要很长时间并且打乱了很多数据。
我怎样才能让它更快?
palantir-foundry - 有没有办法填充特定于数据集的列描述?
数据集 1 和数据集 2 具有相同的列名但不同的描述。在数据集 1 转换中,我会说我正在处理数据集 1,因此它必须优先考虑该数据集 1 的特定描述。如果我正在为另一个数据集进行转换,我想优先考虑该数据集。有没有办法填充特定于数据集的列描述?
例如,参数中的参数my_compute_function
是否可以传递数据集名称,该数据集名称必须具有优先级 Column1,数据集 1 的列描述,{Dataset 1 name}。Column1,数据集 2 的列描述,{Dataset 2 name},...
palantir-foundry - Is it possible to export a dataset as an ANSI text file from Foundry?
If I apply specific text formatting of header, body, and trailer to input data within Foundry via SQL, is there a way to export the output dataset as an ANSI text file?
palantir-foundry - 如何在 Foundry's Slate 中使用“文件导入”小部件导入 excel/csv?
背景: 对于数据管道,我们需要将 excel 电子表格直接引入代工厂(通过电子邮件到达)。为了避免任何手动处理错误,我们想构建一个小型 slate 应用程序,它基本上只是上传一个 Excel 工作表并自动将其附加到现有数据集(给定模式、标题等)。不幸的是,关于“文件导入”小部件或在将文件拖放到文件夹时调用的 API 的文档很少。
想法:有没有办法用 slate 上传文件?然后可以将此文件添加到数据集,类似于将其放入文件夹时打开的提示吗?