问题标签 [palantir-foundry]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

321 问题

0 投票

1 回答

89 浏览

palantir-foundry - 通过 write_dataframe 添加列描述是否知道它运行的分支？

上下文：我在版本中看到了，1.184.0后来我可以在转换函数中添加列描述。[相关问题] 例如：

问题：此更新数据集描述是否仅在我运行转换的分支上？

palantir-foundry foundry-code-repositories foundry-python-transform

2020-10-12T10:07:13.910

0 投票

1 回答

213 浏览

palantir-foundry - 如何在没有 my_compute_function 的情况下访问数据框

如何使用没有 my_compute_function 的数据集。从存储库中的 file1，我想调用另一个文件中定义的函数。在第二个文件中，我想利用数据集 my_input_integration，可能没有 my_compute_function。如何组合来自两个不同存储库文件的数据集。我不想合并到一个文件中，因为我想将第二个文件用作实用程序文件。如果有人能回答这个问题，那就太好了。

存储库文件 1

存储库文件 2

palantir-foundry foundry-code-repositories foundry-data-connection foundry-python-transform

2020-10-12T12:59:24.317

0 投票

2 回答

659 浏览

pyspark - 如何创建 python 库以及如何在 palantir Foundry 中导入它

为了概括 python 函数，我想将函数添加到 python 库中，以便我可以在多个存储库中使用这些函数。请任何人回答以下问题。

1) 如何创建我们自己的 python 库 2) 如何跨多个存储库导入这些库

pyspark conda palantir-foundry foundry-code-repositories foundry-python-transform

2020-10-13T09:30:34.120

0 投票

1 回答

1419 浏览

palantir-foundry - Workshop 与 Foundry 中的 Slate 有何不同？

我看到Foundry平台有Slate和Workshop。我可以知道我们可以使用 Workshop 和 Slate 的真实商业案例吗？这些有什么不同，在哪里最适合？任何人都可以对此有所了解吗？

palantir-foundry foundry-slate

2020-10-14T17:36:35.653

0 投票

1 回答

547 浏览

testing - Foundry 转换的 Python 单元测试？

我想在我的转换为 Foundry 时设置测试，通过测试输入并检查输出是否是预期的。是否可以使用虚拟数据集（存储库中的 .csv 文件）调用转换，或者我应该在转换中创建函数以供测试调用（在代码中创建的数据）？

testing pyspark palantir-foundry foundry-code-repositories

2020-10-20T06:45:49.840

0 投票

1 回答

298 浏览

apache-spark - 如何更快地计算我的 Foundry“最新版本”数据集？

我有一个数据集摄取对我的数据行的最新编辑，但它只摄取最近编辑的版本。update_ts（即它在时间戳列上是增量的）。

原表：

更新后的表格：

摄取后，我需要计算所有先前更新的“最新版本”，同时还要考虑任何新的编辑。

这意味着我每次都在进行增量摄取并运行 SNAPSHOT 输出。这对我的构建来说非常慢，因为我注意到每次我想为我的数据计算最新版本时，我都必须查看所有输出行。

交易 n=1（快照）：

交易 n=2（追加）：

我怎样才能使这个“最新版本”计算更快？

apache-spark palantir-foundry foundry-code-repositories

user12474509

2020-10-20T16:01:50.507

0 投票

2 回答

209 浏览

apache-spark - 如何让我的多连接/多联合数据集计算得更快？

我有一系列约 30 个数据集，所有这些数据集都需要连接在一起才能形成一个宽泛的决赛桌。这个最终表需要大约 5 年的单个表（每年一个表）并将它们联合在一起，然后将这个完整的历史与其他表的完整历史（类似地联合）加入一个大的、历史的、宽的表。

这些第一个每年表的布局如下：

与像这样的其他年份表：

然后将它们联合在一起以创建：

同样，合并后的第二种类型的表会导致以下结果：

我现在想加入table_type_1ontable_type_2并primary_key产生year一个更宽的表。我注意到这个最终的连接需要很长时间并且打乱了很多数据。

我怎样才能让它更快？

apache-spark palantir-foundry foundry-code-repositories

user12474509

2020-10-21T15:45:55.213

0 投票

1 回答

98 浏览

palantir-foundry - 有没有办法填充特定于数据集的列描述？

数据集 1 和数据集 2 具有相同的列名但不同的描述。在数据集 1 转换中，我会说我正在处理数据集 1，因此它必须优先考虑该数据集 1 的特定描述。如果我正在为另一个数据集进行转换，我想优先考虑该数据集。有没有办法填充特定于数据集的列描述？

例如，参数中的参数my_compute_function是否可以传递数据集名称，该数据集名称必须具有优先级 Column1，数据集 1 的列描述，{Dataset 1 name}。Column1，数据集 2 的列描述，{Dataset 2 name}，...

palantir-foundry foundry-code-repositories foundry-python-transform

2020-10-22T12:48:25.833

0 投票

1 回答

115 浏览

palantir-foundry - Is it possible to export a dataset as an ANSI text file from Foundry?

If I apply specific text formatting of header, body, and trailer to input data within Foundry via SQL, is there a way to export the output dataset as an ANSI text file?

palantir-foundry

2020-10-23T19:59:00.147

0 投票

1 回答

556 浏览

palantir-foundry - 如何在 Foundry's Slate 中使用“文件导入”小部件导入 excel/csv？

背景： 对于数据管道，我们需要将 excel 电子表格直接引入代工厂（通过电子邮件到达）。为了避免任何手动处理错误，我们想构建一个小型 slate 应用程序，它基本上只是上传一个 Excel 工作表并自动将其附加到现有数据集（给定模式、标题等）。不幸的是，关于“文件导入”小部件或在将文件拖放到文件夹时调用的 API 的文档很少。

想法：有没有办法用 slate 上传文件？然后可以将此文件添加到数据集，类似于将其放入文件夹时打开的提示吗？

palantir-foundry foundry-slate

2020-10-27T13:53:09.667

1 2 3 4 5 6 7 8 9 10

问题标签 [palantir-foundry]

Reference