我是 SPSS 建模器的新手。我正在尝试在虚拟创建的数据上使用 python 创建一个简单的数据转换。
虚拟数据按执行创建。(见底部)我尝试使用我在 IBM 网站上找到的示例使用 python 访问和修改数据
import spss.pyspark.runtime
from pyspark.sql.types import *
cxt = spss.pyspark.runtime.getContext()
if cxt.isComputeDataModelOnly():
_schema = cxt.getSparkInputSchema()
cxt.setSparkOutputSchema(_schema)
else:
_structType = cxt.getSparkInputSchema()
df = cxt.getSparkInputData()
_newDF = df.sample(False, 0.01, 1)
cxt.setSparkOutputData(_newDF)
当我尝试按预览查看结果时,出现 2 个错误: - 无法获取数据模型:空 - 未收到记录
(https://www.ibm.com/support/knowledgecenter/da/SS3RA7_18.0.0/modeler_r_nodes_ddita/clementine/r_pyspark_api_examples.html)