我正在 python 下开发 AI 模型并将它们载入 Acumos。在将经过训练的模型加入 Acumos Marketplace 之前,我正在使用本地的训练和测试数据集训练模型。
考虑到此处有关 ML Workbench和ML Workbench 中的数据源的文档,可以将模型和数据集关联起来,并直接在 platorfm 的管道中训练该模型。
但根据本教程,数据集仅在本地。我没有找到有关如何为 ML Workbench 管道制作模型的教程。
我的问题是:我应该或可以如何开发我的模型以适应 ML Workbench 管道并在平台中使用数据源而不是本地数据集进行训练?你有一些教程或例子吗?
更新
现在我有一个open_data函数,可以在我训练和导出模型时从我的机器上打开一个 csv 文件。
my_path = "/home/ninjadev/model-v1/source/data/"
def open_data(filename):
df = pd.read_csv(my_path + filename, sep=';')
df.head()
return df
然后我训练我的分类器:
clf = RandomForestClassifier(random_state=0).fit(X_train, y_train)
Y_pred = clf.predict(X_test)
accuracy = str(accuracy_score(y_test, Y_pred))
print(clf.classes_)
print("Training accuracy : "+accuracy)
然后使用AcumosSession,将模型导出到本地,然后将其上传到我的 Acumos 平台。
所以我的问题不在特定的代码行上,而是在一般情况下:如何删除这个开放函数才能使用 Acumos 平台的数据源?
谢谢你的帮助,
本杰明 B