在训练我的模型时,我开始的数据由 json 数据行和我想从该 json 数据预测的预期值组成。json 数据遵循我部署的服务将接收输入的模式。在训练之前,我运行了一些 python 函数来转换数据并提取从原始 json 数据计算的特征。这是我的模型训练的转换数据。
我已经提取了将 json 数据转换为我的模型期望的输入到单独的 python 文件中的代码。现在我想让我的评分脚本使用该 python 脚本来准备发送到服务的输入,然后再将其输入到我的训练模型中。
使用 cli 命令部署我的服务时,有没有办法将数据转换脚本与评分脚本一起包含在内:
az ml service create realtime
-f <scoring-script>.py
--model-file model.pkl
-s service_schema.json
-n <some-name>
-r python
--collect-model-data true
-c aml_config\conda_dependencies.yml
(为清楚起见,添加了上述命令中的新行)
我想出的两种方法是:
- 创建我自己的包含转换脚本的基础 docker 镜像,并将该镜像用作我的服务的基础。如果我需要为以后的模型进行类似(但不同)的数据转换,这似乎有点麻烦。
- 将转换脚本与我的评分脚本连接到一个文件中。似乎有点hacky。
是否有另一种方法可以实现我在训练和评分中使用单独的数据转换脚本的目标?