当前场景:我们正在使用一些 java 代码处理 40M 记录并将它们作为 csv 文件上传到 s3 存储桶。
未来:我们希望将此代码移动到 AWS,为此我们希望有一个 python 脚本来处理记录并将它们作为 csv 文件加载到 aws-s3 存储桶中。你能建议最好的方法,它可以触发脚本并处理数据吗?我们希望避免在服务器中使用 EC2 和托管 python 脚本。我们希望将其作为无服务器服务。
我的方法:我想用 AWS-Glue 来做这件事,使用触发器(自动/基于时间)来启动作业,并将我的代码放在作业内的脚本中。
这是一个好方法吗?