0

我们有 5 个节点的 PHD3.0 hadoop 集群,使用安装在 rackspace 上的 ambari。我们必须迁移到谷歌云(GCP)。

但没有得到步骤如何进行以下操作

Q1:我如何将数据、元数据配置从旧机器迁移到新机器。(老机器版本是cantos 6.5到目标机器版本centos 6.5)

Q2 : 备份哪些组件和文件夹?命令是什么?

Q3:如何备份nameode和datanodes?

Q4 : 我们还需要备份 ambari 数据库吗?

任何帮助将不胜感激?

4

1 回答 1

1

我个人更喜欢在 GCP 中配置 hadoop 集群,并使用 distcp 将数据移动到新集群。对于 hawq 托管表,将数据移动到 hdfs,然后执行 distcp。在 AWS 上的某些情况下,我将数据移动到 s3 并导入回 hadoop。

于 2017-02-02T00:19:50.557 回答