Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我们有 5 个节点的 PHD3.0 hadoop 集群,使用安装在 rackspace 上的 ambari。我们必须迁移到谷歌云(GCP)。
但没有得到步骤如何进行以下操作
Q1:我如何将数据、元数据配置从旧机器迁移到新机器。(老机器版本是cantos 6.5到目标机器版本centos 6.5)
Q2 : 备份哪些组件和文件夹?命令是什么?
Q3:如何备份nameode和datanodes?
Q4 : 我们还需要备份 ambari 数据库吗?
任何帮助将不胜感激?
我个人更喜欢在 GCP 中配置 hadoop 集群,并使用 distcp 将数据移动到新集群。对于 hawq 托管表,将数据移动到 hdfs,然后执行 distcp。在 AWS 上的某些情况下,我将数据移动到 s3 并导入回 hadoop。