aws专有网络间200tb hadoop数据迁移

fcwjkofz  于 2021-05-31  发布在  Hadoop
关注(0)|答案(1)|浏览(257)

我手里有一个技术挑战。需要在两个不同的aws VPC之间传输200tb的hadoop数据。有以下限制
无vpc对等
无第三方软件安装
下面是解决方案。试着跳一跳,但表演不是很好
hadoop数据到efs数据..-->efs到efs-->efs到hadoop

ruyhziif

ruyhziif1#

1) 请不要使用efs复制efs。这与s3复制相比非常慢。
2) 使用多个bucket复制数据。使用复制3)使用distcp将数据从hdfs复制到s3

相关问题