将一个没有数字id的非常大的表从mysql加载到s3

vql8enpb  于 2021-06-03  发布在  Sqoop
关注(0)|答案(1)|浏览(239)

我正在尝试(使用sqoop)将mysql中的一个大表(500gb大小,约200m行)注入s3。但是,此表没有数字键列。
它有一个包含3列的组合主键。我注意到sqoop不能均匀地分块数据集,因为id在最小值和最大值之间分布不均匀。sqoop中的rage查询不能很好地工作,因为该列没有索引。
使用sqoop或其他技术有更好的方法来实现这一点吗?
p、 我想把数据输出为avro文件

csga3l58

csga3l581#

如果表具有多列键,则需要使用--split by argument手动指定范围,并使用其他列。sqoop不支持多列。

相关问题