使用复合键将大型频繁更新的mysql表移动到hdfs

drkbr07n  于 2021-06-03  发布在  Sqoop
关注(0)|答案(1)|浏览(249)

我有一个mysql inventory表,它没有自动递增id,但是有复合键和最后修改日期(yyyy-mm-dd hh:mm:ss),并且会非常频繁地更新。它有大约1000万条记录的最近3年的数据。
我想使用sqoop或其他方法将这些数据移动到hdfs。请建议一些方法。

jdg4fx2g

jdg4fx2g1#

检查以下基于 --lastmodified :我想在这里假设您可能有一个类似日期的列用于 --check-column 争论。

sqoop import \
--connect jdbc:mysql://<server>:3306/db \
--username=your_username \
-P \
--table=your_table \
--append \
--incremental lastmodified \
--check-column creation_date \
--last-value "YYYY-mm-DD HH:MM:SS.x" \
--split-by some_numeric_id_column \
--target-dir /user/dir \
--num-mappers <MAPPER#>

相关问题