sqoop简单介绍

x33g5p2x  于2020-09-30 发布在 Sqoop  
字(1.2k)|赞(0)|评价(0)|浏览(796)

什么是sqoop

Apache Sqoop(TM)是一种旨在有效地在Apache Hadoop和诸如关系数据库等结构化数据存储之间传输大量数据的工具。
Sqoop于2012年3月孵化出来,现在是一个顶级的Apache项目。
最新的稳定版本是1.4.6。Sqoop2的最新版本是1.99.7。请注意,1.99.7与1.4.6不兼容,且没有特征不完整,它并不打算用于生产部署。

sqoop的原理

将导入或导出命令翻译成mapreduce程序来实现
在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。

sqoop的安装

下载sqoop1.4.7注意请注意,1.99.7并不适合用于生产环境

重命名conf/sqoop-env-template.sh 文件为 conf/sqoop-env.sh并对重命名的文件进行修改

  export HADOOP_COMMON_HOME=/home/yetao_yang/hadoop/hadoop-2.8.5
  export HADOOP_MAPRED_HOME=/home/yetao_yang/hadoop/hadoop-2.8.5
  export HIVE_HOME=/home/yetao_yang/hive/hive-2.3.5
  export ZOOKEEPER_HOME=/home/yetao_yang/zookeeper/zookeeper-3.4.14
  export ZOOCFGDIR=/home/yetao_yang/zookeeper/zookeeper-3.4.14
  export HBASE_HOME=/home/yetao_yang/hbase/hbase-2.0.5

mysql-connector-java-5.1.27-bin.jar文件添加到./sqoop/lib/目录下

关系型数据到HDFS

全量导入

  ./bin/sqoop import \
  --connect jdbc:mysql://bigdata03:3306/winnower \
  --username root \
  --password 123456 \
  --table user \
  --target-dir /user/hive/user \
  --delete-target-dir \
  --num-mappers 1 \
  --fields-terminated-by "\b"

查询导入

  ./bin/sqoop import \
  --connect jdbc:mysql://bigdata03:3306/winnower \
  --username root \
  --password 123456 \
  --table user \
  --target-dir /user/hive/user \
  --delete-target-dir \
  --num-mappers 1 \
  --fields-terminated-by "\b"
  -- query ''

相关文章

微信公众号

最新文章

更多