restapi与sqoop之比较

cgyqldqp  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(330)

我试图从中导入数据 mysqlhdfs . 我可以用它来做 sqoop 但这也可以通过从api获取数据来实现。
我的问题是什么时候使用restapi来加载hdfs中的数据,而不是 sqoop ?
请指定一些不同的用例!

xytpbqjk

xytpbqjk1#

您可以使用sqoop将数据从mysql拉入hbase,然后在hbase上放置restapi(在hadoop上)。。。与mysql上的RESTAPI没有太大区别。
基本上,你在比较两个不同的东西。hadoop并不是要取代传统的数据库或面向用户的n层应用程序,它只是一个更分布式、更容错的存储大量数据的地方。
您通常不会使用restapi与数据库通信,然后将这些值放入hadoop中,因为这不会被分发,所有数据库结果都要经过一个进程

jckbn6z7

jckbn6z72#

sqoop(sql<=>hadoop)基本上用于将数据从rdbms加载到hdfs。
它直接连接到数据库,如果没有为从sqoop访问db的用户正确定义权限,您可以使用sqoop eval命令在表中追加/修改/删除数据
但是使用restwebservicesapi,我们可以从通过代码内部连接的各种数据库(可以是nosql或rdbms)中获取数据。
假设您正在使用curl命令调用getusersdata restful web服务,该命令专门设计用于提供用户数据,并且不允许附加/修改/更新数据库的任何组件(rdbms/nosql)

相关问题