准备文档,以便从hadoop集群接收到solr中

nszi6y05  于 2021-07-13  发布在  Hadoop
关注(0)|答案(0)|浏览(176)

我有200 gb关于s3中不动产的非规范化结构化信息,这些信息被ApacheHive中的外部表引用。与我一起工作的团队希望将其吸收到apachesolr之类的工具中。在hadoop集群上用这样的嵌套子数据准备json文档的最佳方法是什么。有没有办法在Hive里做?hbase?如果我把它加进去?我正在使用amazon的emr根据需要创建/重新创建集群。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题