我有200 gb关于s3中不动产的非规范化结构化信息,这些信息被ApacheHive中的外部表引用。与我一起工作的团队希望将其吸收到apachesolr之类的工具中。在hadoop集群上用这样的嵌套子数据准备json文档的最佳方法是什么。有没有办法在Hive里做?hbase?如果我把它加进去?我正在使用amazon的emr根据需要创建/重新创建集群。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!