我是hadoop新手。我在hive中有一个表,其中包含了我所需的所有数据,如this:-
Table A.
Id description
1. abc
1. Abc2
2. Cdf
2. Cdf2
2. Cdf3
3. Efg
现在需要从这个表输出到一个excel的多个表中,比如
Sheet 1 have data of id 1
Sheet 2 have data of id 2
Sheet 3 have data of id 3.
会有这样的疑问- select * from A where Id = 1
.
我知道我们可以通过unix使用 hive -S
或者 hive -f
选项,但在该输出将在一张纸。
1条答案
按热度按时间z3yyvxxp1#
我不知道hadoop是如何处理的,但我猜你的记录不到100万条,对吧。否则,excel就不是这个工作的合适工具。只需将所有内容转储到一张纸上,然后运行下面链接中显示的vba代码。
https://www.rondebruin.nl/win/s3/win006_4.htm
此示例将范围第一列中具有相同值的所有行复制到新工作表。它将对该列中的每个唯一值执行此操作。图纸将以唯一值命名。