在Hive里我正在努力实现以下目标。
输入:
Col1 Col2 Col3 Col4 Col5
A1 B1 C1 D1 E1
A1 B1 C2 D1 E1
A3 B3 C3 D3 E3
A4 B4 C4 D4 E4
输出:
Col1 Col2 Col3 Col4 Col5
A1 B1 C1,C2 D1 E1
A3 B3 C3 D3 E3
A4 B4 C4 D4 E4
行1和行2是相似的,除了输入中的col3。在输出中,应该用 ,
而不是两排。
1条答案
按热度按时间sbdsn5lh1#
collect_set
做你想做的事。下面的查询应该做: