通过HDFS/Haddop解压缩bz 2文件的内容

q5iwbnjs  于 5个月前  发布在  HDFS
关注(0)|答案(1)|浏览(60)

how to unzip a bz2 file in HDFS System wanted to upload this.csv file into a table that i create in hive
2003.csv.bz2我有这个文件
zcat 2003.csv.bz2| hdfs dfs -put - /user/$USER/workspace
这个我试过了,但不起作用

uqcuzwp8

uqcuzwp81#

HDFS可以本地存储BZ2文件,因此Hive可以读取该存档中的所有CSV数据。
或者,更好的做法是,你应该将CSV转换为Avro或Parquet然后上传。这将使你的Hive查询更快
否则,hdfs put接受文件,而不是文本输入流

相关问题