hive select查询抛出异常over spark创建外部表使用orc格式

8zzbczxx  于 2021-06-27  发布在  Hive
关注(0)|答案(0)|浏览(314)

我用sparkshell创建了示例表。按分区使用orc格式将datframe写入外部表。它的工作文件具有在spark shell中读/写两者。但当我试图在配置单元shell上执行相同的select查询时,它抛出异常。
下面是我实现的代码
scala>val df=sc.parallelize(seq((1,“sudhir”,30),(2,“sourabh”,27),(3,“suman”,35),(4,“basu”,30))).todf(“id”,“name”,“age”)
scala>df.write.partitionby(“age”).format(“orc”).mode(savemode.append).saveastable(“1”)
scala>val df3=sqlcontext.sql(“selectfrom 1”)
scala>df3.dropduplicates(seq(“id”)).show()
耗时:0.486秒,取数:35行Hive(sba\U db\U 2018)>从1选择
;确定1.col失败,出现异常java.io.ioexception:java.io.ioexception: hdfs://nag1-vm-sprintba-11.synapse.com:8020/apps/hive/warehouse/sba\u db\u 2018.db/1/age=27/part-r-00001-31ebd621-02bb-4db5-9170-5405010e68fd.orc非序列文件所用时间:0.147秒

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题