我正在学习hadoop环境,如果这些问题很愚蠢,我很抱歉!我将数据(kaggle outbrain click prediction)存储到 HIVE ,我用了rdd。那我想用齐柏林飞艇 spark2.pyspark. 使用python函数。当我用 %jdbc(hive) 我看得出来。我的问题是;我如何制作一个Dataframe在齐柏林飞艇上播放,或者我必须创建一个Dataframe?如何开始python分析部分?如果我做任何改变会影响Hive数据吗?
HIVE
spark2.pyspark.
%jdbc(hive)
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!