pysparkDataframe子集

vawmfj5a  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(183)

下面是我的Dataframe
身份证名称类别
1纳文a
2斯里克纳特b
3拉格胡c
4拉姆亚d
5纳格拉杰
6蒂娜a
7乔治a
现在我需要根据id列将Dataframe划分为多个部分
我的输出在一个Dataframe中应该是1,2,3行,在另一个Dataframe中应该是4,5,6,7行
我试过了,但没用

df_test=eres_bkp.registerTempTable("df")
test=sqlCtx.sql("select * from eres_bkp where id between 0 and 3")
train=sqlCtx.sql("select * from eres_bkp where id between 5 and 7")

请帮忙做同样的事。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题