我在pyspark数据框下
stat col_A col_B col_C col_D
count 14 14 14 14 14
Actual 4 4001 160987 49
Regression 3 3657 131225 38
我想找到行实际和回归的相关系数。并将ans添加为新行cv。
stat col_A col_B col_C col_D
count 14 14 14 14 14
Actual 4 4001 160987 49
Regression 3 3657 131225 38
CV
在spark文档中,我们可以应用corr(col1,col2,method=none)方法。但它在柱子上。但在我的情况下,我希望它排成一排。在Pandas身上我做过这样的事
(df1.loc[['Actual','Regression']].std(axis = 0, ddof=0,skipna = True))/(df1.loc[['Actual','Regression']].mean(axis = 0))*100
1条答案
按热度按时间lnvxswe21#
与您的预期结果一致: