collect函数将sparkDataframe强制为rDataframe

pdsfdshx 于 2021-05-27 发布在 Spark

关注(0)|答案(0)|浏览(294)

我有一个有2900万行的数据集，我正在使用azuredatabricks和sparkr来处理数据和构建预测模型。
collect（df）命令的问题是它在集群上消耗了大量的内存空间和时间，因此我想是否有人可以帮助我将sparkDataframe转换为rDataframe的方法；比collect命令更有效。

apache-spark r apache-spark-ml sparkr

来源：https://stackoverflow.com/questions/63905450/collect-function-in-r-to-coerce-a-spark-data-frame-to-r-data-frame