py4jjavaerror:调用o389.csv时出错

1yjd4xko 于 2021-05-24 发布在 Spark

关注(0)|答案(1)|浏览(420)

我是Pypark的新手。我在用数据库控制Pypark。我的数据存储在azure数据湖服务中。我正在尝试将csv文件从ADL读取到pysparkDataframe。所以我写了以下代码

import pyspark
from pyspark import SparkContext 
from pyspark import SparkFiles

df = sqlContext.read.csv(SparkFiles.get("dbfs:mycsv path in ADSL/Data.csv"), 
   header=True, inferSchema= True)

但我收到了错误信息

Py4JJavaError: An error occurred while calling o389.csv.

你能建议我纠正这个错误吗？

apache-spark pyspark databricks

来源：https://stackoverflow.com/questions/64207977/py4jjavaerror-an-error-occurred-while-calling-o389-csv

1条答案

按热度按时间

nwwlzxa71#

这个 SparkFiles 类用于访问作为spark作业的一部分提供的文件。如果您只需要访问adls上可用的csv文件，那么您只需要使用 spark.read.csv ，例如：

df = spark.read.csv("dbfs:mycsv path in ADSL/Data.csv", 
  header=True, inferSchema=True)

最好不要用 sqlContext ，出于兼容性原因保留。

赞(0）回复(0）举报 2021-05-25

我来回答

py4jjavaerror:调用o389.csv时出错

1条答案

相关问题

热门标签

最新问答