azure Pandas to Pyspark警告消息:“iteritems已弃用,将在将来的版本中删除”

xpszyzbs  于 2023-04-22  发布在  Spark
关注(0)|答案(1)|浏览(606)

我在MS Azure上使用数据块,每次我将pandas Dataframe 转换为Pyspark Dataframe 时都会收到此警告:

/databricks/spark/python/pyspark/sql/pandas/conversion.py:539: FutureWarning: iteritems is deprecated and will be removed in a future version. Use .items instead.
  arrow_data = [[(c, t) for (_, c), t in zip(pdf_slice.iteritems(), arrow_types)]

我使用的代码是:

df_spk = spark.createDataFrame(df_pd)

由于我找不到替代上面这行代码的方法,所以我不能使用较新版本的Python。有人有什么想法吗?
提前谢谢你T

oogrdqng

oogrdqng1#

我认为您看到的警告消息与Python中的FutureWarning有关,
表示iteritems()方法已被弃用,并将在未来版本中删除。
此警告消息来自pandas到PySpark DataFrame的转换过程。
要忽略或不显示此类FutureWarning消息,
您可以在脚本的开头使用以下代码片段

import warnings
warnings.filterwarnings("ignore", category=FutureWarning)

上面的代码片段将忽略代码中的所有FutureWarning消息。
如果只想忽略与iteritems()方法相关的FutureWarning消息,
您可以使用下面的代码段

import warnings
warnings.filterwarnings("ignore", message="iteritems is deprecated")

另外,请考虑尝试升级到使用.items()方法而不是iteritems()的PySpark或pandas的新版本。

相关问题