我刚刚开始使用json数据,并使用以下模式:
root
|-- parameters: array (nullable = true)
| |-- element: array (containsNull = true)
| | |-- element: struct (containsNull = true)
| | | |-- name: string (nullable = true)
| | | |-- value: string (nullable = true)
我正在尝试使用查询数据,但出现一个错误,指出没有参数的结构字段:
df.select("parameters[0].name").show()
错误:
pyspark.sql.utils.AnalysisException: u'No such struct field parameters[0]
有人能让我知道什么是最简单的方式查询这个嵌套数据没有任何转换?
2条答案
按热度按时间pxy2qtax1#
nxowjjhe2#
假设您有一个列类型为arraytype的dataframe
如果要从数组列中提取数据,可以使用-getitem(),如下所示