df1 = spark.createDataFrame([ [123, 123], [111, 111], [124, 125], [111, 333], [123, 223], [111, 211] ],['col1','col2'])
我需要比较两列并使用pyspark识别两列之间不匹配的位数
tv6aics11#
检查以下代码。
adf.printSchema() root |-- col1: integer (nullable = false) |-- col2: integer (nullable = false) adf.selectExpr("col1","col2","(col1 == col2) as compared").show() +----+----+--------+ |col1|col2|compared| +----+----+--------+ | 123| 123| true| | 111| 111| true| | 124| 125| false| | 111| 333| false| | 123| 223| false| | 111| 211| false| +----+----+--------+
1条答案
按热度按时间tv6aics11#
检查以下代码。