我有这个Dataframe,我想从 col("time")
以及 col("testsuiteClass")
特定行,例如在以下数据框中,我的输入是:
+--------------------+------------------------- +
| Time| testSuiteClass |
+--------------------+--------------------------+
|[2021-03-26] Tracker|StartingSuite'org.opin...'|
|[2021-03-27] Tracker|StartingSuite'org.opin...'|
+--------------------+--------------------------+
我想要得到的输出:
+--------------------+------------------------- +
| Time| testSuiteClass |
+--------------------+--------------------------+
|[2021-03-26] |'org.opin...' |
|[2021-03-27] |'org.opin...' |
+--------------------+--------------------------+
有人能帮我用JavaSparkDataFrame实现吗?
2条答案
按热度按时间ruyhziif1#
你可以用
regexp_extract
按模式从时间列中提取日期regexp_replace
摆脱"StartingSuite"
:klsxnrf12#
你可以用
regexp_extract
要提取相关符号模式: