如何在从配置单元表中选择时替换新行字符

zxlwwiss  于 2021-06-27  发布在  Hive
关注(0)|答案(2)|浏览(306)

我有一个avro格式的表在Hive。该表中的一列(字符串数据类型)包含具有新行字符的数据,因此当我选择(使用beeline或pyspark)时,会得到多行。我在select中尝试了regexp\u replace(col1,“\n”,”“)选项,但它仍然返回多行。
col1的值在文本编辑器中复制和粘贴时如下所示:

NY - Enjoy holidays or Enjoy leaves.  
Silver 2000 plan
Silver 2000 plan CSR 1
Silver 2000 plan CSR 2
Gold 600 plan
Enjoy, holidays then leaves for ER, UC and old age only.  Primary holidays not subject to Enjoy.

在这里有什么可以替代的呢?

s8vozzvw

s8vozzvw1#

试试这个 regexp_replace(col1, '\\\\n', "") 例子

hive> select * from temp.test4;
OK
1   abc\nxyz
Time taken: 0.169 seconds, Fetched: 1 row(s)
hive> select id, regexp_replace(value, '\\\\n', "") from temp.test4;
OK
1   abcxyz
ojsjcaue

ojsjcaue2#

它用regexp\u replace(regexp\u replace(col1,'\r',''),'\n',''解析

相关问题