如何在从配置单元表中选择时替换新行字符

zxlwwiss 于 2021-06-27 发布在 Hive

关注(0)|答案(2)|浏览(306)

我有一个avro格式的表在Hive。该表中的一列（字符串数据类型）包含具有新行字符的数据，因此当我选择（使用beeline或pyspark）时，会得到多行。我在select中尝试了regexp\u replace（col1，“\n”，”“）选项，但它仍然返回多行。
col1的值在文本编辑器中复制和粘贴时如下所示：

NY - Enjoy holidays or Enjoy leaves.  
Silver 2000 plan
Silver 2000 plan CSR 1
Silver 2000 plan CSR 2
Gold 600 plan
Enjoy, holidays then leaves for ER, UC and old age only.  Primary holidays not subject to Enjoy.

在这里有什么可以替代的呢？

Hive pyspark-sql

来源：https://stackoverflow.com/questions/53965094/how-to-replace-new-line-characters-while-selecting-from-hive-table

2条答案

按热度按时间

s8vozzvw1#

试试这个 regexp_replace(col1, '\\\\n', "") 例子

hive> select * from temp.test4;
OK
1   abc\nxyz
Time taken: 0.169 seconds, Fetched: 1 row(s)
hive> select id, regexp_replace(value, '\\\\n', "") from temp.test4;
OK
1   abcxyz

赞(0）回复(0）举报 2021-06-27

ojsjcaue2#

它用regexp\u replace（regexp\u replace（col1，'\r'，''），'\n'，''解析

赞(0）回复(0）举报 2021-06-27