如何在具有两个分隔符的配置单元中加载数据

z9smfwbn  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(193)

我有格式的样品记录 9220216686,2011-05-05 22:48:26,28,C,PRE_HOST10_JINGLE_PP-PREF_WELCOME_PP-PREF_PROMO_PP|M001:6|M487:8|M312:3|M183:3|M093,CD,49, 我想将数据加载到基于这两者的配置单元中 , 以及 | 分隔符。我搜索了一下,找到了 MultiDelimitSerDe . 但我面临的问题是,有些记录在m开头的字段中会有最少的列,比如 9220216686,2011-05-05 22:48:26,28,C,PRE_HOST10_JINGLE_PP-PREF_WELCOME_PP-PREF_PROMO_PP|M001:6|M487:4,CD,49, 此记录仅包含两个m起始字段。我知道我们可以用map-reduce作业来解决这个问题。但是,有没有任何方法可以有效地通过单个查询将数据加载到配置单元中?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题