去除 Hive 表中数据的引号 - Henvealf

问题说明

有时第三方提供的,导入进 Hive 表中的数据会清洗的不彻底,这里要说的就是遗留引号(“) 的问题。

比如

hive> select * from test;
1   "tom"   111
2   "cat"   222
3   "jack"  333
4   "hello" 444

处理后为

hive> select * from test;
a   b   c
1   tom 111
2   cat 222
3   jack    333
4   hello   444

解决

关键使用 regexp_replace() 这个函数。

select a, regexp_replace(b, '"', '') as b, c from test;

End!!


版权声明:本文为u013054888原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。