HIVE SQL使用regexp_replace正则替换敏感身份证信息

有一张信息表,如下图所示,其中包含了个人的身份证信息,根据监管需求,输出时,需对敏感身份证信息做模糊处理。
在这里插入图片描述
我们知道身份证号有两种组成情况:
1.18位阿拉伯数字;
2.17位阿拉伯数字+1位拉丁字母;
可以通过正则表达式表示以上两种组合,1对应的pattern为[0-9]{18},2对应的pattern为[0-9]{17}[A-Za-z]{1}
然后使用regexp_replace函数将以上两种组合替换为***********模糊输出。

select
id
,name
,case when trim(COALESCE(regexp_extract(id_number,'([0-9]{18}|[0-9]{17}[A-Za-z]{1})',1),''))<>''
then regexp_replace(id_number,'([0-9]{18}|[0-9]{17}[A-Za-z]{1})','***********')
else id_number
end as id_number
from table_name
where id_number regexp '[0-9]{18}|[0-9]{17}[A-Za-z]{1}'

版权声明:本文为p1306252原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。