我有一个包含信用卡商家数据字段的数据集。我想使用正则表达式来预处理值(“清洁值”,然后使用模糊匹配来标准化字段(“期望的输出”)
[merchant] [clean value] [desired output]
UPS1Z3734A345 UPS UPS
UPS 1Z68A3125 UPS UPS
HOME DEPOT #3421 HOME DEPOT HOME DEPOT
STAPLES - #123 STAPLES STAPLES
STPLS #4560 STPLS STAPLES
我需要处理许多不同的情况(例如“-”、数值、“#”字符等)
我在正则表达式方面相当新,但这是我迄今为止想出的
(.+)[?=#]
但是,这仅适用于字符串中有“#”的情况。此外,如果字符串中没有非字母字符,则该字段返回空白
我很想就如何正确制作这个表达式获得一些帮助。