-1

我有一个包含信用卡商家数据字段的数据集。我想使用正则表达式来预处理值(“清洁值”,然后使用模糊匹配来标准化字段(“期望的输出”)

[merchant]         [clean value]    [desired output]
UPS1Z3734A345      UPS              UPS
UPS 1Z68A3125      UPS              UPS
HOME DEPOT #3421   HOME DEPOT       HOME DEPOT
STAPLES - #123     STAPLES          STAPLES
STPLS #4560        STPLS            STAPLES

我需要处理许多不同的情况(例如“-”、数值、“#”字符等)

我在正则表达式方面相当新,但这是我迄今为止想出的

(.+)[?=#]

但是,这仅适用于字符串中有“#”的情况。此外,如果字符串中没有非字母字符,则该字段返回空白

我很想就如何正确制作这个表达式获得一些帮助。

4

1 回答 1

0

尝试这个:

((?:[^\d#-]){2,}).*$

它将创建一个包含您的干净值的组。(任何字符,直到它找到一个数字,# 或 -)

https://regex101.com/r/tFUcct/1

于 2019-03-12T09:03:42.177 回答