我有大量文件需要使用 Acrobat Pro 的自定义编辑模式编辑社会安全号码(税务记录、IRS 通信、W2 等)。SSN 有多种格式——XXX-XX-XXXX、XXX XX XXXX 和 XXXXXXXXX,适用于许多不同的人。
我写了一个简单的正则表达式来找到它们:
\b(\d{3})(?:-|\s)(\d{2})(?:-|\s)(\d{4})\b
这适用于 XXX-XX-XXXX 和 XXX XX XXXX。不幸的是,使用
\b\d{9}\b
因为 XXXXXXXXX 格式不能很好地工作,因为还有银行帐号、路由号码、EIN 等会被代码提取。
我的想法是使用捕获组来尝试搜索 SSN,因为许多以多种方式出现在文件中...... XXX-XX-XXXX 在一个实例中,而 XXXXXXXX 在另一个实例中。但是,我无法弄清楚如何做到这一点,我什至不确定这是否可能。我试过这个没有成功:
((\d{3})(?:-|\s)(\d{2})(?:-|\s)(\d{4})|\1\2\3)
有没有人有什么建议?或者这是不可能的?感谢您可能拥有的任何见解!