-1

我有大量文件需要使用 Acrobat Pro 的自定义编辑模式编辑社会安全号码(税务记录、IRS 通信、W2 等)。SSN 有多种格式——XXX-XX-XXXX、XXX XX XXXX 和 XXXXXXXXX,适用于许多不同的人。

我写了一个简单的正则表达式来找到它们:

\b(\d{3})(?:-|\s)(\d{2})(?:-|\s)(\d{4})\b

这适用于 XXX-XX-XXXX 和 XXX XX XXXX。不幸的是,使用

\b\d{9}\b

因为 XXXXXXXXX 格式不能很好地工作,因为还有银行帐号、路由号码、EIN 等会被代码提取。

我的想法是使用捕获组来尝试搜索 SSN,因为许多以多种方式出现在文件中...... XXX-XX-XXXX 在一个实例中,而 XXXXXXXX 在另一个实例中。但是,我无法弄清楚如何做到这一点,我什至不确定这是否可能。我试过这个没有成功:

((\d{3})(?:-|\s)(\d{2})(?:-|\s)(\d{4})|\1\2\3)

有没有人有什么建议?或者这是不可能的?感谢您可能拥有的任何见解!

4

0 回答 0