我不是正则表达式方面的专家,但我需要解析一些我无法控制的输入,并确保我过滤掉任何没有 Az 和/或 0-9 的字符串。
当我运行这个时,
Pattern p = Pattern.compile("^[a-zA-Z0-9]*$"); //fixed typo
if(!p.matcher(gottenData).matches())
System.out.println(someData); //someData contains gottenData
某些空格 + 未知符号以某种方式通过过滤器(gottenData 是红色矩形):
如果您想知道,它也会显示文本,但并非都是这样。
现在,我不介意 [?] 只要它还包含一些字符串。
请帮忙。
[编辑] 据我从(非常大的)输入中可以看出,[?] 要么是空白要么什么都没有;也许有某种编码问题,也可能与#text节点有关(输入是xml)