我有一个包含大引号的字符串。我想用 HTML 实体替换它们,以确保它们不会混淆其他下游系统。对于我的第一次尝试,我只是为要替换的字符添加了匹配,直接在我的代码中输入它们:
public static String escapeXml(String s) {
StringBuilder sb = new StringBuilder();
char characters[] = s.toCharArray();
for ( int i = 0; i < characters.length; i++ ) {
char c = characters[i];
switch (c) {
// other escape characters deleted for clarity
case '“':
sb.append("“");
break;
case '”':
sb.append("”");
break;
case '‘':
sb.append("‘");
break;
case '’':
sb.append("’");
break;
default:
sb.append(c);
break;
}
}
return sb.toString();
}
这在我的 Mac 上编译并运行良好,但是当我们的 CI 服务器(在 Linux 上运行)尝试构建它时,它阻塞了:
Out.java:[347,16] duplicate case label
显然,Linux 机器上的构建链的某些部分无法识别和区分这些花哨的字符。
我的下一个尝试是使用 Unicode 转义。不幸的是,这甚至无法在我的 Mac 上编译:
...
case '\u8220':
sb.append("“");
break;
case '/u8221':
sb.append("”");
break;
...
我的编译器抛出了这个抱怨:
Out.java:[346,21] unclosed character literal
我对如何进行这种替换并让它跨平台可靠地工作感到困惑。有人有任何指示吗?提前致谢。