0

我遇到过几次这个问题,现在我终于决定问一下,希望有人知道我在说什么。

我想做的是这种形式的字符转换:

ÆØÅ => AOA
ÉÈÊ => EEE
üÿï => uyi

到目前为止,我最接近的搜索条件可以输入谷歌,如下所示:

这没有按预期工作。和之间似乎没有相关性,ÉÈÊ也没有EEE任何不同ÆØÅ。因此,与 E 相比,所有六个字符都将转换为 E,这不是我想要的准确性。

  • 从原始编码(例如 ASCII)转换为仅包含字母数字的字符集/编码

我对这种方法不是很有信心,因为编码必须能够识别,比如说E,作为 的祖先/最近(字母数字)邻居È

我觉得我说了很多在球场上的话。

有谁了解我想要实现的目标,或者知道我正在寻找的这种“方法”叫什么?

非常感谢任何想法/想法(我的意思是任何想法),

  • 米克
4

1 回答 1

0

我怀疑您必须考虑一个 Unicode 代码点数据库,将它们映射到最接近的 US-ASCII 等效项(如果可能)。我想这将是一个相对稀疏的地图,因为大多数 Unicode 代码点没有 US-ASCII 等价物。

希望这个答案有一些关键词可以帮助你寻找你想要的东西。

于 2011-06-29T08:09:36.567 回答