3

我正在尝试找到一种解决方法,以使用字符组合在 unicode 中显示旧字符和稀有字符。目前我正在将一些字典从 EPWING 转换为文本,并且有 36 个不同的字符无法使用普通的 UTF-8 进行复制。下面是 epwing gaiji 到我正在转换的其中一个字典的 unicode 映射的问题部分,在某些领域它有一个有趣的语法,显然用于以不同方式组合字符。我希望是否有人可以识别这种语法是什么,以及我可以在哪里找到有关如何使用它的文档或教程。

s/<?w=b02a>//g
s/<?w=b04b>/者/g
s/<?w=b064>/<⾱ >/g
s/<?w=b077>/<彳&lt;匕\/匕&gt;>/g
s/<?w=b07c>/<山\/⺀>/g
s/<?w=b12e>//g
s/<?w=b155>/</&gt;/g
s/<?w=b156>/<\/>/g
s/<?w=b157>/<\/\/>/g
s/<?w=b158>/<こ[1]/と|ヿ&gt;/g
s/<?w=b16f>/<㗢&gt;/g
s/<?w=b170>/<㗥&gt;/g
s/<?w=b171>/ଏ/g
s/<?w=b175>/lb/g
s/<?w=b22a>//g
s/<?w=b234>/ff/g
s/<?w=b25e>/㯌/g
s/<?w=b271>/<扌 晉&gt;/g
s/<?w=b36b>//g
s/<?w=b373>//g
s/<?w=b42c>//g
s/<?w=b434>/<已\/大&gt;/g
s/<?w=b438>//g
s/<?w=b43a>//g
s/<?w=b43f>/<㇀/丶&gt;/g
s/<?w=b440>//g
s/<?w=b45a>/<?&gt;/g
s/<?w=b45b>/<|&gt;/g
s/<?w=b53d>/<?>/g
s/<?w=b53e>/<?>/g
s/<?w=b540>/<o>/g
s/<?w=b537>/<ト モ&gt;/g
s/<?w=b541>/<一/>/g
s/<?w=b544>/<?>/g
s/<?w=b546>/<[r45]卐&gt;/g
s/<?w=b55f>/*/g

我知道这条线应该将彳表示为左垂直部首,其中一个 ✏ 堆叠在另一个 ✏ 的顶部作为字符的右垂直部分:

s/<?w=b077>/<彳&lt;匕\/匕&gt;>/g

这个也很明显,是一个旋转了45度的卐:

s/<?w=b546>/<[r45]卐&gt;/g

注意: ?w= 后面的四个字符十六进制代码是 unicode 应该对应的 epwing gaiji 的标识符。

感谢您的时间。

4

1 回答 1

4

请参阅Unicode 标准第 12.2 节,表意文字描述字符。它讨论了您的确切情况。

不幸的是,您可能会发现对您正在尝试做的事情的软件支持实际上是不存在的。

于 2011-06-05T18:09:21.937 回答