2

PyXB当元素名称不是 ASCII 时,我无法生成绑定类,有人能指出我正确的方向吗?

最小的可重现示例:

<?xml version="1.0" encoding="utf8"?>
<xs:schema elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema">
  <xs:element name="Address">
    <xs:complexType>
      <xs:sequence>
        <xs:element name="Country" type="xs:string" />
        <xs:element name="Street" type="xs:string" />
        <xs:element name="Town" type="xs:string" />       
        <xs:element name="Дом" type="xs:string" />
      </xs:sequence>
    </xs:complexType>
  </xs:element>
</xs:schema>

(寻找<xs:element name="Дом" type="xs:string" />我使用西里尔文的地方。文件的编码是utf8。但是,当我尝试时:

pyxbgen -u example.xsd -m example

我得到了错误:

Traceback (most recent call last):
  File "/home/sergey/anaconda3/lib/python3.5/xml/sax/expatreader.py", line 210, in feed
    self._parser.Parse(data, isFinal)
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 9, column 26

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/home/sergey/anaconda3/bin/pyxbgen", line 52, in <module>
    generator.resolveExternalSchema()
.......

它指向元素的西里尔字母名称。我错过了什么?

4

1 回答 1

2

UTF8 用 XML 和 Python 拼写"utf-8"

lilith[33]$ head -1 /tmp/cyr.xsd 
<?xml version="1.0" encoding="utf-8"?>
lilith[34]$ pyxbgen -u /tmp/cyr.xsd -m cyr
WARNING:pyxb.binding.generate:Element use None.Дом renamed to emptyString
Python for AbsentNamespace0 requires 1 modules

不过,PyXB 生成一个名为的元素emptystring而不是一个名为的元素Дом是有问题的。PyXB 早在 Python 3 和 unicode 支持之前就已经设计好了,它付出了巨大的努力将文本转换为有效的 Python 2 标识符。

由于您使用的是 Python 3,因此应该可以绕过该转换,但这并不是微不足道的。跟踪问题 67,或者如果有西里尔字母音译,您更喜欢此处为日语演示的技术可能会起作用。

于 2016-11-04T20:31:38.090 回答