问题标签 [minidom]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
896 浏览

python - 如何在 XML 文件中查找特定标签,然后使用 Python 和 minidom 访问其父标签

我正在尝试编写一些代码,这些代码将在文章的 XML 文件中搜索标签中包含的特定 DOI。当它找到正确的 DOI 时,我希望它访问<title><abstract>该 DOI 关联的文章的文本。

我的 XML 文件是这种格式:

我希望脚本能够找到 DOI 为 10.1016/B978-0-12-381015-1.00004-6 的文章(例如),然后让我能够访问相应标签中的<title>和标签。<abstract><article>

到目前为止,我已经尝试从这个问题中调整代码:

但我不完全确定我在做什么!

谢谢你的帮助。

0 投票
5 回答
16716 浏览

python - 如何用 minidom 解析 unicode 字符串?

我正在尝试使用库 xml.dom.minidom 解析一堆 xml 文件,以提取一些数据并将其放入文本文件中。大多数 XML 运行良好,但其中一些在调用 minidom.parsestring() 时出现以下错误:

UnicodeEncodeError:'ascii' 编解码器无法在位置 5189 编码字符 u'\u2019':序数不在范围内(128)

它也发生在其他一些非 ASCII 字符上。我的问题是:我在这里有什么选择?在能够解析 XML 文件之前,我是否应该以某种方式剥离/替换所有这些非英文字符?

0 投票
1 回答
3106 浏览

python - 使用 Python Dom 将节点添加到具有相同节点名称但具有不同属性的 xml 文件


是否可以将两个具有相同名称的节点添加到 xml 文档中?
就是这样:
初始文件:

想要的文件:

我想用 Python、dom 或 minidom 来做到这一点。
我尝试使用 appendChild 函数,但如果只保留一个同名节点。
我尝试使用 insertBefore 函数,但它似乎也不起作用。

这是我与 insertBefore 一起使用的源代码(使用 appendChild,只需删除 nbOfFiles 控件):

谢谢你的帮助。

0 投票
1 回答
5941 浏览

python - xml.dom.minidom 通过标记名获取元素

如何使用此(以下)xml 字符串以及使用 xml.dom.minidom 时检索代码的值?

因为可能会出现多个“名称”标签,所以我想做这样的事情:

但不幸的是,这不起作用。

0 投票
4 回答
975 浏览

python - 将 Solr XML 解析为 Python 字典

我是 python 新手,正在尝试将 xml 文档(填充了 solr 实例的文档)传递到 python 字典中。我很难真正做到这一点。我曾尝试使用 ElementTree 和 minidom,但似乎无法获得正确的结果。

这是我的 XML 结构:

从这里我需要把它变成一个字典,看起来像:

我不太熟悉字典的工作原理,但还有一种方法可以将所有“文档”放入一个字典中。

干杯。

0 投票
3 回答
3676 浏览

python - 如何使用 Python 测试子节点是否存在以迭代 XML(使用 xml.dom.minidom)

我正在使用 Python 和 xml.dom.minidom 迭代导出的 Excel 电子表格,为我们的餐厅菜单输出一个 HTML 表格,其中包含对 .write 的各种调用。困难在于 Excel 输出的 XML 不是结构化的。为了弥补这一点,我设置了一些变量(day、previousDay、meal 等),当我遇到具有我正在测试的 nodeValue 的子节点时设置这些变量。我有一堆 if 语句来确定何时开始一个新表(对于一周中的每一天),或者一个新行(当一天!= previousDay)等等。

我很难弄清楚如何忽略特定节点。我需要忽略一些从 Excel 获取输出的节点,我可以根据它们具有特定值的子节点来执行此操作,但我不知道如何实现它。

基本上,我的主 for 循环中需要以下 if 语句:

0 投票
1 回答
2166 浏览

python - python : 根据内容替换 HTML 元素

我有一个 html 文档,其中一些元素包含我想要隐藏的内容(就像中国政府正在做的那样,只是我只想隐藏机密信息)。例如说我有:

我想获取包含字符串的所有元素,SECRET并将它们的全部内容替换为 ### :

我曾想过使用minidomre类似的东西:

但首先解析甚至没有成功:

并且.getElementsByTagName()需要一个tagName参数......虽然我不关心标签名称并且需要所有节点(以便按其内容过滤)。那么基本上该代码根本不起作用,而只是试图解释我想要实现的目标。

知道我怎么能轻松做到这一点吗?与 minidom 或完全不同的东西?

0 投票
3 回答
5849 浏览

python - 如何使用 Python 2.6 和 minidom 添加 xml-stylesheet 处理指令节点?

我正在使用 minidom 创建 XML 文档 - 如何确保生成的 XML 文档包含如下样式表引用:

谢谢 !

0 投票
2 回答
4392 浏览

python - 如何注释掉一个 XML 元素(使用 minidom DOM 实现)

我想注释掉 xml 文件中的特定 XML 元素。我可以删除该元素,但我更愿意将其注释掉,以防以后需要。

我现在使用的删除元素的代码如下所示:

我想修改它,以便将元素注释掉而不是删除它。

0 投票
1 回答
1375 浏览

python - Python xml.dom.minidom 生成无效的 XML?

我遇到了 xml.dom.minidom python 包的奇怪问题。我生成一个文档,用从终端获取的数据填充它。有时此类数据包含终端控制字符。当我将此类字符存储在文本数据节点中时,minidom.toprettyxml()一切似乎都很好,但是,生成的文档不是有效的 XML。

有谁知道为什么 minidom 允许生成无效文档?这与“迷你”部分有关吗?

这是提取的示例代码(也包含一些系统信息):