我正在使用Aaron Swartz 的 HTML2Text.py脚本将 HTML 转换为我的网络应用程序上的 Markdown。但是,它不支持脚注(<sup>
标签正在被删除)。我想让它在支持脚注的情况下发挥作用,但我不知道该怎么做。
我尝试了这段代码,但它似乎不起作用(我self.sup = 0
在脚本开头添加了):
if tag == "sup":
if start:
self.p(); self.o('[^] ', 0, 1); self.start = 1
self.sup += 1
else:
self.sup -= 1
self.p()
也只是:
if tag == "sup":
self.sup()
问题是<sup>
标签被完全删除,<li>
标签失去了他们的id,<a>
标签失去了他们的rel,所以我得到了非工作链接。
谁能帮我<sup>
在这个脚本中添加对标签和脚注的支持?
该脚本可在此处获得(此处发布太长)。我正在使用 Python 2.7.9。
谢谢 :)
更新:使用此代码:
if tag == "sup" and start:
if has_key(attrs, 'id'):
id = attrs.get('id', '').replace("fnref:", "")
self.o("[^" + escape_md(id) + "]")
它呈现<sup>
但不包括<a>
内部或<li>
使用实际脚注将其连接到底部。