我继承了数千个杂乱无章的 HTML 文件,这些文件使用重复blockquote
的标签来显示诗行。
例子:
<blockquote><blockquote>roses are red</blockquote></blockquote><br>
<blockquote><blockquote><blockquote>violets are blue</blockquote></blockquote></blockquote><br>
<blockquote><blockquote>this is another line</blockquote></blockquote><br>
<blockquote><blockquote><blockquote>and this is too</blockquote></blockquote></blockquote><br>
对于自由诗行,您会看到多达 7-8 个块引用标签包裹一行文本。我想blockquote
用单个<p>
或<span>
标签替换嵌套标签集,并给它一个类,例如“indent-7”或“indent-8”。</p>
blockquote
标签之间有不可预知的空白。有些在它们之间有空格,有些用新行分隔。我在想 Python 的 BeautifulSoup 是处理这个任务的方法。
如何将嵌套blockquote
标签替换为具有“n”类的单个标签,其中 n 是嵌套标签的数量?