0

我正在使用 pandas read_html 读取 html 文件,但遇到了不间断空格的问题。我在结果数据框的一列中有数据,该列应包含类似“ABCDEF G”的字符串(F 和 G 之间的三个空格)。相反,我得到“ABCDEF G”(F 和 G 之间的一个空格)。当我检查 html 文件时,它显示“ABCDEF G”,因此出于某种原因,这三个不间断空格仅更改为一个空格。html 中的所有单个不间断空格都可以正常工作。有没有办法解决这个问题,所以它保留了 F 和 G 之间的三个空格?

4

1 回答 1

0

它并不优雅,但现在我正在做

 with open(htmllink, 'r') as r: 
        data = r.read().replace('   ', '___')

然后回来并用三个空格替换下划线。仍在寻找更好的方法来做到这一点,但它现在应该可以工作。

于 2021-03-18T23:08:13.403 回答