让我们考虑一个大文件(~100MB)。让我们考虑该文件是基于行的(一个文本文件,行相对较短~80 个字符)。如果我使用内置open()/file()文件将以惰性方式加载。IE 如果我aFile.readline()只做一个文件的一部分将驻留在内存中。urllib.urlopen() 是否做类似的事情(使用磁盘上的缓存)?
urllib.urlopen().readline()和之间的性能差异有多大file().readline()?让我们考虑该文件位于本地主机上。一旦我打开它,urllib.urlopen()然后用file(). 当我用 循环文件时,性能/内存消耗的差异有多大readline()?
处理通过打开的文件的最佳方法是什么urllib.urlopen()?逐行处理是否更快?或者我应该将一堆行(〜50)加载到一个列表中然后处理该列表?