0

我已经在整个互联网上进行了探索以找到解决方案;但他们都忽略了一个重要问题。最好的解决方案是在 Stack Overflow 中

  $file = new SplFileObject('longFile.txt');
    $fileIterator = new LimitIterator($file, 1000, 2000);
    foreach($fileIterator as $line) {
    echo $line, PHP_EOL;
    } 

但与其他方法一样,这需要从文件的开头读取才能到达偏移线。通常可以忽略不计;但是对于大文件(比如数百万行),这会显着减慢进程。时间随着偏移量的增加而单调增加。如果您将偏移量设置为数百万,则处理时间将是几秒钟。

在数据库(如 mysql)中,我们对表进行索引以读取一行,而无需遍历整个数据库。文件键(行号)有没有做这样的事情?我想知道像 SQLite 和 Berkeley DB 这样的平面文件数据库是如何索引它们的表的。

4

3 回答 3

2

没有办法找到特定的线路,因为“线路”一词只是一个约定。行是“由 \n 分隔的字符集”。而且文件不知道这个约定。因此,要获得第 N 行,您需要逐个字符地遍历 char 以计算所需的行数。

正如您所提到的 - 您可以使用某种自定义创建的索引(如row number - offset in bytes列表)来提高性能,但要构建它,您仍然需要解析文件。

于 2011-09-14T06:13:41.847 回答
1

这里的概念问题是文件只是字符串,其中一些字符表示行尾。因此,如果不先读取文件,就不可能知道行的开始和结束位置。

如果要不断读取文件,则首先扫描文件并将行的偏移量记录到某种索引中,然后使用fseek()fread()准确读取所需的行。

正如您所提到的,数据库可以为您完成类似的工作,因此,您可以逐行读取文件并将这些行插入数据库中,并使用一些存储行号的字段,而不是创建您自己的数据库,然后获取您想要查询的行。

于 2011-09-14T06:29:00.623 回答
-1
<?php

    $strings = file_get_contents($file);

    $length= strlen($strings);

    for($i=0;$i<$length;$i++) {
        print $strings{$i};
    }

?>

上面的代码将以字符串形式获取文件内容,然后将逐个迭代每个字符,现在由您决定如何使用它们。

于 2011-09-14T06:17:01.917 回答