我有巨大的文本文件——每个文件有 10 GB 大。
现在,我有两根弦"StringNumber1"和"StringNumber2"
“Stringnumber1”在每个文本文件中只出现一次,并且"StringNumber2"总是在之后"StringNumber1"(尽管在文本文件中可能出现超过 1 次"StringNumber2")。
我想提取每个文件中出现的所有文本,从“StringNumber1”的匹配开始,直到匹配“StringNumber1”"StringNumber2"之后立即出现的那个出现(这些出现之间的内容"StringNumber1"和"StringNumber2"可能是几个字节到许多千兆字节)...
如何使用最少的 RAM 提取此类内容?我想在 Java 中做到这一点。