Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个 3.55 GB 的 .txt 文件,它太大而无法进入 Access。它有大约 500 万条记录,而我只是其中的一小部分。我需要一种方法来解析出我需要的数据行并删除大量数据。每行文本是 651 个字符,但幸运的是我们可以按前三位排序。如果我可以删除任何不以 044、067、122 或 107 开头的行,我会将文件缩小到可以加载到 Access 中的大小。我已经将 cygwin 和 mysql 都加载到了机器上,现在我正盯着命令提示符想知道下一步该做什么。
如果你有 cygwin,那么类似
grep '^(044|067|122|107)' file.csv > newfile.csv
会成功的。可能需要启用 grep 的正则表达式选项,但我的大脑现在处于 Friday Mush 模式,不记得它们是什么。