问题标签 [fileparsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
163 浏览

c - C:文件解析不丢失空格

我正在解析 C 程序匹配特定关键字的文件,这是我的示例代码...

一些文件.txt

输出:

问题:当 x 包含像“Hi Hello”这样的值时,它只解析“Hi”,我想解析 x 的整个值而不丢失空间。

请建议我解决方案。

谢谢。

0 投票
4 回答
2131 浏览

python - 在 Python 中解析文件的最有效方法

我想知道解析文本文件最有效的方法是什么。例如,假设我有以下文本文件:

服务器连接数为:1

服务器状态为:ACTIVE

与服务器的连接数为:4

服务器状态为:ACTIVE

服务器没有响应:13:25:03

服务器连接建立:13:27:05

我想要做的是浏览文件并收集信息。例如,与服务器的连接数,或服务器宕机的次数。我想将这些值保存在可能的列表中,以便以后查看或绘制它们。

那么执行此操作的最佳方法是什么,假设我的关键字在列表中,如下所示:

请注意,我在列表中没有完整的句子,而只有一部分。我想逐行浏览文件,并检查读取的行是否对应于 referenceLines 列表中的任何条目,如果是,则获取列表条目的索引并调用相应的函数。

执行此操作的最有效(时间、内存)方法是什么,因为典型的文本文件大小约为 50MB。

谢谢你。

任何

0 投票
2 回答
2466 浏览

python - 尝试打开现有文件时出现 IOError

我编写的 python 程序有一个小问题,用于从特殊文本文件中提取一些信息。循环(下面的代码)需要extract_zcoords()在 500 个文件(1 个文件给出一个列表)上执行我的函数,以便我可以构建数据集。


错误: IOExceptionNo such file or directory是发生的错误,因此由于某种原因 python 没有访问文件。我检查了目录路径名(位置)和文件权限,它们是正确的(读+写)。当文件确实存在并且路径名正确时,为什么会报告 IOError 的任何想法?

有什么想法可能是错的吗?

0 投票
1 回答
292 浏览

python - python中的Docx内容和格式提取

我正在尝试解析 docx 文件夹并根据某个单词是否加粗来获取特定元素。如果这是文档中的文本:

福:你好

嘘: 呸呸呸

•废话

•废话

周:你好

我想逐行扫描,然后将粗体字之后的所有文本取出,直到下一个粗体字。

截至目前,我正在使用基于换行符解析的 XML 解析器。我在 Zipfile 中找不到任何东西,也找不到任何可以给我这样的元数据的行。

是否有可能做到这一点?

0 投票
2 回答
1524 浏览

parsing - 如何从没有分隔符的文件中获取数字 0-255

我有一个纯文本文件,其中只有数字(没有空格、逗号、换行符等),其中包含n 个数字,范围从 0 到 255。我想把它放进去并将这些值存储在一个数组中。

例子


假设我们在文件中有这个序列:

我想像这样接受它,in.read文件输入流在哪里,tempArray是一个最多包含 3 个变量的本地数组,每次存储内容时都会擦除它endArray,这是我希望最终值去的地方:

有谁知道我怎样才能完成这种行为?请尽量将您的答案保留在伪代码中,以便可以将其翻译成多种编程语言

0 投票
3 回答
2170 浏览

linux - Bash-将文件解析为数组

我有这个文件

我想为每个 Seqs (Seq1, Seq2) 设置这样的数组:

我写了这个,但它并没有打破while循环..

该脚本将永远迭代,它不会退出 while 循环。请帮帮这个愚蠢的人:(

0 投票
1 回答
93 浏览

python - 使用python解析特定文件

我有一个 300 兆的文件,其中包含这样的行

我将不胜感激有关如何使用 Python 解析文件、生成字典列表的建议

并将列表存储在文件中。

谢谢

0 投票
1 回答
339 浏览

perl - 如何扩展 perl 源文件头解析器以保留现有信息?

我有一个现有项目,需要在每个源文件的开头使用许可证头。问题是许可证标头不是静态的:

我有一个现有的 perl 脚本,它扫描文件列表以确定文件类型(C、Java、bash 等)并进行基本检查以查看是否存在许可证序言。

如果没有,它可以插入必须手动更新的空白许可证标题。

但我想知道我该怎么做:

  1. 检测具有非静态信息的现有许可证,以及
  2. 扩展现有的 perl processFile($fileName, $type)函数(如下)以保留现有的“项目”、“描述”和“作者”信息?

我怀疑我可能需要在许可证模板中放置标记以指示动态文本,这应该保留在重新生成的标题中..?

您能否给我一些关于如何使用 perl 正则表达式或模式匹配器来获取当前变量信息的指示,以便我可以将其重新插入标题并更新年份?

我可以看到所有的魔法都需要在“for ($i = 0; $i < 5; ++$i)”循环中发生......

0 投票
2 回答
80 浏览

php - 如何使用 PHP 解析文件

我有这个文件,我不知道如何解析这个文件。

我希望这是一个看起来像的数组

我尝试使用 preg_match 但这并不成功。有任何想法吗?

0 投票
2 回答
438 浏览

python - 如何在 Python 中从文本文件构建字典

我有一个包含如下条目的文本文件:

这是一个小样本。该文件中有几个学生。每个学生在他们的名字下都有两个作业,只有当每个作业中以“已完成”开头的行显示“已完成:是”时,他们才会通过。每个作业下的所有数据都是杂乱无章的,但在每个作业下的某处会显示“已完成:是(或否)”我需要一种方法来读取文件并说明是否有学生通过。到目前为止,我有

我只能让这段代码返回一个条目(第一个“完成”它读取为键,“是或否”作为值,这是我想要的,但我希望它返回文件中开始的每一行与“完成”。所以我提供的示例数据我想返回一个包含 2 个条目的字典 {Finished:"NO" , Finished:"NO"}