问题标签 [fileparsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
encryption - 星星的文件格式!通过母马危机
有一种古老的策略叫星辰!通过母马危机。
我想写一些 AI 来玩这个游戏,但尝试破译文件格式并没有什么乐趣。
有谁知道用于转弯的 X 和 H 文件的格式?或者至少对他们将如何开始尝试破译它们有一些指导?我目前正在使用 GIT 来保存历史记录,然后观察不同操作后的变化,但速度很慢。
http://www.starsfaq.com/index.htm
那里有一些链接可以下载游戏、捐款或寻找游戏钥匙。
java - 与 DOM 一起使用时 XML 标头发生变化
我有一个输入 xml 文件并尝试使用 DOM 编辑一些值和输出 xml 文件。但是输出 xml 文件中的标头正在更改。
输入文件头
但输出标题正在改变,如下所示
如何保留格式?
c# - 在文件不断变化时读取文件c#
我编写了 ac# 应用程序,它应该打开一个选定的文件,并读取其中的所有行。
目标是启动应用程序A
并将其输出重定向到文件B
,然后使用这个新应用程序读取文件的内容B
并将其打印到 ListBox。
问题是应用程序A
24/7 运行并将新输出写入文件B
,我想实时捕获这些新行,并将它们打印到 ListBox。
这甚至可能吗?我尝试使用File.ReadAllLines(filename)
,但这并没有说明文件正在使用中。
python - 获取文件路径特定部分的最简单方法
我有一个棘手的问题要解决。我需要提取文件路径的特定部分。我在临时目录下提取了一个 zip 文件,其中包含该文件的完整路径。基本上我想要的是获得完整文件路径和临时路径之间的区别。下面我举个例子:
所以我的预期结果是:
只是寻找一种简单的 Pythonic 方式来完成此任务。
php - 解析基于制表的数据文件 php
我有几个文件要解析(使用 PHP),以便将它们各自的内容插入不同的数据库表中。
第一点:客户给了我 6 个文件,5 个是 CSV,其值用逗号分隔;最后一个不是来自同一个数据库,它的内容是基于表格的。
我构建了一个 FileParser,它使用 SplFileObject 在文件内容的每一行上执行一个方法(基本上,使用每个数据集创建一个实体并将其保存到数据库中,使用 Symfony2 和 Doctrine2)。
但是我无法使用 SplFileObject 解析基于制表的文本文件,它不会像我期望的那样将内容拆分成行...
这可能与我的客户文件的可怕格式有关,但在与他们长时间讨论之后,由于某些可接受的原因(他们方面的限制),他们真的无法为我获得另一种格式,不幸的是。
该文件目前有 49459 行,所以我真的认为内存在这一步很重要;所以我必须让 SplFileObject 工作,但不知道如何。
可以在此处找到该文件的摘录: Data-extract-hosted
regex - 使用模式匹配解析大文件,但它似乎并不匹配文本中显示的每个案例
我正在尝试解析一个非常结构化的大文件,并仅提取我想要使用的信息,如行首的标签所示。我拉出的物品的尺寸不够大,似乎有些物品被跳过了,但我不知道为什么。数据格式如下:
ID:1
ASIN:0827229534
标题:讲道模式:布道采样器
组:图书
销售排名:396585
类似:5 0804215715 156101074X 0687023955 0687074231 082721619X
类别:2
|书籍[28315]|宗教[283155]|与精神[20]|宗教[10]基督教[12290]|神职人员[12360]|讲道[12368] |书籍[283155]|主题[1000]|宗教与灵性[22]|基督教[12290]|神职人员[12360]|布道[12370] 评论:总计: 2 次下载:2 平均评级:5 2000-7-28 客户:A2JW67OY8U6HHK 评级:5 票:10 有帮助:9 2003-12-14 客户:A2VE83MZF98ITY 评级:5 票:6 有帮助:5
每个项目都列出了每个类别,即使该类别中没有项目(例如相似:0)有超过 500,000 个 Id 编号但是当我模式匹配以查找 Id 时,仅报告了大约 58,000 个。我只是寻找带有“Id”的行并增加一个总和。这是下面的简单代码。
我正在使用的数据的链接(警告这是一个大文本文件!)http://snap.stanford.edu/data/bigdata/amazon/amazon-meta.txt.gz
编辑:为了使问题更清楚,我正在制作一个 hasmap,其中键作为 ASIN,值作为“相似”列表。ASIN 和 Id 出现的次数相同,我使用 Id 作为模式匹配的行,因为出现的次数由以下数字清楚地指示。运行前面的代码会在从上面的链接获取的较小文本文件中返回正确的 Id 出现次数,但在原始文件上不正确。
python - xlrd 无法读取从电子邮件附件下载的 xlsx 文件
这是一个非常非常奇怪的问题。我有一个相当大的 excel 文件(其内容我无法讨论,因为它是敏感数据),它是一个 .xlsx 并且是一个有效的 excel 文件。
当我从我的电子邮件中下载它并将其保存在我的桌面上并尝试使用 xlrd 打开工作簿时,xlrd 会抛出一个 AssertionError 并且不会告诉我出了什么问题。
当我使用我的文件浏览器打开文件,然后保存它(不做任何更改)时,它与 xlrd 完美配合。
有没有人遇到过这个问题?我尝试将各种标志传递给 open_workbook 函数但无济于事,我尝试在谷歌上搜索错误。到目前为止,我还没有找到任何东西。
我使用的方法如下
请帮忙!错误如下
java - 通过 UI 上传或从目录读取处理 Java Web 应用程序中的巨大文本文件
我的 Web 应用程序需要处理一个文本文件(大小接近 200MB)来读取一些相关数据。这个文本文件需要每月处理一次,这意味着这个文本文件的内容每个月都会变化。我想知道实现此文本文件处理的最佳实践是什么。
我应该允许用户通过应用程序本身上传这个 200mb 的文件然后处理它吗?
配置 java web 应用程序以从 tomcat 服务器中的预定义目录中读取文件。(我仍然会向用户展示一个 UI 以启动处理,例如“开始处理”)
我将使用JSaPAR库来处理我的文本文件,因为它是一个具有固定位置的平面文件。
c++ - 二进制表达式的无效操作数是什么意思?
我是 C++ 新手,想从文件中解析一行。我正在使用fstream
和提取器。我在 xcode 中不断收到以下错误:
我不知道这是什么意思。我看起来又长又苦,找不到任何有用的东西。
错误在第三行。fileIn
是一个静态fstream
对象,在同一类中的另一个方法中声明和实例化。谢谢你的时间。
python - Python:读取文件并编辑其内容
我遇到了以下问题:我想读取一个由两列组成的数据文本文件,年份和温度,并且能够计算每年的最低温度等。整个文件是这样开始的:
依此类推,直到 2013 年。我有以下想法:
有了这个,我只得到 1995 年的数据,这是我第一步想要的。在第二步中,我想计算 1995 年整个数据集的最低温度。通过使用上面的脚本,我得到了数据文件中每一行的最低温度。我尝试建立一个列表,然后附加温度,但如果我想将年份转换为整数或温度转换为浮点数等,我会遇到麻烦。
我觉得我错过了如何计算列(但不是整列)中一组值的最小值的正确想法。
有什么想法可以解决上述问题吗?我正在尝试学习 Python,但仍处于初学者阶段,所以如果有办法在不使用“高级”命令的情况下完成整个事情,我会欣喜若狂!