问题标签 [extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
38647 浏览

java - 如何从 MP3 中获取音频数据?

我正在开发一个必须处理音频文件的应用程序。使用 mp3 文件时,我不确定如何处理数据(我感兴趣的数据是音频字节,即代表我们听到的内容)。

如果我使用的是 wav 文件,我知道我有一个 44 字节的标头,然后是数据。说到mp3,我读到它们是由帧组成的,每一帧都包含一个标题和音频数据。是否可以从 mp3 文件中获取所有音频数据?

我正在使用 java(我添加了 MP3SPI、Jlayer 和 Tritonus)并且我能够从文件中获取字节,但我不确定这些字节代表什么或如何处理。

0 投票
3 回答
12485 浏览

java - 我应该如何在java中提取压缩文件夹?

我正在使用以下代码在 Java 中提取 zip 文件。

显然,由于 break 语句,这不会提取文件夹树。我尝试使用递归来处理文件夹树但失败了。有人可以告诉我如何改进此代码以处理文件夹树而不是压缩的单级文件夹。

0 投票
4 回答
831 浏览

c++ - C++ - 如何在字符串中提取有效字符串?

问题:我正在尝试从使用 C++ 的游戏名称中提取适用于古代防御 (DotA) 的有效游戏模式。

细节:

  • 游戏名称最多可包含 31 个字符
  • 共有三种游戏模式类别:主要、次要和杂项
    • 只能选择 1 个主要游戏模式
    • 某些主要游戏模式与某些次要游戏模式不兼容
    • 某些次要游戏模式与其他次要游戏模式不兼容
    • 杂项游戏模式可以与所有其他游戏模式相结合

以下是各种游戏模式的列表,图表显示了每种模式兼容的辅助模式(X 表示不兼容):

示例:以下是一些示例输入,以及所需的输出:

“DotA v6.60 -RDSOSP USA/CA LC!” ->“rdsosp”

“DOTA AREMDM USA LC”->“aremdm”

“DotA v6.60 -ApEmDuSpId USA BL”->“apemduspid”

注意:该解决方案不一定必须提供实际代码、伪代码,甚至只是说明您将如何处理它是可以接受和首选的。此外,该解决方案需要足够灵活,以便我可以相当轻松地添加另一种游戏模式。还可以安全地假设在游戏名称中,游戏模式将始终以主要游戏模式开始。


结果:

输出:

名称:DotA v6.60 -RDEM USA/CA LC

模式:rdem


如果有人想查看此代码并让我知道他们将更改哪些内容,我们将不胜感激。

谢谢。

0 投票
4 回答
7875 浏览

jquery - 使用 JQuery 提取元素中的文本

我想用 JQuery 提取元素内的文本

我只想要没有强标签的文本“我想要这个文本”。我怎样才能做到这一点?

0 投票
6 回答
40440 浏览

sql-server-2008 - 如何从PDF中提取数据?

我的公司通过 Excel 从外部公司接收数据。我们将其导出到 SQL Server 以运行数据报告。他们现在正在更改为 PDF 格式,有没有办法可靠地将 PDF 中的数据移植到我们的 SQL Server 2008 数据库中?

这需要编写一个应用程序还是有一种自动化的方式来做到这一点?

0 投票
11 回答
11002 浏览

perl - 如何使用 Perl 在我的字符串中提取 = 之后的值?

我有一个这样的字符串

我想将其输出为

关于如何解决这个问题的任何想法?我可以编写一个小的 C 或 Java 程序来执行此操作,我试图找出一种在 Perl 中执行此操作的简单方法。

0 投票
3 回答
1473 浏览

date - 时间提取(即从自由格式文本中提取日期/时间实体)- 如何?

有没有人找到一种简单但有效的方法来从文本中提取日期引用?我已经对时间提取工具进行了大量搜索,但没有很多。有一些白皮书,但它似乎属于整个语义网事物的一个子集,但没有得到太多关注。

我只是在寻找80%有效的东西。无需捕获诸如“2009 年 1 月之后的月份”之类的内容,但基本的常见日期实体会很好。

我愿意接受所有建议,甚至是花哨的正则表达式。

开火!

(感谢 - 亨利)

0 投票
1 回答
2374 浏览

xml - 如何从包含 XML 字符串的 LONG 列中提取数据

这是我的桌子

注 1:我无法更改此表 注 2:我使用的是 Oracle 10g

这是 XMLDATA 的示例

我尝试了 xmltype() 但它不适用于 LONG 类型(ORA-00997 非法使用 LONG 类型)。也许我应该将 XMLDATA 值复制到新表并转换为 CLOB 然后我可以转换为 xmltype 并使用EXTRACTVALUE()

提取“获得价值”的最佳方法是什么?

0 投票
2 回答
897 浏览

javascript - JavaScript 提取器:从库中提取网页中真正使用的函数/对象

这是以下问题的双重问题:

JavaScript 剥离器:删除网页中未使用的函数/对象

为了最大限度地解决我的问题,我以相反的方式提出问题:

我的所有网页都使用 JavaScript 库,为了提高网页的性能,我只包含每个页面的库中所需的函数/对象。我正在寻找一种可以自动进行智能提取的工具。

谢谢你的帮助,

0 投票
1 回答
209 浏览

audio - 有哪些代码库可以翻录适合商业使用的音频 CD?

有哪些代码库可以翻录音频 CD(例如 DAE、数字音频提取)?必须适合商业用途(例如,没有 GPL) 最好是免费的。Linux 或 FreeBSD 或 Windows。对在类 unix 操作系统上运行的库最感兴趣,尤其是 FreeBSD。