问题标签 [datefinder]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
100 浏览

python-3.x - Datefinder Module Stranger 对特定字符串的行为

我有两个字符串:

我在字符串上运行以下代码

s2给了我想要的结果,但s1没有,因为它包含过时的词。

PS我使用过datefinder,因为我有多种日期格式,因此需要编写多个正则表达式。这仅适用于此异常

知道为什么会出现这种奇怪的行为吗?

0 投票
1 回答
64 浏览

node.js - 在字符串中搜索日期并作为数组返回 NodeJS

我将如何在 NodeJS 中搜索字符串以查找日期?

是否有类似的 npm 插件,例如https://pypi.org/project/datefinder

日期格式类型示例

0 投票
2 回答
204 浏览

python - 如何从 Python 中的文本中正确提取各种日期格式

我必须从 PDF 中提取所有可用的日期,然后检查合同日期的日期。

首先,我想提取从 PDF 中提取的文本中的所有日期。现在日期可以是各种格式。我尝试在下面的示例中添加所有口味的日期。

我尝试使用Datefinder Python 模块来提取所有日期。虽然它很接近,但最初抛出的垃圾日期很少,也与第一个 Date 不正确匹配

回复 :

2019-08-05 00:00:00

2019-06-11 00:00:00

2017-06-05 00:00:00

2017-08-23 00:00:00

2017-08-21 00:00:00

2017-08-20 00:00:00

2017-08-30 00:00:00

2017-08-31 00:00:00

2017-08-26 00:00:00

2017-08-27 00:00:00

2017-08-28 00:00:00

2017-08-29 00:00:00

2017-08-30 00:00:00

2017-01-15 00:00:00

2017-01-14 00:00:00

2017-01-13 00:00:00

2017-01-10 00:00:00

2017-01-11 00:00:00

2017-01-12 00:00:00

如您所见,我有 17 个这样的 Date 对象,但我得到了 19 个。从底部检查,最后 16 个匹配正确。然后是那些最初的垃圾。 一旦我正确地获得了这些日期,我就可以使用某种 N-Gram 模型来检查哪些日期上下文是合同信息。

解决问题的任何帮助都会很棒。

0 投票
1 回答
586 浏览

python - python datefinder 的 find_dates 方法未返回预期结果

我在 Pandas 数据框“评论文本”中有一个列,其中包含这种格式的日期(此处显示,仅第一次观察):

添加数据框示例:

但是当我做这样的事情时:

我得到以下结果:

这是不正确的,因为我只期望2018-07-09返回结果。

0 投票
0 回答
60 浏览

python-3.x - 无法将多个日期时间对象提取到数据框中的一个单元格中

我有几句话,我将每个句子放在数据框的一行中。我正在研究从这些句子中提取日期。我遇到了“datefinder”这个包。

当我将单个句子发送到“string_with_dates”时,它会正确提取所有日期并返回。

但是,当我放置一个数据框的多个句子并使用“for”循环进行循环时,它就会变得一团糟。它不会在数据框的单元格中正确显示多个日期(如果有)。description_df 是我的数据框的名称。在第 9 列中,我有句子,在第 13 列中,我希望存储提取的日期。

0 投票
1 回答
175 浏览

python-3.x - 将 datefinder 的输出放入列表

以上datefinder用于在字符串中查找日期。例如,January 4th, 2017 at 8:00pm被抓取s并转换为2017-01-04 20:00:00. 现在我只想获取输出print(m)并将其转换为mm包含与print(m). 我用

但我希望输出是

我如何更改我的代码来做到这一点?

0 投票
2 回答
685 浏览

python - 如何将 datefinder 输出转换为列表?

所以这里已经回答了这个问题: 将 datefinder 的输出放入列表 不幸的是,我的代表太低了,所以我无法评论以弄清为什么它没有按预期运行。我想获取文件名字符串并将它们转换为日期列表,以便我可以将它们用作日期列的填充。所有文件名都包含活动日期,但它们本身不在工作表上。格式为:CompanyNameEventLocationDDMMYYYY.xlsx

我没有得到转换的对象,而是得到以下错误:AttributeError:

当我尝试将其直接转换为列表时

我仍然得到输出说它仍然是一个生成器对象:

我需要更改什么,以便它实际上成为一个日期时间列表,我可以使用它来通过前向填充填充附加的“日期”列?

0 投票
1 回答
1076 浏览

python-3.x - 当字符串在日期之前有 ':' 时,datefinder 不会找到日期

当日期之前有“:”时,datefinder 模块不会找到日期。

这里有一个类似的问题: Datefinder Module Stranger behavior on specific string

但是,当我添加:像这样的“评估日期:”时,它失败了

0 投票
1 回答
128 浏览

python - 使用 datefinder 提取日期时间字符串

TypeError:预期的字符串或类似字节的对象

0 投票
1 回答
64 浏览

python - 从图像/文本中查找日期

我有这样的日期,我需要正则表达式来查找这些类型的日期

这是我首先做的我从文本中删除了所有空格,这就是它的样子

这是我的正则表达式

它可以找到 12-23-2019 、 9/04/2019 、 22.07.2019 但找不到 29 10 2019 和 1:02:2018