问题标签 [datefinder]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - Datefinder Module Stranger 对特定字符串的行为
我有两个字符串:
我在字符串上运行以下代码
s2给了我想要的结果,但s1没有,因为它包含过时的词。
PS我使用过datefinder,因为我有多种日期格式,因此需要编写多个正则表达式。这仅适用于此异常
知道为什么会出现这种奇怪的行为吗?
python - 如何从 Python 中的文本中正确提取各种日期格式
我必须从 PDF 中提取所有可用的日期,然后检查合同日期的日期。
首先,我想提取从 PDF 中提取的文本中的所有日期。现在日期可以是各种格式。我尝试在下面的示例中添加所有口味的日期。
我尝试使用Datefinder Python 模块来提取所有日期。虽然它很接近,但最初抛出的垃圾日期很少,也与第一个 Date 不正确匹配。
回复 :
2019-08-05 00:00:00
2019-06-11 00:00:00
2017-06-05 00:00:00
2017-08-23 00:00:00
2017-08-21 00:00:00
2017-08-20 00:00:00
2017-08-30 00:00:00
2017-08-31 00:00:00
2017-08-26 00:00:00
2017-08-27 00:00:00
2017-08-28 00:00:00
2017-08-29 00:00:00
2017-08-30 00:00:00
2017-01-15 00:00:00
2017-01-14 00:00:00
2017-01-13 00:00:00
2017-01-10 00:00:00
2017-01-11 00:00:00
2017-01-12 00:00:00
如您所见,我有 17 个这样的 Date 对象,但我得到了 19 个。从底部检查,最后 16 个匹配正确。然后是那些最初的垃圾。 一旦我正确地获得了这些日期,我就可以使用某种 N-Gram 模型来检查哪些日期上下文是合同信息。
解决问题的任何帮助都会很棒。
python - python datefinder 的 find_dates 方法未返回预期结果
我在 Pandas 数据框“评论文本”中有一个列,其中包含这种格式的日期(此处显示,仅第一次观察):
添加数据框示例:
但是当我做这样的事情时:
我得到以下结果:
这是不正确的,因为我只期望2018-07-09返回结果。
python-3.x - 无法将多个日期时间对象提取到数据框中的一个单元格中
我有几句话,我将每个句子放在数据框的一行中。我正在研究从这些句子中提取日期。我遇到了“datefinder”这个包。
当我将单个句子发送到“string_with_dates”时,它会正确提取所有日期并返回。
但是,当我放置一个数据框的多个句子并使用“for”循环进行循环时,它就会变得一团糟。它不会在数据框的单元格中正确显示多个日期(如果有)。description_df 是我的数据框的名称。在第 9 列中,我有句子,在第 13 列中,我希望存储提取的日期。
python-3.x - 将 datefinder 的输出放入列表
以上datefinder用于在字符串中查找日期。例如,January 4th, 2017 at 8:00pm被抓取s并转换为2017-01-04 20:00:00. 现在我只想获取输出print(m)并将其转换为mm包含与print(m). 我用
但我希望输出是
我如何更改我的代码来做到这一点?
python - 如何将 datefinder 输出转换为列表?
所以这里已经回答了这个问题: 将 datefinder 的输出放入列表 不幸的是,我的代表太低了,所以我无法评论以弄清为什么它没有按预期运行。我想获取文件名字符串并将它们转换为日期列表,以便我可以将它们用作日期列的填充。所有文件名都包含活动日期,但它们本身不在工作表上。格式为:CompanyNameEventLocationDDMMYYYY.xlsx
我没有得到转换的对象,而是得到以下错误:AttributeError:
当我尝试将其直接转换为列表时
我仍然得到输出说它仍然是一个生成器对象:
我需要更改什么,以便它实际上成为一个日期时间列表,我可以使用它来通过前向填充填充附加的“日期”列?
python-3.x - 当字符串在日期之前有 ':' 时,datefinder 不会找到日期
当日期之前有“:”时,datefinder 模块不会找到日期。
这里有一个类似的问题: Datefinder Module Stranger behavior on specific string
但是,当我添加:像这样的“评估日期:”时,它失败了
python - 使用 datefinder 提取日期时间字符串
TypeError:预期的字符串或类似字节的对象
python - 从图像/文本中查找日期
我有这样的日期,我需要正则表达式来查找这些类型的日期
这是我首先做的我从文本中删除了所有空格,这就是它的样子
这是我的正则表达式
它可以找到 12-23-2019 、 9/04/2019 、 22.07.2019 但找不到 29 10 2019 和 1:02:2018