3

所以我需要解析这样的事情:

commit e397a6e988c05d6fd87ae904303ec0e17f4d79a2
Author: Name <email@email.com>
Date:   Sat Jul 9 21:29:10 2011 +0400

    commit message

 1 files changed, 21 insertions(+), 11 deletions(-)

并获取作者姓名和插入和删除的数量。

我有这个名字:

re.findall(r"Author: (.+) <",gitLog)

对于我有这个的数字:

re.findall(r" (\d+) insertions\S+, (\d+) deletions",gitLog)

但我想用一个正则表达式获取名称、插入和删除的元组列表。

我试图做类似的事情

re.findall(r"Author: (.+) <.+ (\d+) insertions\S+, (\d+) deletions",gitLog,re.DOTALL)

但它什么也没返回......

那么我的错误是什么?正则表达式应该是什么样子?

UPADTE:wRAR 是对的,但不知何故,当我读取文件并尝试解析它时,我将整个文件作为名称,然后最后插入和删除,所以它匹配整个文件但不匹配单个提交... [。 +] 获取整个文件,但不是提交的一部分...

4

4 回答 4

4

如果您可以访问 repo 而不是 的一些文本转储git log,请省去解析麻烦并生成不同的日志输出:

git log --pretty="%an" --numstat

将产生以下形式的输出:

作者姓名

lines_insertedlines_deleted modified_file

你甚至不需要正则表达式。如果要保留正则表达式,则需要匹配(+)后插入,否则它将根本不匹配并且不会捕获数字。

于 2011-07-13T17:38:20.853 回答
3

您应该使用(直接或通过借用代码)现有的包,例如GitPython,但是关于您的正则表达式问题,为提供的文本提供的正则表达式返回[('Name', '21', '11')],所以我认为它是正确的。

于 2011-07-13T17:38:46.453 回答
1

有一个模块用于使用 Python 解析 Git 日志。看起来很生活:

https://github.com/gaborantal/git-log-parser

于 2020-07-20T15:54:37.517 回答
0

所以我的问题的答案是:

re.findall(r"Author: (\S+) <.+\n.+\n\n.+\n\n.+ (\d+) insertions\S+, (\d+) deletions",gitLog)

不过还是谢谢你的回答。

于 2011-07-14T08:39:00.853 回答