Git责任提交统计数据

我如何“滥用”责备(或一些更合适的函数，和/或与shell命令结合)来给我一个关于当前存储库中有多少行(代码)来自每个提交者的统计数据?

示例输出:

Committer 1: 8046 Lines
Committer 2: 4378 Lines

当前回答

Git -extras包提供的Git摘要正是您所需要的。在git-extras - git-summary处签出文档:

git summary --line

给出如下输出:

project  : TestProject
lines    : 13397
authors  :
8927 John Doe            66.6%
4447 Jane Smith          33.2%
  23 Not Committed Yet   0.2%

2016-09-19 10:52:33

其他回答

Bash函数，目标是在MacOS上运行的单个源文件。

function glac {
    # git_line_author_counts
    git blame -w "$1" |  sed -E "s/.*\((.*) +[0-9]{4}-[0-9]{2}.*/\1/g" | sort | uniq -c | sort -nr
}

2019-10-10 20:54:40

Erik的解决方案非常棒，但我在变音符上遇到了一些问题(尽管我的LC_*环境变量表面上设置正确)，并且在实际上包含日期的代码行中泄漏了噪音。我的sed-fu很差，所以我最终得到了这个带有红宝石的弗兰肯斯坦代码片段，但它在20万+ LOC上完美无缺地为我工作，并对结果进行了分类:

git ls-tree -r HEAD | gsed -re 's/^.{53}//' | \
while read filename; do file "$filename"; done | \
grep -E ': .*text' | gsed -r -e 's/: .*//' | \
while read filename; do git blame "$filename"; done | \
ruby -ne 'puts $1.strip if $_ =~ /^\w{8} \((.*?)\s*\d{4}-\d{2}-\d{2}/' | \
sort | uniq -c | sort -rg

还要注意gsed而不是sed，因为这是二进制的自制程序安装，使系统sed完好无损。

2011-10-12 21:49:40

我有这个解决方案，计数在所有文本文件(不包括二进制文件，甚至版本化的):

IFS=$'\n'
for file in $(git ls-files); do
    git blame `git symbolic-ref --short HEAD` --line-porcelain "$file" | \
        grep  "^author " | \
        grep -v "Binary file (standard input) matches" | \
        grep -v "Not Committed Yet" | \
        cut -d " " -f 2-
    done | \
        sort | \
        uniq -c | \
        sort -nr

2015-06-24 18:16:11

git ls-tree -r HEAD|sed -re 's/^.{53}//'|while read filename; do file "$filename"; done|grep -E ': .*text'|sed -r -e 's/: .*//'|while read filename; do git blame -w "$filename"; done|sed -r -e 's/.*\((.*)[0-9]{4}-[0-9]{2}-[0-9]{2} .*/\1/' -e 's/ +$//'|sort|uniq -c

逐级讲解:

列出版本控制下的所有文件

git ls-tree -r HEAD|sed -re 's/^.{53}//'

将列表修剪为仅文本文件

|while read filename; do file "$filename"; done|grep -E ': .*text'|sed -r -e 's/: .*//'

Git责备所有的文本文件，忽略空白的变化

|while read filename; do git blame -w "$filename"; done

找出作者的名字

|sed -r -e 's/.*\((.*)[0-9]{4}-[0-9]{2}-[0-9]{2} .*/\1/' -e 's/ +$//'

排序作者列表，并让uniq计算连续重复的行数

|sort|uniq -c

示例输出:

   1334 Maneater
   1924 Another guy
  37195 Brian Ruby
   1482 Anna Lambda

2011-01-04 03:53:00

我采用了Powershell最上面的答案:

(git ls-tree -rz --name-only HEAD).Split(0x00) | where {$_ -Match '.*\.py'} |%{git blame -w --line-porcelain HEAD $_} | Select-String -Pattern '^author ' | Group-Object | Select-Object -Property Count, Name | Sort-Object -Property Count -Descending

是否使用-w开关运行git blame是可选的，我添加它是因为它会忽略空白的更改。

虽然Bash解决方案在WSL2下运行，但我的机器上的性能对Powershell有利(在相同的repo下~50秒vs ~65秒)

2020-03-21 20:50:41

Git责任提交统计数据

推荐文章

最新文章

标签