在GitHub存储库中,你可以看到“语言统计”,它显示了用某种语言编写的项目的百分比。但是,它不显示项目由多少行代码组成。通常,我想快速了解项目的规模和复杂性,而代码行数可以给人留下良好的第一印象。500行代码意味着一个相对简单的项目,10万行代码意味着一个非常大/复杂的项目。

那么,是否有可能从GitHub存储库中获得以各种语言编写的代码行,最好不克隆它?


“计算git存储库中的行数”问题询问如何计算本地git存储库中的代码行数,但是:

你必须克隆这个项目,这可能是巨大的。例如,克隆Wine这样的项目需要很长时间。 你可以计算文件中不一定是代码的行数,比如i13n文件。 如果您只计算(例如)Ruby文件,那么您可能会错过大量其他语言的代码,比如JavaScript。您必须事先知道项目使用哪些语言。您还必须为项目使用的每种语言重复计数。

总而言之,这对于“快速检查项目规模”来说可能太费时了。


当前回答

如果您转到图表/贡献者页面,您可以看到回购的所有贡献者的列表,以及他们添加和删除了多少行。

除非我遗漏了什么,否则从所有贡献者中添加的总行数中减去删除的总行数应该得到repo中代码的总行数。(编辑:事实证明,我还是错过了一些东西。详情请看orbitbot的评论。)

更新:

这些数据也可以在GitHub的API中找到。所以我写了一个快速脚本来获取数据并进行计算:

'use strict'; async function countGithub(repo) { const response = await fetch(`https://api.github.com/repos/${repo}/stats/contributors`) const contributors = await response.json(); const lineCounts = contributors.map(contributor => ( contributor.weeks.reduce((lineCount, week) => lineCount + week.a - week.d, 0) )); const lines = lineCounts.reduce((lineTotal, lineCount) => lineTotal + lineCount); window.alert(lines); } countGithub('jquery/jquery'); // or count anything you like

只需将其粘贴到Chrome DevTools代码片段中,更改repo并单击运行。

免责声明(感谢lovasoa):

对这种方法的结果持保留态度,因为对于一些回购(sorich87/bootstrap-tour),它的结果是负值,这可能表明从GitHub的API返回的数据有问题。

更新:

看起来这种计算总行数的方法并不完全可靠。详情请看orbitbot的评论。

其他回答

打开终端,运行如下命令:

curl -L "https://api.codetabs.com/v1/loc?github=username/reponame"

如果你使用Vscode并且你先克隆项目,这是非常简单的。只需安装代码行(LOC) Vscode扩展,然后运行LineCount:从命令面板计算工作空间文件。

扩展显示的摘要统计文件类型,它还输出结果文件的详细信息的每个文件夹。

盾牌。IO有一个徽章,可以在这里为您计算所有的行数。下面是一个计算Raycast扩展回购的例子:

如果问题是“你能否快速获得一个github回购的行数”,答案是否定的,正如其他答案所述。

然而,如果问题是“你能否快速检查项目的规模”,我通常会通过查看项目的规模来评估项目。当然,大小将包括来自所有活动提交的增量,但它是一个很好的度量,因为数量级非常接近。

E.g.

docker项目有多大?

在浏览器中输入api.github.com/repos/ORG_NAME/PROJECT_NAME 即api.github.com/repos/docker/docker

在响应散列中,你可以找到size属性:

{
    ...
    size: 161432,
    ...
}

这应该会让你对项目的相对规模有一个概念。这个数字似乎是以KB为单位的,但当我在电脑上查看它时,它实际上更小,尽管数量级是一致的。(161432KB = 161MB, du -s -h docker = 65MB)

这里的答案没有一个符合我的要求。我只想使用现有的实用程序。下面的脚本将使用基本的实用程序:

Git GNU或BSD awk GNU或BSD sed Bash

获取添加到存储库的总行数(从添加的行中减去删除的行)。

#!/bin/bash
git diff --shortstat 4b825dc642cb6eb9a060e54bf8d69288fbee4904 HEAD | \
sed 's/[^0-9,]*//g' | \
awk -F, '!($2 > 0) {$2="0"};!($3 > 0) {$3="0"}; {print $2-$3}'

获取已知源代码的指定文件类型(例如*.py文件或添加更多扩展名等)筛选的代码行。

#!/bin/bash
git diff --shortstat 4b825dc642cb6eb9a060e54bf8d69288fbee4904 HEAD -- *.{py,java,js} | \
sed 's/[^0-9,]*//g' | \
awk -F, '!($2 > 0) {$2="0"};!($3 > 0) {$3="0"}; {print $2-$3}'

4b825dc642cb6eb9a060e54bf8d69288fbee4904是Git中“空树”的id,它在每个存储库中始终可用。

来源:

我自己的脚本 如何获得Git差异的第一次提交? 有没有办法让git显示行增加,行改变和行删除?