在GitHub存储库中,你可以看到“语言统计”,它显示了用某种语言编写的项目的百分比。但是,它不显示项目由多少行代码组成。通常,我想快速了解项目的规模和复杂性,而代码行数可以给人留下良好的第一印象。500行代码意味着一个相对简单的项目,10万行代码意味着一个非常大/复杂的项目。
那么,是否有可能从GitHub存储库中获得以各种语言编写的代码行,最好不克隆它?
“计算git存储库中的行数”问题询问如何计算本地git存储库中的代码行数,但是:
你必须克隆这个项目,这可能是巨大的。例如,克隆Wine这样的项目需要很长时间。
你可以计算文件中不一定是代码的行数,比如i13n文件。
如果您只计算(例如)Ruby文件,那么您可能会错过大量其他语言的代码,比如JavaScript。您必须事先知道项目使用哪些语言。您还必须为项目使用的每种语言重复计数。
总而言之,这对于“快速检查项目规模”来说可能太费时了。
npm install sloc -g
git clone --depth 1 https://github.com/vuejs/vue/
sloc ".\vue\src" --format cli-table
rm -rf ".\vue\"
说明及说明
从npm安装sloc,一个命令行工具(需要安装Node.js)。
npm install sloc -g
克隆浅库(下载速度比完整克隆快)。
git clone --depth 1 https://github.com/facebook/react/
运行sloc并指定要分析的路径。
sloc ".\react\src" --format cli-table
Sloc支持将输出格式化为cli-table、json或csv。正则表达式可以用来排除文件和文件夹(更多关于npm的信息)。
删除存储库文件夹(可选)
Powershell: rm -r -force "。\react\"或Mac/Unix: rm -rf ".\react\"
执行步骤的截图(cli-table):
Sloc输出(无参数):
使用——details选项也可以获取每个文件的详细信息:
sloc ".\react\src" --format cli-table --details
你可以使用tokei:
cargo install tokei
git clone --depth 1 https://github.com/XAMPPRocky/tokei
tokei tokei/
输出:
===============================================================================
Language Files Lines Code Comments Blanks
===============================================================================
BASH 4 48 30 10 8
JSON 1 1430 1430 0 0
Shell 1 49 38 1 10
TOML 2 78 65 4 9
-------------------------------------------------------------------------------
Markdown 4 1410 0 1121 289
|- JSON 1 41 41 0 0
|- Rust 1 47 38 5 4
|- Shell 1 19 16 0 3
(Total) 1517 95 1126 296
-------------------------------------------------------------------------------
Rust 19 3750 3123 119 508
|- Markdown 12 358 5 302 51
(Total) 4108 3128 421 559
===============================================================================
Total 31 6765 4686 1255 824
===============================================================================
Tokei支持徽章:
数线
[![](https://tokei.rs/b1/github/XAMPPRocky/tokei)](https://github.com/XAMPPRocky/tokei)
默认情况下,徽章将显示回购的LoC(代码行),您也可以指定为它显示一个不同的类别,通过使用?category=查询字符串。它可以是代码、空格、文件、行、注释。
计算文件
[![](https://tokei.rs/b1/github/XAMPPRocky/tokei?category=files)](https://github.com/XAMPPRocky/tokei)
你可以使用GitHub API像下面的函数一样获得sloc
function getSloc(repo, tries) {
//repo is the repo's path
if (!repo) {
return Promise.reject(new Error("No repo provided"));
}
//GitHub's API may return an empty object the first time it is accessed
//We can try several times then stop
if (tries === 0) {
return Promise.reject(new Error("Too many tries"));
}
let url = "https://api.github.com/repos" + repo + "/stats/code_frequency";
return fetch(url)
.then(x => x.json())
.then(x => x.reduce((total, changes) => total + changes[1] + changes[2], 0))
.catch(err => getSloc(repo, tries - 1));
}
我个人做了一个chrome扩展,显示在github项目列表和项目详细页面SLOC的数量。您还可以设置您的个人访问令牌来访问私有存储库并绕过api速率限制。
你可以从这里下载https://chrome.google.com/webstore/detail/github-sloc/fkjjjamhihnjmihibcmdnianbcbccpnn
源代码可在这里https://github.com/martianyi/github-sloc
你可以使用git clone—depth 1 <url>克隆最新的提交,然后使用Github使用的相同软件Linguist执行自己的分析。这是我知道你能得到代码行数的唯一方法。
另一种选择是使用API列出项目使用的语言。不是以行为单位,而是以字节为单位。例如……
$ curl https://api.github.com/repos/evalEmpire/perl5i/languages
{
"Perl": 274835
}
虽然这是有保留地,但该项目包括YAML和JSON,这是网站承认的,但API不承认。
最后,您可以使用代码搜索来询问哪些文件与给定的语言匹配。这个例子询问perl5i中的哪些文件是Perl文件。https://api.github.com/search/code?q=language: perl +回购:evalEmpire / perl5i。它不会为您提供行,您必须使用每个文件返回的url分别询问文件大小。