当做一个git差异,它说“没有换行在文件末尾”。
这条信息的意义是什么,它想告诉我们什么?
当做一个git差异,它说“没有换行在文件末尾”。
这条信息的意义是什么,它想告诉我们什么?
它表示在文件末尾没有换行符(通常是\n,也就是LF或CRLF)。
也就是说,简单地说,文件中的最后一个字节(如果在Windows系统中,则为字节)不是换行符。
之所以显示此消息,是因为没有办法区分末尾有换行符和没有换行符的文件。Diff无论如何都必须输出换行符,否则结果将难以读取或自动处理。
注意,在文本文件中,如果文件格式允许,总是将换行符作为最后一个字符是一种很好的风格。此外,例如,对于C和c++头文件,它是语言标准所要求的。
核心问题是你如何定义“线”以及是否“结束在线” 字符序列是否是行的一部分。基于unix的编辑 (如VIM)或工具(如Git)使用EOL字符序列作为 行结束符,因此它是直线的一部分。它类似于 在C和Pascal中使用分号(;)。在C中,分号终止 在Pascal中,它把它们分开了。
如果您在现有文件的末尾添加了新的文本行,而该文本行末尾还没有换行符,则diff将显示最后一行已被修改的旧文本行,尽管在概念上它并没有被修改。
这至少是在末尾添加换行符的一个好理由。
例子
文件包含:
A() {
// do something
}
Hexdump:
00000000: 4128 2920 7b0a 2020 2020 2f2f 2064 6f20 A() {. // do
00000010: 736f 6d65 7468 696e 670a 7d something.}
现在将其编辑为
A() {
// do something
}
// Useful comment
Hexdump:
00000000: 4128 2920 7b0a 2020 2020 2f2f 2064 6f20 A() {. // do
00000010: 736f 6d65 7468 696e 670a 7d0a 2f2f 2055 something.}.// U
00000020: 7365 6675 6c20 636f 6d6d 656e 742e 0a seful comment..
git差异将显示:
-}
\ No newline at end of file
+}
+// Useful comment.
换句话说,它显示了比概念上发生的更大的差异。它显示您删除了行}并添加了行}\n。这就是实际发生的情况,但不是概念上的情况,所以会让人困惑。
这不仅仅是糟糕的样式,还可能导致在文件上使用其他工具时出现意想不到的行为。
下面是test.txt:
first line
second line
最后一行没有换行符。让我们看看文件中有多少行:
$ wc -l test.txt
1 test.txt
也许这就是您想要的,但在大多数情况下,您可能希望文件中有2行。
此外,如果你想合并文件,它可能不会像你期望的那样表现:
$ cat test.txt test.txt
first line
second linefirst line
second line
最后,如果你要添加一个新的行,它会使你的差异稍微更嘈杂。如果您添加了第三行,它将显示对第二行以及新添加的内容的编辑。
您的原始文件可能没有换行符。
然而,一些编辑器,如linux中的gedit,会在文件末尾无声地添加换行符。在使用这种编辑器时,您无法删除此消息。
我试图克服这个问题的是用visual studio代码编辑器打开文件
这个编辑器清楚地显示了最后一行,您可以根据需要删除该行。
唯一的原因是Unix在历史上有一个约定,所有人类可读的文本文件都以换行符结束。在当时,这避免了在显示或连接文本文件时进行额外的处理,并避免了将文本文件与包含其他类型数据的文件区别对待(例如原始二进制数据,它不是人类可读的)。
由于这种惯例,那个时代的许多工具都期望结尾换行符,包括文本编辑器、差分工具和其他文本处理工具。Mac OS X是建立在BSD Unix上的,而Linux是为了与Unix兼容而开发的,所以这两个操作系统继承了相同的惯例、行为和工具。
Windows并不是为了与unix兼容而开发的,所以它没有相同的约定,大多数Windows软件都可以很好地处理没有末尾换行符的情况。
但是,由于Git首先是为Linux开发的,而许多开源软件是建立在unix兼容的系统上,如Linux、Mac OS X、FreeBSD等,大多数开源社区及其工具(包括编程语言)继续遵循这些惯例。
在1971年,有一些技术上的原因是合理的,但在这个时代,它主要是为了保持与现有工具的兼容性。
源文件通常由工具连接(C, c++:头文件,Javascript:捆绑器)。如果省略换行符,可能会引入令人讨厌的错误(一个源文件的最后一行与下一个源文件的第一行相连)。希望所有的源代码连接工具都在连接文件之间插入换行符,但情况并非总是如此。
问题的关键在于——在大多数语言中,换行符具有语义意义,而文件结束符并不是语言定义的换行符的替代品。因此,您应该用换行符结束每个语句/表达式——包括最后一个。
之所以采用这种惯例,是因为在类unix操作系统上,换行符被视为行结束符和/或消息边界(这包括进程之间的管道、行缓冲等)。
例如,考虑将只有换行符的文件视为单个空行。相反,长度为0字节的文件实际上是一个没有任何行的空文件。可以通过wc -l命令确认。
总的来说,这种行为是合理的,因为如果\n字符只是行分隔符而不是行结束符,那么就没有其他方法来区分空文本文件和只有一行空的文本文件。因此,有效的文本文件应该总是以换行符结束。唯一的例外是文本文件是空的(没有行)。
What
当做一个git差异,它说“没有换行在文件末尾”。
在某些方面,是的,但它更微妙和微妙。
当执行git diff时,git会显示文件版本之间的差异,显示为文件不同的块。这可能包括文件末尾的块。
如果文件的两个版本都没有以换行符结束,则读取数据块的末尾
\ No newline at the end of file
而如果只有一个版本不以换行符结束,则数据块将以任意一个版本结束
-last line
\ No newline at the end of file
+new last line
or
-last line
+new last line
\ No newline at the end of file
Why?
这条消息的意义是什么
原因很简单。git diff的主要目的之一是明确地显示更改,以便它可以用作git apply的输入。要做到这一点,Git需要知道在应用diff时对换行符应该做什么。它应该删除、保留还是更改换行符?
文件末尾的No换行符就是这样做的一种方式。对于希望了解此类更改的人来说,这也很有帮助,因为在某些情况下,是否有换行符对文件很重要。
它想告诉我们什么?
好吧,只是在这个文件的末尾没有换行符。或者以前没有,现在有了。或者曾经有过,但现在没有了。