一些代码风格工具推荐这样做,我记得看到一些unix命令行工具警告丢失空行。
有一个额外的空行是什么原因?
一些代码风格工具推荐这样做,我记得看到一些unix命令行工具警告丢失空行。
有一个额外的空行是什么原因?
文件末尾的空行出现,以便从输入流的标准读取将知道何时终止读取,通常返回EOF表示已到达结束。大多数语言都可以处理EOF标记。因为这个原因,在过去,在DOS下,EOF标记是F6键或Ctrl-Z,对于*nix系统,它是Ctrl-D。
大多数(如果不是全部的话)实际上会一直读到EOF标记,以便运行时库从输入中读取的功能知道何时停止进一步读取。当您为追加模式打开流时,它将擦除EOF标记并写入过去,直到显式调用close,它将在该点插入EOF标记。
旧的工具期望一个空行,后面跟着EOF标记。现在,工具可以处理空行并忽略它。
此外,当您修改文件并在文件末尾追加一些代码时- diff(至少在标准配置中是git diff)将显示您更改了最后一行,而您实际上所做的唯一一件事-添加了一个换行符。因此,cvs报告变得不那么方便。
如果您按照与为什么允许在列表中使用后面的逗号相同的推理添加到文件中,还可以为更清晰的差异做一个参数。
从链接的资源中复制了以下内容(并进行了一些修改):
改变:
s = [
'manny',
'jack',
]
to:
s = [
'manny',
'jack',
'roger',
]
只涉及diff中的一行更改:
s = [
'manny',
'jack',
+ 'roger',
]
这击败了后面省略逗号时更令人困惑的多行差异:
s = [
'manny',
- 'jack'
+ 'jack',
+ 'roger'
]
这是因为文本文件的定义。当您在任何unix环境中创建一个新的文本文件时,该文件的内容是新的行字符'\n'
如果不这样做,文件就不能真正地将其标识为文本文件。现在,一旦我们将代码添加到这个文本文件中,它就不会删除这个定义文本文件本身的初始新行。
这个问题,以及现有的大多数答案,似乎都是基于一种误解。
The ASCII control character commonly referred to as "newline" (U+000A LINE FEED, \n in C) does not start a new line of a (Unix-style) text file. It ends the current line of a text file. If the last character of a text file is U+000A, there is not an empty line "in between" the U+000A and the filesystem's EOF marker (however that is implemented). Conversely, if the last character of a (nonempty) text file is not U+000A, the last line of the file has not been ended—it is said to be "incomplete".
用一些例子可能会更清楚:
该文件包含两行完整的文本。它不包含第三个空行。
$ printf 'first\nsecond\n' | xxd
00000000: 6669 7273 740a 7365 636f 6e64 0a first.second.
该文件包含第三个空行。
$ printf 'first\nsecond\n\n' | xxd
00000000: 6669 7273 740a 7365 636f 6e64 0a0a first.second..
这个文件只包含一个完整的行,加上第二个不完整的行。
$ printf 'first\nsecond' | xxd
00000000: 6669 7273 740a 7365 636f 6e64 first.second
有时,不完整的结尾行正是您想要的——例如,在PHP脚本的结尾?>和EOF之间有一个换行符,可能会导致在一个糟糕的位置向呈现的HTML中发出额外的空白(我想链接到具体的例子,但今天早上我没有运气找到一个)。因此,好的文本编辑器会在UI中清楚地区分上述三种情况。
但是,旧的文本处理工具经常会错误地处理不完整的结尾行。例如,wc的一些实现不会将不完整的结尾行计算为一行,而vi的一些实现会默默地向不以换行符结束的文件添加换行符,无论您是否希望这样做。因此,只有当你有特定的理由需要使用不完整的结尾行时,你才应该使用它们。
(注:据我所知,我刚才所说的一切也适用于dos风格的文本文件,其中使用双字节控制序列U+000D U+000A来结束一行,而不仅仅是U+000A。)