我是否应该在shell脚本中的变量周围包装引号?

例如,以下是正确的:

xdg-open $URL
[ $? -eq 2 ]

or

xdg-open "$URL"
[ "$?" -eq "2" ]

如果有,为什么?


当前回答

简而言之,在不需要shell执行分词和通配符展开的地方引用所有内容。

单引号逐字保护它们之间的文本。当您需要确保shell完全不接触字符串时,它是合适的工具。通常,当不需要变量插值时,它是引用机制的选择。

$ echo 'Nothing \t in here $will change'
Nothing \t in here $will change

$ grep -F '@&$*!!' file /dev/null
file:I can't get this @&$*!! quoting right.

当需要变量插值时,双引号是合适的。通过适当的调整,当您需要字符串中的单引号时,它也是一个很好的解决方案。(没有直接的方法在单引号之间转义单引号,因为单引号内部没有转义机制——如果有的话,它们不会完全逐字引用。)

$ echo "There is no place like '$HOME'"
There is no place like '/home/me'

当您特别要求shell执行分词和/或通配符展开时,不适合使用引号。

字分割(又名令牌分割);

 $ words="foo bar baz"
 $ for word in $words; do
 >   echo "$word"
 > done
 foo
 bar
 baz

相比之下:

 $ for word in "$words"; do echo "$word"; done
 foo bar baz

(循环只在单个带引号的字符串上运行一次。)

 $ for word in '$words'; do echo "$word"; done
 $words

(循环只在单引号字符串上运行一次。)

通配符扩展:

$ pattern='file*.txt'
$ ls $pattern
file1.txt      file_other.txt

相比之下:

$ ls "$pattern"
ls: cannot access file*.txt: No such file or directory

(没有文件名*.txt的文件。)

$ ls '$pattern'
ls: cannot access $pattern: No such file or directory

(也没有名为$pattern的文件!)

In more concrete terms, anything containing a filename should usually be quoted (because filenames can contain whitespace and other shell metacharacters). Anything containing a URL should usually be quoted (because many URLs contain shell metacharacters like ? and &). Anything containing a regex should usually be quoted (ditto ditto). Anything containing significant whitespace other than single spaces between non-whitespace characters needs to be quoted (because otherwise, the shell will munge the whitespace into, effectively, single spaces, and trim any leading or trailing whitespace).

当您知道一个变量只能包含不包含shell元字符的值时,引用是可选的。因此,一个未引用的$?基本上没问题,因为这个变量只能包含一个数字。但是,“$?”也是正确的,并推荐用于一般的一致性和正确性(尽管这是我个人的建议,而不是广泛认可的策略)。

不是变量的值基本上遵循相同的规则,尽管您也可以转义任何元字符,而不是引用它们。对于一个常见的例子,包含&的URL将被shell作为后台命令解析,除非元字符被转义或引用:

$ wget http://example.com/q&uack
[1] wget http://example.com/q
-bash: uack: command not found

(当然,如果URL是一个不带引号的变量,也会发生这种情况。)对于静态字符串,单引号最有意义,尽管任何形式的引用或转义在这里都适用。

wget 'http://example.com/q&uack'  # Single quotes preferred for a static string
wget "http://example.com/q&uack"  # Double quotes work here, too (no $ or ` in the value)
wget http://example.com/q\&uack   # Backslash escape
wget http://example.com/q'&'uack  # Only the metacharacter really needs quoting

最后一个例子还暗示了另一个有用的概念,我喜欢称之为“跷跷板引用”。如果需要混合使用单引号和双引号,可以将它们相邻使用。例如,下面的引号字符串

'$HOME '
"isn't"
' where `<3'
"' is."

可以背靠背地粘贴在一起,在标记和引号删除后形成一个单一的长字符串。

$ echo '$HOME '"isn't"' where `<3'"' is."
$HOME isn't where `<3' is.

这不是很容易辨认,但这是一种常见的技巧,因此很好了解。

顺便说一句,脚本通常不应该使用ls。展开通配符,只需…使用它。

$ printf '%s\n' $pattern   # not ``ls -1 $pattern''
file1.txt
file_other.txt

$ for file in $pattern; do  # definitely, definitely not ``for file in $(ls $pattern)''
>  printf 'Found file: %s\n' "$file"
> done
Found file: file1.txt
Found file: file_other.txt

(在后面的例子中,循环完全是多余的;Printf特别适用于多个参数。统计。但是遍历通配符匹配是一个常见的问题,而且经常做得不正确。)

包含要遍历的令牌列表或要展开的通配符的变量不太常见,所以我们有时缩写为“引用所有东西,除非您确切地知道您在做什么”。

其他回答

只要编辑器的https://www.shellcheck.net/插件告诉你。

一般规则:如果它可以为空或包含空格(或任何空白)或特殊字符(通配符),则引用它。不引用带空格的字符串通常会导致shell将单个参数分解为多个参数。

$ ?不需要引号,因为它是一个数值。$URL是否需要它取决于你在那里允许什么,如果它是空的,你是否仍然需要一个参数。

我倾向于总是引用字符串只是出于习惯,因为这样更安全。

我通常使用像“$var”这样的引号表示安全,除非我确定$var不包含空格。

我使用$var作为一种简单的方法来连接行:

lines="`cat multi-lines-text-file.txt`"
echo "$lines"                             ## multiple lines
echo $lines                               ## all spaces (including newlines) are zapped

简而言之,在不需要shell执行分词和通配符展开的地方引用所有内容。

单引号逐字保护它们之间的文本。当您需要确保shell完全不接触字符串时,它是合适的工具。通常,当不需要变量插值时,它是引用机制的选择。

$ echo 'Nothing \t in here $will change'
Nothing \t in here $will change

$ grep -F '@&$*!!' file /dev/null
file:I can't get this @&$*!! quoting right.

当需要变量插值时,双引号是合适的。通过适当的调整,当您需要字符串中的单引号时,它也是一个很好的解决方案。(没有直接的方法在单引号之间转义单引号,因为单引号内部没有转义机制——如果有的话,它们不会完全逐字引用。)

$ echo "There is no place like '$HOME'"
There is no place like '/home/me'

当您特别要求shell执行分词和/或通配符展开时,不适合使用引号。

字分割(又名令牌分割);

 $ words="foo bar baz"
 $ for word in $words; do
 >   echo "$word"
 > done
 foo
 bar
 baz

相比之下:

 $ for word in "$words"; do echo "$word"; done
 foo bar baz

(循环只在单个带引号的字符串上运行一次。)

 $ for word in '$words'; do echo "$word"; done
 $words

(循环只在单引号字符串上运行一次。)

通配符扩展:

$ pattern='file*.txt'
$ ls $pattern
file1.txt      file_other.txt

相比之下:

$ ls "$pattern"
ls: cannot access file*.txt: No such file or directory

(没有文件名*.txt的文件。)

$ ls '$pattern'
ls: cannot access $pattern: No such file or directory

(也没有名为$pattern的文件!)

In more concrete terms, anything containing a filename should usually be quoted (because filenames can contain whitespace and other shell metacharacters). Anything containing a URL should usually be quoted (because many URLs contain shell metacharacters like ? and &). Anything containing a regex should usually be quoted (ditto ditto). Anything containing significant whitespace other than single spaces between non-whitespace characters needs to be quoted (because otherwise, the shell will munge the whitespace into, effectively, single spaces, and trim any leading or trailing whitespace).

当您知道一个变量只能包含不包含shell元字符的值时,引用是可选的。因此,一个未引用的$?基本上没问题,因为这个变量只能包含一个数字。但是,“$?”也是正确的,并推荐用于一般的一致性和正确性(尽管这是我个人的建议,而不是广泛认可的策略)。

不是变量的值基本上遵循相同的规则,尽管您也可以转义任何元字符,而不是引用它们。对于一个常见的例子,包含&的URL将被shell作为后台命令解析,除非元字符被转义或引用:

$ wget http://example.com/q&uack
[1] wget http://example.com/q
-bash: uack: command not found

(当然,如果URL是一个不带引号的变量,也会发生这种情况。)对于静态字符串,单引号最有意义,尽管任何形式的引用或转义在这里都适用。

wget 'http://example.com/q&uack'  # Single quotes preferred for a static string
wget "http://example.com/q&uack"  # Double quotes work here, too (no $ or ` in the value)
wget http://example.com/q\&uack   # Backslash escape
wget http://example.com/q'&'uack  # Only the metacharacter really needs quoting

最后一个例子还暗示了另一个有用的概念,我喜欢称之为“跷跷板引用”。如果需要混合使用单引号和双引号,可以将它们相邻使用。例如,下面的引号字符串

'$HOME '
"isn't"
' where `<3'
"' is."

可以背靠背地粘贴在一起,在标记和引号删除后形成一个单一的长字符串。

$ echo '$HOME '"isn't"' where `<3'"' is."
$HOME isn't where `<3' is.

这不是很容易辨认,但这是一种常见的技巧,因此很好了解。

顺便说一句,脚本通常不应该使用ls。展开通配符,只需…使用它。

$ printf '%s\n' $pattern   # not ``ls -1 $pattern''
file1.txt
file_other.txt

$ for file in $pattern; do  # definitely, definitely not ``for file in $(ls $pattern)''
>  printf 'Found file: %s\n' "$file"
> done
Found file: file1.txt
Found file: file_other.txt

(在后面的例子中,循环完全是多余的;Printf特别适用于多个参数。统计。但是遍历通配符匹配是一个常见的问题,而且经常做得不正确。)

包含要遍历的令牌列表或要展开的通配符的变量不太常见,所以我们有时缩写为“引用所有东西,除非您确切地知道您在做什么”。

这里有一个关于报价的三点公式:

双引号

在我们想要抑制分词和通配符的上下文中。在我们希望字面量被视为字符串而不是正则表达式的上下文中也是如此。

单引号

在字符串字面量中,我们希望抑制插值和反斜杠的特殊处理。换句话说,使用双引号是不合适的。

没有报价

在上下文中,我们绝对确定不存在分词或通配符问题,或者我们确实需要分词和通配符。


例子

双引号

文字字符串与空格(“StackOverflow rocks!”,“史蒂夫的苹果”) 变量扩展("$var", "${arr[@]}") 命令替换("$(ls)", " ' ls ' ") 目录路径或文件名部分包含空格("/my dir/"*)的glob 保护单引号("单引号分隔的字符串") Bash参数扩展("${filename##*/}")

单引号

命令名和参数中有空格 文字字符串需要插值来抑制('真的花费$$!', '只是一个反斜杠后面跟着一个t: \t') 保护双引号(“症结”) 正则表达式字面量,需要插值来抑制 对于包含特殊字符($'\n\t')的文本使用shell引号 在需要保护单引号和双引号的地方使用shell引号($'{"table": "users", "where": "first_name"=\'Steve\'}')

没有报价

围绕标准数值变量($$,$?, $#等等) 在算术上下文中,如((count++)), "${arr[idx]}", "${string:start:length}" 内部[[]]表达式,不存在分词和通配符问题(这是一个风格问题,意见可能会有很大差异) 我们需要分词的地方(用于$words中的word) 我们想要globbing (for txtfile in *.txt;做……) 我们希望~被解释为$HOME (~/"some dir"而不是"~/some dir")


参见:

Bash中单引号和双引号的区别 什么是特殊的美元符号壳变量? 引用和逃脱- Bash黑客的维基 什么时候需要双引号?