如何在Bash中回显4位Unicode字符?

我想将Unicode头骨和交叉骨头添加到我的shell提示符(特别是' skull and crossbones ' (U+2620))，但我不知道让echo吐出它的魔法咒语，或任何其他4位Unicode字符。两位数的数字很简单。例如echo -e "\x55"，。

除了下面的答案之外，还应该注意到，很明显，您的终端需要支持Unicode以使输出符合您的期望。Gnome-terminal在这方面做得很好，但它在默认情况下不一定是打开的。

在macOS的终端应用程序中，选择首选项->编码，并选择Unicode (UTF-8)。

当前回答

只要您的文本编辑器能够处理Unicode(假定以UTF-8编码)，您就可以直接输入Unicode代码点。

例如，在Vim文本编辑器中，您可以进入插入模式并按Ctrl + V + U，然后按4位十六进制数(必要时可以用零填充)。输入Ctrl + V + U 2 6 20。参见:在文档中插入Unicode字符的最简单方法是什么?

在运行Bash的终端上，您可以键入CTRL+SHIFT+U，并键入所需字符的十六进制码位。在输入过程中，你的光标应该显示一个带下划线的u。你输入的第一个非数字结束输入，并呈现字符。所以你可以在Bash中使用以下方法打印U+2620:

echo CTRL + SHIFT + U2620ENTERENTER

(第一个输入结束Unicode输入，第二个执行echo命令。)

来源:Ubuntu SE

其他回答

如果已知unicode字符的十六进制值

H="2620"
printf "%b" "\u$H"

如果已知unicode字符的十进制值

declare -i U=2*4096+6*256+2*16
printf -vH "%x" $U              # convert to hex
printf "%b" "\u$H"

只需在shell脚本中输入“☠”。在正确的地区和支持unicode的控制台上，它可以正常打印:

$ echo ☠
☠
$

一个丑陋的“变通方法”是输出UTF-8序列，但这也取决于所使用的编码:

$ echo -e '\xE2\x98\xA0'
☠
$

简单地使用Python2/3一行代码:

$ python -c 'print u"\u2620"'    # python2
$ python3 -c 'print(u"\u2620")'  # python3

结果:

☠

在UTF-8中，它实际上是6个数字(或3个字节)。

$ printf '\xE2\x98\xA0'
☠

要检查它是如何被控制台编码的，使用hexdump:

$ printf ☠ | hexdump
0000000 98e2 00a0                              
0000003

快速一行代码将UTF-8字符转换为3字节格式:

var="$(echo -n '☠' | od -An -tx1)"; printf '\\x%s' ${var^^}; echo

echo -n '☠' | od -An -tx1 | sed 's/ /\\x/g'

两者的输出都是\xE2\x98\xA0，所以你可以反过来写:

echo $'\xe2\x98\xa0'   # ☠

推荐文章