如何获取存储在变量中的字符串长度并将其赋值给另一个变量?
myvar="some string"
echo ${#myvar}
# 11
如何将另一个变量设置为输出11?
如何获取存储在变量中的字符串长度并将其赋值给另一个变量?
myvar="some string"
echo ${#myvar}
# 11
如何将另一个变量设置为输出11?
当前回答
UTF-8字符串长度
除了fedorqui的正确答案,我还想展示字符串长度和字节长度之间的区别:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen
将呈现:
Généralités is 11 char len, but 14 bytes len.
你甚至可以看看存储的字符:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"
会回答:
Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').
注意:根据Isabell Cowan的评论,我已经将设置添加到$LC_ALL和$LANG。
一个参数的长度,工作样本
参数的工作原理与常规变量相同
showStrLen() {
local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
printf -v sreal %q "$1"
LANG=$oLang LC_ALL=$oLcAll
printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}
将作为
showStrLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'
有用的printf校正工具:
如果你:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
printf " - %-14s is %2d char length\n" "'$string'" ${#string}
done
- 'Généralités' is 11 char length
- 'Language' is 8 char length
- 'Théorème' is 8 char length
- 'Février' is 7 char length
- 'Left: ←' is 7 char length
- 'Yin Yang ☯' is 10 char length
不是很漂亮的输出!
这里有一个小函数:
strU8DiffLen() {
local charlen=${#1} LANG=C LC_ALL=C
return $(( ${#1} - charlen ))
}
或写成一行:
strU8DiffLen() { local chLen=${#1} LANG=C LC_ALL=C;return $((${#1}-chLen));}
然后现在:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
strU8DiffLen "$string"
printf " - %-$((14+$?))s is %2d chars length, but uses %2d bytes\n" \
"'$string'" ${#string} $((${#string}+$?))
done
- 'Généralités' is 11 chars length, but uses 14 bytes
- 'Language' is 8 chars length, but uses 8 bytes
- 'Théorème' is 8 chars length, but uses 10 bytes
- 'Février' is 7 chars length, but uses 8 bytes
- 'Left: ←' is 7 chars length, but uses 9 bytes
- 'Yin Yang ☯' is 10 chars length, but uses 12 bytes
或者,你可以使用printf命令的%n运算符来构建相同的函数:
strU8DiffLen() {
local bytelen
printf -v _ %s%n "$1" bytelen
return $((bytelen-${#1}))
}
语法是非常反直觉的,但这是有效的,避免玩$LANG和/或$LC_ALL…
一句话:
strU8DiffLen() { local _bl;printf -v _ %s%n "$1" _bl;return $((_bl-${#1}));}
不幸的是,这并不完美!
但有一些奇怪的UTF-8行为,如双倍行距字符,零行距字符,反向置换和其他不可能那么简单…
请查看diffU8test.sh或diffU8test.sh.txt以了解更多限制。
其他回答
如果你想在命令行或函数参数中使用它,请确保使用size=${#1}而不是size=${#$1}。第二个可能更符合直觉,但语法不正确。
要获取存储在变量中的字符串长度,可以这样做:
myvar="some string"
size=${#myvar}
要确认它被正确保存,回显它:
$ echo "$size"
11
使用你提供的例子
#KISS (Keep it simple stupid)
size=${#myvar}
echo $size
bash中的字符串长度
str="Welcome to Stackoveflow"
length=`expr length "$str"`
echo "Length of '$str' is $length"
输出
“欢迎来到stackoverflow”的长度是23
UTF-8字符串长度
除了fedorqui的正确答案,我还想展示字符串长度和字节长度之间的区别:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen
将呈现:
Généralités is 11 char len, but 14 bytes len.
你甚至可以看看存储的字符:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"
会回答:
Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').
注意:根据Isabell Cowan的评论,我已经将设置添加到$LC_ALL和$LANG。
一个参数的长度,工作样本
参数的工作原理与常规变量相同
showStrLen() {
local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
printf -v sreal %q "$1"
LANG=$oLang LC_ALL=$oLcAll
printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}
将作为
showStrLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'
有用的printf校正工具:
如果你:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
printf " - %-14s is %2d char length\n" "'$string'" ${#string}
done
- 'Généralités' is 11 char length
- 'Language' is 8 char length
- 'Théorème' is 8 char length
- 'Février' is 7 char length
- 'Left: ←' is 7 char length
- 'Yin Yang ☯' is 10 char length
不是很漂亮的输出!
这里有一个小函数:
strU8DiffLen() {
local charlen=${#1} LANG=C LC_ALL=C
return $(( ${#1} - charlen ))
}
或写成一行:
strU8DiffLen() { local chLen=${#1} LANG=C LC_ALL=C;return $((${#1}-chLen));}
然后现在:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
strU8DiffLen "$string"
printf " - %-$((14+$?))s is %2d chars length, but uses %2d bytes\n" \
"'$string'" ${#string} $((${#string}+$?))
done
- 'Généralités' is 11 chars length, but uses 14 bytes
- 'Language' is 8 chars length, but uses 8 bytes
- 'Théorème' is 8 chars length, but uses 10 bytes
- 'Février' is 7 chars length, but uses 8 bytes
- 'Left: ←' is 7 chars length, but uses 9 bytes
- 'Yin Yang ☯' is 10 chars length, but uses 12 bytes
或者,你可以使用printf命令的%n运算符来构建相同的函数:
strU8DiffLen() {
local bytelen
printf -v _ %s%n "$1" bytelen
return $((bytelen-${#1}))
}
语法是非常反直觉的,但这是有效的,避免玩$LANG和/或$LC_ALL…
一句话:
strU8DiffLen() { local _bl;printf -v _ %s%n "$1" _bl;return $((_bl-${#1}));}
不幸的是,这并不完美!
但有一些奇怪的UTF-8行为,如双倍行距字符,零行距字符,反向置换和其他不可能那么简单…
请查看diffU8test.sh或diffU8test.sh.txt以了解更多限制。