在Bash中提取子字符串

给定someletters_12345_moreleters形式的文件名。ext，我想提取5位数字，并将它们放入一个变量。

为了强调这一点，我有一个x个字符的文件名，然后是一个5位数字序列，两边都有一个下划线，然后是另一组x个字符。我想把这个5位数代入一个变量。

我对实现这一目标的多种不同方式非常感兴趣。

当前回答

这是一个substring.sh文件

使用

`substring.sh $TEXT 2 3` # characters 2-3

`substring.sh $TEXT 2` # characters 2 and after

Substring.sh遵循这一行

#echo "starting substring"
chars=$1
start=$(($2))
end=$3

i=0
o=""
if [[ -z $end ]]; then
  end=`echo "$chars " | wc -c`
else
  end=$((end))
fi
#echo "length is " $e
a=`echo $chars | sed  's/\(.\)/\1 /g'`
#echo "a is " $a
for c in $a
do
  #echo "substring" $i $e $c
  if [[ i -lt $start ]]; then
    : # DO Nothing
  elif [[ i -gt $end ]]; then
    break;
  else
    o="$o$c"
  fi
  i=$(($i+1))
done
#echo substring returning $o
echo $o

2021-11-18 20:15:17

其他回答

通用解决方案，其中数字可以在文件名中的任何位置，使用这样的序列中的第一个:

number=$(echo $filename | egrep -o '[[:digit:]]{5}' | head -n1)

另一个精确提取变量一部分的解决方案:

number=${filename:offset:length}

如果你的文件名总是使用stuff_digits_…你可以使用awk:

number=$(echo $filename | awk -F _ '{ print $2 }')

还有一种方法可以删除除数字以外的所有内容，使用

number=$(echo $filename | tr -cd '[[:digit:]]')

2009-01-09 14:00:08

遵循要求

我有一个文件名，x个字符，然后是5位数字序列两侧分别用一个下划线包围 x个字符的集合。我想取一个5位数把它代入一个变量。

我发现了一些可能有用的grep方法:

$ echo "someletters_12345_moreleters.ext" | grep -Eo "[[:digit:]]+" 
12345

或更好的

$ echo "someletters_12345_moreleters.ext" | grep -Eo "[[:digit:]]{5}" 
12345

然后使用-Po语法:

$ echo "someletters_12345_moreleters.ext" | grep -Po '(?<=_)\d+' 
12345

或者如果你想让它正好适合5个字符:

$ echo "someletters_12345_moreleters.ext" | grep -Po '(?<=_)\d{5}' 
12345

最后，要将它存储在一个变量中，只需要使用var=$(命令)语法。

2013-06-26 12:13:49

减少使用:

echo 'someletters_12345_moreleters.ext' | cut -d'_' -f 2

更通用的:

INPUT='someletters_12345_moreleters.ext'
SUBSTRING=$(echo $INPUT| cut -d'_' -f 2)
echo $SUBSTRING

2009-01-09 13:56:14

很多过时的解决方案都需要管道和子外壳。自bash版本3(2004年发布)以来，它有一个内置的正则表达式比较操作符=~。

input="someletters_12345_moreleters.ext"
# match: underscore followed by 1 or more digits followed by underscore
[[ $input =~ _([0-9]+)_ ]]
echo ${BASH_REMATCH[1]}

输出:

注意，如果您不是很精通编写RegExp，我建议您阅读精通正则表达式。

如果您只是需要弄清楚如何让RegExp工作，并且它不符合您的想法，请尝试RegEx101.com的在线GUI，并将“Flavor”设置为“PCRE”，以便获得bash使用的[[:digit:]]等POSIX风格的字符类。

2023-01-19 07:02:08

下面是一个前缀后缀解决方案(类似于JB和Darron给出的解决方案)，它匹配第一个数字块，并且不依赖于周围的下划线:

str='someletters_12345_morele34ters.ext'
s1="${str#"${str%%[[:digit:]]*}"}"   # strip off non-digit prefix from str
s2="${s1%%[^[:digit:]]*}"            # strip off non-digit suffix from s1
echo "$s2"                           # 12345

2011-05-06 12:50:13

在Bash中提取子字符串

推荐文章

最新文章

标签