Com zsh
:
file='INT_V1_<Product>_<ID>_<Name>_<ddmmyy>.csv'
setopt extendedglob
if [[ $file = (#b)*_(*)_(*)_(*)_(*).csv ]]; then
product=$match[1] id=$match[2] name=$match[3] date=$match[4]
fi
Com a bash
versão 4.3 ou mais recente, ksh93t ou mais recente ou zsh na emulação sh (no entanto zsh
, você prefere simplesmente field=("${(@s:_:)field}")
dividir do que usar o operador sem sentido split + glob sh
), você pode dividir a string em _
caracteres e referenciá-los a partir do final :
IFS=_
set -o noglob
field=($file) # split+glob operator
date=${field[-1]%.*}
name=${field[-2]}
id=${field[-3]}
product=${field[-4]}
Ou (bash 3.2 ou mais recente):
if [[ $file =~ .*_(.*)_(.*)_(.*)_(.*)\.csv$ ]]; then
product=${BASH_REMATCH[1]}
id=${BASH_REMATCH[2]}
name=${BASH_REMATCH[3]}
date=${BASH_REMATCH[4]}
fi
(que pressupõe que $file
contenha texto válido no código de idioma atual, que não é garantido para nomes de arquivos, a menos que você fixe o código de idioma em C ou outro código de idioma com um byte único por conjunto de caracteres).
Como zsh
é *
acima, o .*
é ganancioso . Portanto, o primeiro comerá o maior número *_
possível, de modo que o restante .*
corresponderá apenas a _
cadeias livres.
Com ksh93
, você poderia fazer
pattern='*_(*)_(*)_(*)_(*).csv'
product=${file//$pattern/\1}
id=${file//$pattern/\2}
name=${file//$pattern/\3}
date=${file//$pattern/\4}
Em um POSIX sh
script, você poderia usar os ${var#pattern}
, ${var%pattern}
operadores de expansão de parâmetro padrão:
rest=${file%.*} # remove .csv suffix
date=${rest##*_} # remove everything on the left up to the rightmost _
rest=${rest%_*} # remove one _* from the right
name=${rest##*_}
rest=${rest%_*}
id=${rest##*_}
rest=${rest%_*}
product=${rest##*_}
Ou use o operador split + glob novamente:
IFS=_
set -o noglob
set -- $file
shift "$(($# - 4))"
product=$1 id=$2 name=$3 date=${4%.*}