Usando sed para renomear arquivos em massa

Question 1

Objetivo

Altere esses nomes de arquivo:

F00001-0708-RG-biasliuyda
F00001-0708-CS-akgdlaul
F00001-0708-VF-hioulgigl

para estes nomes de arquivo:

F0001-0708-RG-biasliuyda
F0001-0708-CS-akgdlaul
F0001-0708-VF-hioulgigl

Código Shell

Testar:

ls F00001-0708-*|sed 's/\(.\).\(.*\)/mv & \1\2/'

Executar:

ls F00001-0708-*|sed 's/\(.\).\(.*\)/mv & \1\2/' | sh

Minha pergunta

Eu não entendo o código sed. Eu entendo o que o comando de substituição

$ sed 's/something/mv'

significa. E eu entendo de alguma forma as expressões regulares. Mas não entendo o que está acontecendo aqui:

\(.\).\(.*\)

ou aqui:

& \1\2/

O primeiro, para mim, parece que significa: "um único caractere, seguido por um único caractere, seguido por qualquer sequência de comprimento de um único caractere" - mas certamente há mais do que isso. Quanto à última parte:

& \1\2/

Eu não faço ideia.

Question 2

Em primeiro lugar, devo dizer que a maneira mais fácil de fazer isso é usar os comandos prename ou rename.

No Ubuntu, OSX (pacote Homebrew rename, pacote MacPorts p5-file-rename) ou outros sistemas com renomeação perl (prename):

rename s/0000/000/ F0000*

ou em sistemas com renomeação de util-linux-ng, como RHEL:

rename 0000 000 F0000*

Isso é muito mais compreensível do que o comando sed equivalente.

Mas quanto à compreensão do comando sed, a página de manual do sed é útil. Se você executar man sed e pesquisar por & (usando o comando / para pesquisar), você encontrará um caractere especial em s / foo / bar / reposições.

  s/regexp/replacement/
         Attempt  to match regexp against the pattern space.  If success‐
         ful,  replace  that  portion  matched  with  replacement.    The
         replacement may contain the special character & to refer to that
         portion of the pattern space  which  matched,  and  the  special
         escapes  \1  through  \9  to refer to the corresponding matching
         sub-expressions in the regexp.

Portanto, \(.\)corresponde ao primeiro caractere, que pode ser referenciado por \1. Em seguida, .corresponde ao próximo caractere, que é sempre 0. Em seguida, \(.*\)corresponde ao restante do nome do arquivo, que pode ser referenciado por \2.

A string de substituição coloca tudo junto usando &(o nome do arquivo original) e \1\2que é todas as partes do nome do arquivo, exceto o segundo caractere, que era um 0.

Esta é uma maneira bastante enigmática de fazer isso, IMHO. Se por algum motivo o comando rename não estivesse disponível e você quisesse usar o sed para renomear (ou talvez estivesse fazendo algo muito complexo para renomear?), Ser mais explícito em sua regex o tornaria muito mais legível. Talvez algo como:

ls F00001-0708-*|sed 's/F0000\(.*\)/mv & F000\1/' | sh

Ser capaz de ver o que está realmente mudando em s / search / replacement / torna-o muito mais legível. Além disso, ele não continuará sugando caracteres de seu nome de arquivo se você acidentalmente executá-lo duas vezes ou algo assim.

Question 3

você teve sua explicação sed, agora você pode usar apenas o shell, sem a necessidade de comandos externos

for file in F0000*
do
    echo mv "$file" "${file/#F0000/F000}"
    # ${file/#F0000/F000} means replace the pattern that starts at beginning of string
done

Question 4

Escrevi um pequeno post com exemplos sobre renomeação em lote usando sedalguns anos atrás:

http://www.guyrutenberg.com/2009/01/12/batch-renaming-using-sed/

Por exemplo:

for i in *; do
  mv "$i" "`echo $i | sed "s/regex/replace_text/"`";
done

Se a regex contém grupos (por exemplo \(subregex\), você pode usá-los no texto de substituição como \1\, \2etc.

Question 5

A maneira mais fácil seria:

for i in F00001*; do mv "$i" "${i/F00001/F0001}"; done

ou, portavelmente,

for i in F00001*; do mv "$i" "F0001${i#F00001}"; done

Isso substitui o F00001prefixo nos nomes dos arquivos por F0001. créditos para mahesh aqui: http://www.debian-administration.org/articles/150

Question 6

O sedcomando

s/\(.\).\(.*\)/mv & \1\2/

significa substituir:

\(.\).\(.*\)

com:

mv & \1\2

apenas como um sedcomando normal . No entanto, os parênteses &e \nmarcadores mudam um pouco.

A string de pesquisa corresponde (e lembra como padrão 1) o único caractere no início, seguido por um único caractere, seguido pelo resto da string (lembrado como padrão 2).

Na string de substituição, você pode se referir a esses padrões correspondentes para usá-los como parte da substituição. Você também pode se referir a toda a parte correspondida como &.

Portanto, o que esse sedcomando está fazendo é criar um mvcomando baseado no arquivo original (para a fonte) e caractere 1 e 3 em diante, removendo efetivamente o caractere 2 (para o destino). Ele fornecerá uma série de linhas no seguinte formato:

mv F00001-0708-RG-biasliuyda F0001-0708-RG-biasliuyda
mv abcdef acdef

e assim por diante.

Question 7

A barra invertida com parênteses significa, "enquanto corresponde ao padrão, segure o material que combina aqui." Posteriormente, no lado do texto de substituição, você pode obter esses fragmentos lembrados de volta com "\ 1" (primeiro bloco entre parênteses), "\ 2" (segundo bloco) e assim por diante.

Question 8

Se tudo o que você realmente está fazendo é remover o segundo caractere, independentemente de qual seja, você pode fazer o seguinte:

s/.//2

mas seu comando está construindo um mvcomando e direcionando-o ao shell para execução.

Isso não é mais legível do que sua versão:

find -type f | sed -n 'h;s/.//4;x;s/^/mv /;G;s/\n/ /g;p' | sh

O quarto caractere é removido porque findantecede cada nome de arquivo com "./".

Question 9

Os parênteses capturam cadeias de caracteres específicas para uso pelos números com barra invertida.

Question 10

 ls F00001-0708-*|sed 's|^F0000\(.*\)|mv & F000\1|' | bash

Question 11

Aqui está o que eu faria:

for file in *.[Jj][Pp][Gg] ;do 
    echo mv -vi \"$file\" `jhead $file|
                           grep Date|
                           cut -b 16-|
                           sed -e 's/:/-/g' -e 's/ /_/g' -e 's/$/.jpg/g'` ;
done

Então, se isso parecer certo, acrescente | shao final. Então:

for file in *.[Jj][Pp][Gg] ;do 
    echo mv -vi \"$file\" `jhead $file|
                           grep Date|
                           cut -b 16-|
                           sed -e 's/:/-/g' -e 's/ /_/g' -e 's/$/.jpg/g'` ;
done | sh

Question 12

Usando renomear perl (um deve ter na caixa de ferramentas):

rename -n 's/0000/000/' F0000*

Remova a -nchave quando a saída parecer boa para renomear de verdade.

Atenção Existem outras ferramentas com o mesmo nome que podem ou não ser capazes de fazer isso, então tome cuidado.

O comando rename que faz parte do util-linuxpacote não vai.

Se você executar o seguinte comando ( GNU)

$ rename

e você vê perlexpr, então esta parece ser a ferramenta certa.

Se não, para torná-lo o padrão (geralmente já é o caso) em Debiane derivado como Ubuntu:

$ sudo apt install rename
$ sudo update-alternatives --set rename /usr/bin/file-rename

Para archlinux:

pacman -S perl-rename

Para distros familiares RedHat:

yum install prename

O pacote 'prename' está no repositório EPEL .

Para Gentoo:

emerge dev-perl/rename

Para * BSD:

pkg install gprename

ou p5-File-Rename

Para usuários de Mac:

brew install rename

Se você não tiver esse comando com outra distro, pesquise seu gerenciador de pacotes para instalá-lo ou fazê-lo manualmente :

cpan -i File::Rename

A versão autônoma antiga pode ser encontrada aqui

homem renomear

_{^{Esta ferramenta foi originalmente escrita por Larry Wall, o pai do Perl.}}

Question 13

for i in *; do mv $i $(echo $i|sed 's/AAA/BBB/'); done