Temos um repositório Git com mais de 400 confirmações, das quais algumas dezenas foram tentativas e erros. Queremos limpar esses commits, comprimindo muitos deles em um único commit. Naturalmente, o git-rebase parece o caminho a percorrer. Meu problema é que ele acaba com conflitos de mesclagem, e esses conflitos não são fáceis de resolver. Não entendo por que deve haver algum conflito, já que estou apenas esmagando commits (não excluindo ou reorganizando). Muito provavelmente, isso demonstra que não estou entendendo completamente como o git-rebase faz suas abóboras.
Aqui está uma versão modificada dos scripts que estou usando:
repo_squash.sh (este é o script que é realmente executado):
rm -rf repo_squash
git clone repo repo_squash
cd repo_squash/
GIT_EDITOR=../repo_squash_helper.sh git rebase --strategy theirs -i bd6a09a484b8230d0810e6689cf08a24f26f287a
repo_squash_helper.sh (este script é usado apenas por repo_squash.sh):
if grep -q "pick " $1
then
# cp $1 ../repo_squash_history.txt
# emacs -nw $1
sed -f ../repo_squash_list.txt < $1 > $1.tmp
mv $1.tmp $1
else
if grep -q "initial import" $1
then
cp ../repo_squash_new_message1.txt $1
elif grep -q "fixing bad import" $1
then
cp ../repo_squash_new_message2.txt $1
else
emacs -nw $1
fi
fi
repo_squash_list.txt: (este arquivo é usado apenas por repo_squash_helper.sh)
# Initial import
s/pick \(251a190\)/squash \1/g
# Leaving "Needed subdir" for now
# Fixing bad import
s/pick \(46c41d1\)/squash \1/g
s/pick \(5d7agf2\)/squash \1/g
s/pick \(3da63ed\)/squash \1/g
Vou deixar o conteúdo da "nova mensagem" à sua imaginação. Inicialmente, eu fiz isso sem a opção "- estrategy his" (ou seja, usando a estratégia padrão, que se eu entender corretamente a documentação é recursiva, mas não tenho certeza de qual estratégia recursiva é usada), e também não ' não funciona. Além disso, devo salientar que, usando o código comentado em repo_squash_helper.sh, salvei o arquivo original no qual o script sed trabalha e executei o script sed para garantir que ele estivesse fazendo o que queria ( isso foi). Novamente, eu nem sei por que haveria um conflito, então parece que não importa tanto qual estratégia é usada. Qualquer conselho ou insight seria útil, mas principalmente eu quero fazer com que essa compressão funcione.
Atualizado com informações adicionais da discussão com o Jefromi:
Antes de trabalhar em nosso enorme repositório "real", usei scripts semelhantes em um repositório de teste. Era um repositório muito simples e o teste funcionou corretamente.
A mensagem que recebo quando falha é:
Finished one cherry-pick.
# Not currently on any branch.
nothing to commit (working directory clean)
Could not apply 66c45e2... Needed subdir
Esta é a primeira escolha após o primeiro squash commit. A execução git status
produz um diretório de trabalho limpo. Se eu fizer um git rebase --continue
, recebo uma mensagem muito semelhante após mais algumas confirmações. Se eu fizer de novo, recebo outra mensagem muito semelhante depois de algumas dezenas de confirmações. Se eu fizer isso de novo, desta vez, ele passa por cerca de cem confirmações e gera esta mensagem:
Automatic cherry-pick failed. After resolving the conflicts,
mark the corrected paths with 'git add <paths>', and
run 'git rebase --continue'
Could not apply f1de3bc... Incremental
Se eu correr git status
, recebo:
# Not currently on any branch.
# Changes to be committed:
# (use "git reset HEAD <file>..." to unstage)
#
# modified: repo/file_A.cpp
# modified: repo/file_B.cpp
#
# Unmerged paths:
# (use "git reset HEAD <file>..." to unstage)
# (use "git add/rm <file>..." as appropriate to mark resolution)
#
# both modified: repo/file_X.cpp
#
# Changed but not updated:
# (use "git add/rm <file>..." to update what will be committed)
# (use "git checkout -- <file>..." to discard changes in working directory)
#
# deleted: repo/file_Z.imp
O bit "ambos modificados" parece estranho para mim, pois esse foi apenas o resultado de uma escolha. Também vale a pena notar que, se eu olhar para o "conflito", ele se resume a uma única linha, com uma versão começando com um caractere [tab] e a outra com quatro espaços. Parecia que isso poderia ser um problema de como eu configurei meu arquivo de configuração, mas não há nada disso. (Observei que core.ignorecase está definido como true, mas evidentemente o git-clone fez isso automaticamente. Não estou completamente surpreso com isso, considerando que a fonte original estava em uma máquina Windows.)
Se eu corrigir manualmente file_X.cpp, ele falhará logo depois com outro conflito, desta vez entre um arquivo (CMakeLists.txt) que uma versão acha que deveria existir e uma versão que acha que não deveria. Se eu corrigir esse conflito dizendo que quero esse arquivo (o que eu faço), alguns commit mais tarde, recebo outro conflito (nesse mesmo arquivo), onde agora há algumas mudanças não triviais. Ainda é apenas cerca de 25% dos conflitos.
Devo também salientar, já que isso pode ser muito importante, que este projeto tenha começado em um repositório svn. É provável que esse histórico inicial tenha sido importado desse repositório svn.
Atualização # 2:
Em uma cotovia (influenciada pelos comentários de Jefromi), decidi fazer a alteração do meu repo_squash.sh para:
rm -rf repo_squash
git clone repo repo_squash
cd repo_squash/
git rebase --strategy theirs -i bd6a09a484b8230d0810e6689cf08a24f26f287a
E então, acabei de aceitar as entradas originais, como estão. Ou seja, o "rebase" não deveria ter mudado nada. Acabou com os mesmos resultados descritos anteriormente.
Atualização # 3:
Como alternativa, se eu omitir a estratégia e substituir o último comando por:
git rebase -i bd6a09a484b8230d0810e6689cf08a24f26f287a
Eu não recebo mais o problema de rebase do "nada a confirmar", mas ainda estou com os outros conflitos.
Atualize com o repositório de brinquedos que recria o problema:
test_squash.sh (esse é o arquivo que você realmente executa):
#========================================================
# Initialize directories
#========================================================
rm -rf test_squash/ test_squash_clone/
mkdir -p test_squash
mkdir -p test_squash_clone
#========================================================
#========================================================
# Create repository with history
#========================================================
cd test_squash/
git init
echo "README">README
git add README
git commit -m"Initial commit: can't easily access for rebasing"
echo "Line 1">test_file.txt
git add test_file.txt
git commit -m"Created single line file"
echo "Line 2">>test_file.txt
git add test_file.txt
git commit -m"Meant for it to be two lines"
git checkout -b dev
echo Meaningful code>new_file.txt
git add new_file.txt
git commit -m"Meaningful commit"
git checkout master
echo Conflicting meaningful code>new_file.txt
git add new_file.txt
git commit -m"Conflicting meaningful commit"
# This will conflict
git merge dev
# Fixes conflict
echo Merged meaningful code>new_file.txt
git add new_file.txt
git commit -m"Merged dev with master"
cd ..
#========================================================
# Save off a clone of the repository prior to squashing
#========================================================
git clone test_squash test_squash_clone
#========================================================
#========================================================
# Do the squash
#========================================================
cd test_squash
GIT_EDITOR=../test_squash_helper.sh git rebase -i HEAD@{7}
#========================================================
#========================================================
# Show the results
#========================================================
git log
git gc
git reflog
#========================================================
test_squash_helper.sh (usado por test_sqash.sh):
# If the file has the phrase "pick " in it, assume it's the log file
if grep -q "pick " $1
then
sed -e "s/pick \(.*\) \(Meant for it to be two lines\)/squash \1 \2/g" < $1 > $1.tmp
mv $1.tmp $1
# Else, assume it's the commit message file
else
# Use our pre-canned message
echo "Created two line file" > $1
fi
PS: Sim, eu sei que alguns de vocês se encolhem quando me veem usando o emacs como editor substituto.
PPS: Sabemos que teremos que remover todos os nossos clones do repositório existente após o rebase. (Na linha de "não devolverás um repositório depois que ele for publicado".)
PPPS: Alguém pode me dizer como adicionar uma recompensa a isso? Não estou vendo a opção em nenhum lugar desta tela, esteja no modo de edição ou no modo de exibição.
rebase --interactive
- essas são uma espécie de lista de ações para o git tentar. Eu esperava que você pudesse reduzir isso a uma única squash que estava causando conflitos e evitasse toda a complexidade extra de seus scripts auxiliares. A outra informação que falta é quando os conflitos ocorrem - quando o git aplica os patches para formar o squash, ou quando tenta passar além do squash e aplicar o próximo patch? (E você tem certeza que nada de ruim acontece com o seu kludge GIT_EDITOR Outro voto para caso de teste simples?.)
rebase -p
de qualquer maneira)