Eu tenho um arquivo XML de centenas de milhares de linhas que está cheio de dados que eu não preciso. Eu estou procurando uma maneira de eliminar em massa milhares de linhas irrelevantes e estou ciente de que isso pode ser feito através de localizar e substituir por um regex. Mas minhas habilidades de regex são basicamente inexistentes.
O arquivo é compatível com XML, portanto, cada linha começa e termina com tags. Um bloco de exemplo que ocorre centenas de vezes em todo o documento é:
<g:payment_accepted>Visa</g:payment_accepted>
<g:payment_accepted>Cash</g:payment_accepted>
<g:payment_accepted>MasterCard</g:payment_accepted>
<g:payment_accepted>Check</g:payment_accepted>
<g:payment_accepted>WireTransfer</g:payment_accepted>
Então, neste caso, eu quero um regex para procurar instâncias:
<g:payment_accepted>WILDCARD_ANYTHING_IN_BETWEEN</g:payment_accepted>
Uma vez que eu tenho um regex de trabalho, eu entendo, eu posso ajustá-lo para outros blocos de tag repetidos no documento. Não sei por onde começar embora.