O arquivo file1.txt contém linhas como:
/api/purchase/<hash>/index.html
Por exemplo:
/api/purchase/12ab09f46/index.html
O arquivo file2.csv contém linhas como:
<hash>,timestamp,ip_address
Por exemplo:
12ab09f46,20150812235200,22.231.113.64
a77b3ff22,20150812235959,194.66.82.11
Quero filtrar file2.csv removendo todas as linhas em que o valor de hash também está presente em file1.txt. Isso é para dizer:
cat file1.txt | extract <hash> | sed '/<hash>/d' file2.csv
ou algo parecido com isto.
Deve ser simples, mas pareço incapaz de fazê-lo funcionar.
Alguém pode fornecer um pipeline de trabalho para esta tarefa?
cat
, apenascut -d / -f 4 file1.txt
. Ou, se você preferir o visual seqüencial,<file1.txt cut -d / -f 4