Estou tentando classificar alguns dados simples delimitados por canal. No entanto, a classificação não é realmente uma classificação. Move a linha do meu cabeçalho para baixo, mas minhas duas linhas começando com 241 estão sendo divididas por uma linha começando com 24.
cat sort_fail.csv
column_a|column_b|column_c
241|212|20810378
24|121|2810172
241|213|20810376
sort sort_fail.csv
241|212|20810378
24|121|2810172
241|213|20810376
column_a|column_b|column_c
Os cabeçalhos das colunas estão sendo movidos para a parte inferior do arquivo, portanto, a classificação está claramente processando-o. Mas, os valores reais não estão sendo classificados como eu esperaria.
Nesse caso, trabalhei com ele
sort sort_fail.csv --field-separator='|' -k1,1
Mas sinto que isso não seria necessário. Por que a classificação não está classificada?
csvsort
a partir csvkit
, que corretamente trata valores cotados.
LC_COLLATE=C sort
. Dependendo do que você está esperando, também pode ser necessárioLC_COLLATE=C sort -t'|' -n