Parece que o regex /\r\n|\r|\n/
lida com as terminações de linha CR, LF e CRLF, suas seqüências mistas e mantém todas as linhas vazias entre elas. Tente isso!
function splitLines(t) { return t.split(/\r\n|\r|\n/); }
// single newlines
splitLines("AAA\rBBB\nCCC\r\nDDD");
// double newlines
splitLines("EEE\r\rFFF\n\nGGG\r\n\r\nHHH");
// mixed sequences
splitLines("III\n\r\nJJJ\r\r\nKKK\r\n\nLLL\r\n\rMMM");
Você deve obter essas matrizes como resultado:
[ "AAA", "BBB", "CCC", "DDD" ]
[ "EEE", "", "FFF", "", "GGG", "", "HHH" ]
[ "III", "", "JJJ", "", "KKK", "", "LLL", "", "MMM" ]
Você também pode ensinar esse regex a reconhecer outros terminadores de linha Unicode legítimos adicionando |\xHH
ou |\uHHHH
partes, onde H
são dígitos hexadecimais do ponto de código do caractere terminador adicional (como visto no artigo da Wikipedia como U+HHHH
).