3
Equivalentes Unicode para \ w e \ b em expressões regulares Java?
Muitas implementações modernas de regex interpretam a \wabreviação da classe de caracteres como "qualquer letra, dígito ou pontuação de conexão" (geralmente: sublinhado). Dessa forma, uma regex como \w+jogos de palavras como hello, élève, GOÄ_432ou gefräßig. Infelizmente, Java não. Em Java, \wé limitado a [A-Za-z0-9_]. Isso dificulta palavras correspondentes como as …