Em árabe, como em alguns outros idiomas, existe o que é chamado de diacríticos para aprimorar a pronúncia. Não há convenção sobre quantos diacríticos devem ser escritos para uma única palavra. Alguns usam o mínimo (que eu prefiro) apenas o suficiente para desambiguar a pronúncia, enquanto outros os usam de forma supérflua ou apenas para fins caligráficos estéticos. Assim, há uma grande variação sobre o que e quantos diacríticos estão associados a uma palavra. Quando isearch-forward/backward
pressiono C-s/r
, surge um problema quando o digito no mini-buffer de pesquisa sem diacríticos. Ele não corresponderá à mesma palavra no texto se tiver diacríticos, tornando a tarefa de procurar essa palavra com seus potenciais diacríticos sempre insatisfatórios.
Existe uma maneira de fazer a pesquisa / regexp desconhecer os diacríticos? Espero que haja uma resposta que possa ser estendida para incluir regexp C-M-s/r
e grep
pesquisar que eu uso com frequência no helm-projectile para procurar uma palavra em projetos de látex com vários arquivos.
Atualização
Seria bom ver que o Emacs, em todas as suas funções de pesquisa, executa a etapa de remoção do texto (de acentos / diacríticos / o nome dele) antes de corresponder a etapa como um comportamento padrão que pode ser desativado por um prefixo sob demanda não importa qual idioma esteja disponível. Normalmente, quando procuro algo que não espero do melhor editor (Emacs) falhar nessa tarefa, apenas por causa de alguns sinais diacríticos ou sotaques que raramente são necessários para realizar tarefas de texto mundanas.
php
implementado: stackoverflow.com/a/25563250/1288722 - também implementado em Javascript
: stackoverflow.com/a/7193622/1288722
helm-swoop
?
ucs-normalize-*
funções emlisp/international/ucs-normalize.el
. Não há dobramento de pesquisa predefinido para eles, como ocorre com o dobramento de maiúsculas e minúsculas, mas você pode pelo menos normalizar uma região antes de pesquisá-la. Uma boa implementação é provavelmente uma tarefa bastante complexa.