Como os comentários são geralmente tratados em linguagens de programação e marcação? Estou escrevendo um analisador para alguma linguagem de marcação personalizada e quero seguir o princípio da menor surpresa , então estou tentando determinar a convenção geral.
Por exemplo, um comentário incorporado em um token 'interfere' com o token ou não? Geralmente, é algo como:
Sys/* comment */tem.out.println()
válido?
Além disso, se o idioma é sensível a novas linhas e o comentário abrange a nova linha, a nova linha deve ser considerada ou não?
stuff stuff /* this is comment
this is still comment */more stuff
ser tratado como
stuff stuff more stuff
ou
stuff stuff
more stuff
?
Sei o que alguns idiomas específicos fazem, nem procuro opiniões, mas procuro se há ou não: existe um consenso geral sobre o que geralmente é esperado por uma marcação em relação a tokens e novas linhas?
Meu contexto particular é uma marcação do tipo wiki.