Há um par de maneiras diferentes para remover HTML tags
a partir de um NSString
no Cocoa
.
Uma maneira é renderizar a string em um NSAttributedString
e então capturar o texto renderizado.
Outra maneira é usar o método NSXMLDocument's
- objectByApplyingXSLTString
para aplicar uma XSLT
transformação que faça isso.
Infelizmente, o iPhone não suporta NSAttributedString
ou NSXMLDocument
. Existem muitos casos extremos e HTML
documentos malformados para que eu me sinta confortável usando regex ou NSScanner
. Alguém tem uma solução para isso?
Uma sugestão foi simplesmente procurar por caracteres de tag de abertura e fechamento; este método não funcionará, exceto em casos muito triviais.
Por exemplo, estes casos (do capítulo do Perl Cookbook sobre o mesmo assunto) quebrariam este método:
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>