Há um par de maneiras diferentes para remover HTML tagsa partir de um NSStringno Cocoa.
Uma maneira é renderizar a string em um NSAttributedStringe então capturar o texto renderizado.
Outra maneira é usar o método NSXMLDocument's- objectByApplyingXSLTStringpara aplicar uma XSLTtransformação que faça isso.
Infelizmente, o iPhone não suporta NSAttributedStringou NSXMLDocument. Existem muitos casos extremos e HTMLdocumentos malformados para que eu me sinta confortável usando regex ou NSScanner. Alguém tem uma solução para isso?
Uma sugestão foi simplesmente procurar por caracteres de tag de abertura e fechamento; este método não funcionará, exceto em casos muito triviais.
Por exemplo, estes casos (do capítulo do Perl Cookbook sobre o mesmo assunto) quebrariam este método:
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>