Este é um modelo de um analisador de HTML que perdoa. Em vez de analisar o HTML e extrair atributos, nesse código golf, o analisador de tags será simples.
Escreva uma função que analise uma estrutura de tags e retorne seu formulário entre parênteses. Uma tag de abertura consiste em uma letra minúscula e uma tag de fechamento consiste em uma letra maiúscula. Por exemplo, aAbaAB
analisa em (a)(b(a))
, ou em HTML <a></a><b><a></a></b>
,. Obviamente, as tags podem estar em justaposição e aninhadas.
As tags fechadas "prematuramente" devem ser manipuladas. Por exemplo, em abcA
, o A
fecha o mais externo a
, por isso é analisado (a(b(c)))
.
Tags de fechamento extras são simplesmente ignoradas: aAB
analisa (a)
.
Tags sobrepostas NÃO são tratadas. Por exemplo, abAB
analisa (a(b))
, não (a(b))(b)
, pela regra anterior de tags de fechamento extras ( abAB
-> abA
( (a(b))
) + B
(extra)).
Supondo que não haja espaços em branco e outros caracteres ilegais na entrada.
Você não tem permissão para usar nenhuma biblioteca.
Aqui está uma implementação de referência e uma lista de casos de teste:
#!/usr/bin/python
def pars(inpu):
outp = ""
stac = []
i = 0
for x in inpu:
lowr = x.lower()
if x == lowr:
stac.append(x)
outp += "(" + x
i = i + 1
else:
while len(stac) > 1 and stac[len(stac) - 1] != lowr:
outp += ")"
stac.pop()
i = i - 1
if len(stac) > 0:
outp += ")"
stac.pop()
i = i - 1
outp += ")" * i
return outp
tests = [
("aAaAbB", "(a)(a)(b)"),
("abBcdDCA", "(a(b)(c(d)))"),
("bisSsIB", "(b(i(s)(s)))"),
("aAabc", "(a)(a(b(c)))"),
("abcdDA", "(a(b(c(d))))"),
("abcAaA", "(a(b(c)))(a)"),
("acAC", "(a(c))"),
("ABCDEFG", ""),
("AbcBCabA", "(b(c))(a(b))")
]
for case, expe in tests:
actu = pars(case)
print "%s: C: [%s] E: [%s] A: [%s]" % (["FAIL", "PASS"][expe == actu], case, expe, actu)
O menor código vence.
AbcBCabA
(deve analisar como (b(c))(a(b))
meu código poderia ter sido mais curto, exceto para este caso..