Sou iniciante em estatística (fiz apenas um curso universitário), mas tenho experiência em programação.
Comecei a brincar com uma biblioteca classificadora bayesiana para Ruby e estou procurando idéias para analisar as coisas.
No momento, estou brincando com a categorização do Tweet, mas você tem alguma idéia?
Mais importante, como posso aprender sobre quais tipos de dados se prestam à ingênua classificação bayesiana.
Obrigado.