Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



6
Maneira básica de colapsar variáveis ​​categóricas com muitos níveis?
Quais técnicas estão disponíveis para recolher (ou agrupar) muitas categorias para algumas, com o objetivo de usá-las como uma entrada (preditora) em um modelo estatístico? Considere uma variável como estudante universitário (disciplina escolhida por um estudante de graduação). É desordenado e categórico, mas pode potencialmente ter dezenas de níveis distintos. …


11
Quebra-cabeças: Como gerar 7 números inteiros com igual probabilidade usando uma moeda tendenciosa que tem um pr (cabeça) = p?
Esta é uma pergunta que encontrei no Glassdoor : Como gerar 7 números inteiros com igual probabilidade usando uma moeda que possui ?Pr(Head)=p∈(0,1)Pr(Head)=p∈(0,1)\mathbb{Pr}(\text{Head}) = p\in(0,1) Basicamente, você tem uma moeda que pode ou não ser justa, e esse é o único processo de geração de número aleatório que você possui; …



1
Compreendendo a curva ROC
Estou tendo problemas para entender a curva ROC. Existe alguma vantagem / melhoria na área sob a curva ROC se eu construir modelos diferentes de cada subconjunto exclusivo do conjunto de treinamento e usá-lo para produzir uma probabilidade? Por exemplo, se tem valores de { um , um , um …
57 r  roc 




7
Exemplos em que o método dos momentos pode superar a máxima probabilidade em pequenas amostras?
Estimadores de máxima verossimilhança (MLE) são assintoticamente eficientes; vemos o resultado prático, na medida em que eles geralmente se saem melhor do que as estimativas do método dos momentos (MoM) (quando diferem), mesmo em amostras pequenas Aqui "melhor que" significa no sentido de tipicamente ter menor variação quando ambos são …



11
Recursos para aprender a cadeia de Markov e os modelos ocultos de Markov
Estou procurando recursos (tutoriais, livros didáticos, webcast etc.) para aprender sobre Markov Chain e HMMs. Minha formação é como biólogo e atualmente estou envolvido em um projeto relacionado à bioinformática. Além disso, quais são os conhecimentos matemáticos necessários para ter uma compreensão suficiente dos modelos e HMMs de Markov? Eu …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.