Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Métricas de classificação de vários rótulos no scikit
Estou tentando criar um classificador de várias etiquetas para atribuir tópicos a documentos existentes usando o scikit Estou processando meus documentos passando-os TfidfVectorizerpelos rótulos MultiLabelBinarizere criando um OneVsRestClassifiercom um SGDClassifiercomo estimador. No entanto, ao testar meu classificador, apenas recebo pontuações de 0,29, o que pelo que li é bastante baixo …

3
Um coto de decisão é um modelo linear?
O stump de decisão é uma árvore de decisão com apenas uma divisão. Também pode ser escrito como uma função por partes. Por exemplo, suponha que é um vetor e é o primeiro componente de , na configuração de regressão, algum coto de decisão pode serx 1 xxxxx1x1x_1xxx f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)= \begin{cases} …

5
O que há em um nome: hiperparâmetros
Portanto, em uma distribuição normal, temos dois parâmetros: média e variância . No livro Reconhecimento de Padrões e Aprendizado de Máquina , aparece subitamente um hiperparâmetro nos termos de regularização da função de erro.μμ\muσ2σ2\sigma^2λλ\lambda O que são hiperparâmetros? Por que eles são nomeados como tal? E como eles são intuitivamente …

1
Antônimo de variância
Existe uma palavra que significa "inverso da variação"? Ou seja, se tem alta variação, então X tem baixa ... ? Não está interessado em um antônimo próximo (como 'acordo' ou 'similaridade'), mas significa especificamente 1 / σ 2 ?XXXXXX……\dots1/σ21/σ21/\sigma^2

3
O que deve ser ensinado primeiro: Probabilidade ou Estatística?
Eu entrei recentemente como membro do corpo docente em um departamento de matemática. de uma instituição de renome. Vou ministrar o curso Probabilidade e Estatística na graduação. A instituição já possui um plano de estudos para este curso com o qual não estou muito satisfeito. Nesse plano de estudos, as …
19 teaching 


2
A regularização pode ser útil se estivermos interessados ​​apenas na modelagem, não na previsão?
A regularização pode ser útil se estivermos interessados ​​apenas em estimar (e interpretar) os parâmetros do modelo, e não em previsão ou previsão? Vejo como a regularização / validação cruzada é extremamente útil se seu objetivo é fazer boas previsões sobre novos dados. Mas e se você estiver fazendo economia …


1
Como o LDA, uma técnica de classificação, também serve como técnica de redução de dimensionalidade como o PCA
Neste artigo , o autor vincula a análise discriminante linear (LDA) à análise de componentes principais (PCA). Com meu conhecimento limitado, não sou capaz de acompanhar como o LDA pode ser um pouco semelhante ao PCA. Eu sempre pensei que o LDA era uma forma de algoritmo de classificação, semelhante …





3
Julia: Fazendo um balanço de como está indo
Este post está relacionado a um evento que muda rapidamente. Me deparei com uma pergunta de 2012 que teve uma discussão muito boa sobre Julia como uma alternativa ao R / Python para vários tipos de trabalho estatístico. Aqui está a pergunta original de 2012 sobre a promessa de Julia …
19 r  python  computing  julia 


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.