Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


1
Uivadores causados ​​pelo uso de regressão gradual
Estou bem ciente dos problemas da seleção stepwise / forward / backward nos modelos de regressão. Existem inúmeros casos de pesquisadores denunciando os métodos e apontando para melhores alternativas. Fiquei curioso para saber se existem histórias onde uma análise estatística: usou regressão passo a passo; tirou algumas conclusões importantes com …

6
Completando uma matriz de correlação 3x3: dois coeficientes dos três dados
Fiz essa pergunta em uma entrevista. Digamos que temos uma matriz de correlação da forma ⎡⎣⎢10,60,80,61γ0,8γ1⎤⎦⎥[10,60,80,61γ0,8γ1]\begin{bmatrix}1&0.6&0.8\\0.6&1&\gamma\\0.8&\gamma&1\end{bmatrix} Me pediram para encontrar o valor da gama, dada essa matriz de correlação. Eu pensei que poderia fazer algo com os autovalores, já que eles deveriam ser maiores ou iguais a 0. (Matrix deve …

3
Fazendo estatísticas corretas em um ambiente de trabalho?
Não tenho certeza de onde essa pergunta pertence: Validação cruzada ou Local de trabalho. Mas minha pergunta está vagamente relacionada à estatística. Esta questão (ou acho que perguntas) surgiu durante o meu trabalho como "estagiário de ciência de dados". Eu estava construindo esse modelo de regressão linear e examinando o …
20 careers 




1
Como podemos simular a partir de uma mistura geométrica?
Se f1,…,fkf1,…,fkf_1,\ldots,f_k são densidades conhecidas das quais posso simular, ou seja, para as quais um algoritmo está disponível. e se o produto ∏i=1kfi(x)αiα1,…,αk>0∏i=1kfi(x)αiα1,…,αk>0\prod_{i=1}^k f_i(x)^{\alpha_i}\qquad \alpha_1,\ldots,\alpha_k>0 é integrável, existe uma abordagem genérica para simular a partir dessa densidade de produto usando os simuladores dosfifEuf_i 's?


4
Qual é a diferença entre aprendizado e inferência?
Os documentos de pesquisa de aprendizado de máquina geralmente tratam o aprendizado e a inferência como duas tarefas separadas, mas não está claro para mim qual é a distinção. Em este livro , por exemplo, eles usam estatística Bayesiana para ambos os tipos de tarefas, mas não fornecem uma motivação …

3
Por que o classificador AUC = 1 classificou erroneamente metade das amostras?
Estou usando um classificador que retorna probabilidades. Para calcular a AUC, estou usando o pROC R-package. As probabilidades de saída do classificador são: probs=c(0.9865780, 0.9996340, 0.9516880, 0.9337157, 0.9778576, 0.8140116, 0.8971550, 0.8967585, 0.6322902, 0.7497237) probsmostra probabilidade de estar na classe '1'. Como mostrado, o classificador classificou todas as amostras na classe …

9
Como sabemos que a probabilidade de rolar 1 e 2 é 1/18?
Desde a minha primeira aula de probabilidade, estive pensando sobre o seguinte. O cálculo de probabilidades é geralmente introduzido através da proporção dos "eventos favorecidos" para o total de eventos possíveis. No caso de rolar dois dados de 6 lados, a quantidade de eventos possíveis é , conforme exibido na …
20 probability  dice 


4
Codificando dados de ângulo para redes neurais
Estou treinando uma rede neural (detalhes não importantes) em que os dados de destino são um vetor de ângulos (entre 0 e 2 * pi). Estou procurando conselhos sobre como codificar esses dados. Aqui está o que estou tentando atualmente (com sucesso limitado): 1) Codificação 1-de-C: divido os ângulos possíveis …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.