Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

1
Significado em linguagem simples dos testes "dependentes" e "independentes" na literatura de comparações múltiplas?
Tanto na literatura sobre a taxa de erro familiar (FWER) quanto na taxa de falsas descobertas (FDR), métodos particulares de controle da FWER ou FDR são considerados apropriados para testes dependentes ou independentes. Por exemplo, no artigo de 1979 "Um procedimento simples de teste múltiplo sequencialmente rejeitivo", Holm escreveu para …




1
Separação de fonte cega da mistura convexa?
Suponhamos que temos fontes independentes, X 1 , X 2 , . . . , X n e observo m misturas convexas: Y 1nnnX1,X2,...,XnX1,X2,...,XnX_1, X_2, ..., X_nmmmY1...Ym=a11X1+a12X2+⋯+a1nXn=am1X1+am2X2+⋯+amnXnY1=a11X1+a12X2+⋯+a1nXn...Ym=am1X1+am2X2+⋯+amnXn\begin{align} Y_1 &= a_{11}X_1 + a_{12}X_2 + \cdots + a_{1n}X_n\\ ...&\\ Y_m &= a_{m1}X_1 + a_{m2}X_2 + \cdots + a_{mn}X_n \end{align} com para todos …
18 pca  ica 

2
Média da amostra de bootstrap vs estatística da amostra
Digamos que eu tenha uma amostra e a amostra de bootstrap dessa amostra para um estastítico (por exemplo, a média). Como todos sabemos, esta amostra de bootstrap estima a distribuição amostral do estimador da estatística.χχ\chi Agora, a média dessa amostra de bootstrap é uma estimativa melhor da estatística da população …

1
Usando o bootstrap em H0 para executar um teste para a diferença de duas médias: substituição nos grupos ou na amostra agrupada
Suponha que eu tenha dados com dois grupos independentes: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c …

2
Por que
Uma sequência de estimadores UnUnU_n para um parâmetro θθ\theta é assintoticamente normal se n−−√(Un−θ)→N(0,v)n(Un−θ)→N(0,v)\sqrt{n}(U_n - \theta) \to N(0,v). (fonte) Em seguida, chamamosvvva variação assintótica deUnUnU_n. Se essa variância for igual aolimite Cramer-Rao, dizemos que o estimador / sequência é assintoticamente eficiente. Pergunta: Por que usamos n−−√n\sqrt{n} em particular? Eu sei …


1
Escolhendo entre funções de perda para classificação binária
Eu trabalho em um domínio problemático em que as pessoas frequentemente relatam ROC-AUC ou AveP (precisão média). No entanto, recentemente encontrei trabalhos que otimizam a perda de log , enquanto outros relatam perda de dobradiça . Embora eu entenda como essas métricas são calculadas, estou tendo dificuldades para entender as …


3
Consistência assintótica com variação assintótica diferente de zero - o que representa?
A questão já foi apresentada antes, mas quero fazer uma pergunta específica que tentará obter uma resposta que a esclareça (e classifique): Em "Assintóticos do pobre homem", mantém-se uma clara distinção entre (a) uma sequência de variáveis ​​aleatórias que converge em probabilidade para uma constante em contraste com (b) uma …


4
Qual é a intuição por trás da independência de e , ?
Eu esperava que alguém pudesse propor um argumento explicando por que as variáveis ​​aleatórias e , com a distribuição normal padrão, são estatisticamente independentes. A prova desse fato decorre facilmente da técnica MGF, mas acho extremamente contra-intuitiva.Y1=X2−X1Y1=X2−X1Y_1=X_2-X_1Y2=X1+X2Y2=X1+X2Y_2=X_1+X_2XiXiX_i Eu apreciaria, portanto, a intuição aqui, se houver. Agradeço antecipadamente. EDIT : Os …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.