Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


11
Um termo para "número de colunas" de uma matriz
Existe uma única palavra em inglês para denotar o "número de colunas" de uma matriz? Por exemplo, "dimensionalidade" de uma matriz é . Eu preciso de um termo para neste exemplo. Sempre posso dizer "número de colunas", é claro, mas eu poderia ter uma única palavra para isso?2 × 3 …


4
Motivação teórica para o uso da probabilidade logarítmica versus probabilidade
Estou tentando entender em um nível mais profundo a onipresença da probabilidade logarítmica (e talvez mais geralmente da probabilidade logarítmica) nas estatísticas e na teoria da probabilidade. As probabilidades de log aparecem em todo o lugar: geralmente trabalhamos com a probabilidade de log para análise (por exemplo, para maximização), as …





2
Existe alguma suposição sobre regressão logística?
Existe alguma suposição sobre a variável resposta da regressão logística? Por exemplo, suponha que tenhamos pontos de dados. Parece que a resposta vem de uma distribuição de Bernoulli com . Portanto, devemos ter distribuições de Bernoulli, com diferentes parâmetros .100010001000YiYiY_ipi=logit(β0+β1xi)pi=logit(β0+β1xi)p_i=\text{logit}(\beta_0+\beta_1 x_i)100010001000ppp Portanto, eles são "independentes", mas não são "idênticos". Estou …

5
As estatísticas bayesianas tornam a metanálise obsoleta?
Só estou me perguntando se as estatísticas bayesianas seriam aplicadas, consequentemente, do primeiro ao último, se isso fizer uma meta-análise obsoleta. Por exemplo, vamos assumir 20 estudos que foram realizados em diferentes momentos. A estimativa ou distribuição do primeiro estudo foi realizada com prévia não informativa . O segundo estudo …

2
Suponha . Mostrar
Qual é a maneira mais fácil de ver se a afirmação a seguir é verdadeira? Suponha . Mostre .Y1,…,Yn∼iidExp(1)Y1,…,Yn∼iidExp(1)Y_1, \dots, Y_n \overset{\text{iid}}{\sim} \text{Exp}(1)∑ni=1(Yi−Y(1))∼Gamma(n−1,1)∑i=1n(Yi−Y(1))∼Gamma(n−1,1)\sum_{i=1}^{n}(Y_i - Y_{(1)}) \sim \text{Gamma}(n-1, 1) Observe que .Y(1)=min1≤i≤nYiY(1)=min1≤i≤nYiY_{(1)} = \min\limits_{1 \leq i \leq n}Y_i Por X∼Exp(β)X∼Exp(β)X \sim \text{Exp}(\beta) , isso significa que fX(x)=1βe−x/β⋅1{x>0}fX(x)=1βe−x/β⋅1{x>0}f_{X}(x) = \dfrac{1}{\beta}e^{-x/\beta} \cdot \mathbf{1}_{\{x …

6
Explicação intuitiva do termo
Se é a classificação completa, o inverso de existe e obtemos a estimativa de mínimos quadrados: eX t X β = ( X T X ) - 1 X Y Var ( β ) = σ 2 ( X T X )XXXXTXXTXX^TXβ^=(XTX)−1XYβ^=(XTX)−1XY\hat\beta = (X^TX)^{-1}XYVar(β^)=σ2(XTX)−1Var⁡(β^)=σ2(XTX)−1\operatorname{Var}(\hat\beta) = \sigma^2(X^TX)^{-1} Como podemos explicar intuitivamente …



3
Por que existe -1 na função de densidade de distribuição beta?
A distribuição beta aparece em duas parametrizações (ou aqui ) f(x)∝xα(1−x)β(1)(1)f(x)∝xα(1−x)β f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} ou aquele que parece ser usado com mais frequência f(x)∝xα−1(1−x)β−1(2)(2)f(x)∝xα−1(1−x)β−1 f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} Mas por que exatamente existe " " na segunda fórmula?−1−1-1 A primeira formulação intuitivamente parece corresponder mais diretamente à …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.