Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


5
Intuição do Teorema de Bayes
Eu tenho tentado desenvolver um entendimento baseado na intuição do teorema de Bayes em termos de probabilidade anterior , posterior , probabilidade e marginal . Para isso, uso a seguinte equação: onde A representa uma hipótese ou crença e B representa dados ou evidências. Eu entendi o conceito de posterior …

4
Por que a saída softmax não é uma boa medida de incerteza para os modelos de aprendizagem profunda?
Trabalho com redes neurais convolucionais (CNNs) há algum tempo, principalmente em dados de imagem para segmentação semântica / segmentação de instância. Eu muitas vezes visualizei o softmax da saída de rede como um "mapa de calor" para ver o quão alto são as ativações por pixel para uma determinada classe. …

5
Regressão polinomial bruta ou ortogonal?
Eu quero regredir uma variável em . Devo fazer isso usando polinômios brutos ou ortogonais? Eu olhei para a pergunta no site que lida com isso, mas eu realmente não entendo qual é a diferença entre usá-lo. x , x 2 , … , x 5yyyx , x2, … , …


2
Por que o nome "kernel" nas estatísticas e ML?
Isso foi perguntado em outros sites SE no contexto de sistemas operacionais e álgebra linear, mas a mesma pergunta me incomoda em relação aos métodos de kernel usados ​​em estatística e aprendizado de máquina. Costuma-se dizer que os kernels, por exemplo, na estimativa da densidade do kernel ou SVMs, representam …






4
Dado o tamanho da amostra suficientemente grande, um teste sempre mostrará resultados significativos, a menos que o tamanho real do efeito seja exatamente zero. Por quê?
Estou curioso sobre uma afirmação feita no artigo da Wikipedia sobre tamanho de efeito . Especificamente: [...] uma comparação estatística não nula sempre mostrará resultados estatisticamente significativos, a menos que o tamanho do efeito populacional seja exatamente zero Não tenho certeza do que isso significa / implica, muito menos um …

2
O limite do estimador de regressão da crista de “variância unitária” quando
Considere a regressão de crista com uma restrição adicional exigindo que tenha soma unitária dos quadrados (equivalentemente, variação unitária); se necessário, pode-se supor que possui soma unitária dos quadrados:y^y^\hat{\mathbf y}yy\mathbf y β^∗λ=argmin{∥y−Xβ∥2+λ∥β∥2}s.t.∥Xβ∥2=1.β^λ∗=arg⁡min{‖y−Xβ‖2+λ‖β‖2}s.t.‖Xβ‖2=1.\hat{\boldsymbol\beta}_\lambda^* = \arg\min\Big\{\|\mathbf y - \mathbf X \boldsymbol \beta\|^2+\lambda\|\boldsymbol\beta\|^2\Big\} \:\:\text{s.t.}\:\: \|\mathbf X \boldsymbol\beta\|^2=1. Qual é o limite de β^∗λβ^λ∗\hat{\boldsymbol\beta}_\lambda^* …

1
Interpretação variável latente de modelos lineares generalizados (GLMs)
Versão curta: Sabemos que a regressão logística e a regressão probit podem ser interpretadas como envolvendo uma variável latente contínua que é discretizada de acordo com algum limite fixo antes da observação. Existe uma interpretação variável latente semelhante disponível para, por exemplo, regressão de Poisson? E quanto à regressão binomial …

1
Mostrando que 100 medidas para 5 sujeitos fornecem muito menos informações do que 5 medidas para 100 sujeitos
Em uma conferência, ouvi a seguinte declaração: 100 medições para 5 sujeitos fornecem muito menos informações do que 5 medições para 100 sujeitos. É meio óbvio que isso é verdade, mas eu queria saber como alguém poderia provar isso matematicamente ... Eu acho que um modelo misto linear poderia ser …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.