Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

1
Conjuntos de dados do tipo Anscombe com a mesma caixa e gráfico de bigodes (média / padrão / mediana / MAD / min / max)
EDIT: Como esta pergunta foi inflada, um resumo: encontrando diferentes conjuntos de dados significativos e interpretáveis ​​com as mesmas estatísticas mistas (média, mediana, faixa intermediária e suas dispersões associadas e regressão). O quarteto de Anscombe (consulte Objetivo da visualização de dados de alta dimensão? ) É um exemplo famoso de …


2
Técnicas de aumento de dados para conjuntos de dados gerais?
Em muitas aplicações de aprendizado de máquina, os chamados métodos de aumento de dados permitiram construir modelos melhores. Por exemplo, assuma um conjunto de treinamento de imagens de cães e gatos. Girando, espelhando, ajustando o contraste, etc., é possível gerar imagens adicionais a partir das originais.100100100 No caso de imagens, …

1
Quando usar GLMs binomiais de Poisson vs. geométricos vs. negativos para dados de contagem?
Estou tentando fazer um layout para mim mesmo quando é apropriado usar qual tipo de regressão (geométrico, Poisson, binomial negativo) com dados de contagem, dentro da estrutura GLM (apenas 3 das 8 distribuições GLM são usadas para dados de contagem, embora a maioria do que Eu li centros em torno …



2
Essa distribuição discreta tem um nome?
Essa distribuição discreta tem um nome? Para i ∈ 1 ... NEu∈1 ...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} Eu me deparei com essa distribuição a partir do seguinte: Eu tenho uma lista de NNN itens classificados por alguma função de utilitário. Eu quero selecionar aleatoriamente um …




2
Quadrado R na regressão quantílica
Estou usando a regressão quantílica para encontrar preditores do percentil 90 dos meus dados. Estou fazendo isso no R usando o quantregpacote. Como posso determinar r2r2r^2 para a regressão quantílica, que indicará quanto da variabilidade está sendo explicado pelas variáveis ​​preditoras? O que eu realmente quero saber: "Qualquer método que …

3
Da regra de Perceptron à Descida de Gradiente: Como os Perceptrons com uma função de ativação sigmóide são diferentes da Regressão Logística?
Essencialmente, minha pergunta é que, nos Perceptrons multicamadas, os perceptrons são usados ​​com uma função de ativação sigmóide. De modo que na regra de actualização y é calculado comoy^y^\hat{y} y^=11+exp(−wTxi)y^=11+exp⁡(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} Como esse Perceptron "sigmóide" difere de uma regressão logística então? Eu diria que um perceptron sigmóide de camada …

3
Distribuição do maior fragmento de uma vara quebrada (espaçamentos)
Que um pedaço de comprimento 1 seja quebrado em fragmentos uniformemente aleatoriamente. Qual é a distribuição do comprimento do fragmento mais longo?k+1k+1k+1 Mais formalmente, sejam IID e sejam as estatísticas de pedidos associadas, ou seja , simplesmente solicitamos a amostra de maneira que . Deixe .(U1,…Uk)(U1,…Uk)(U_1, \ldots U_k)U(0,1)U(0,1)U(0,1)(U(1),…,U(k))(U(1),…,U(k))(U_{(1)}, \ldots, U_{(k)})U(1)≤U(2)≤,…,≤U(k)U(1)≤U(2)≤,…,≤U(k)U_{(1)} …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.