Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

1
lme () e lmer () dando resultados conflitantes
Eu tenho trabalhado com alguns dados que têm alguns problemas com medições repetidas. Ao fazer isso, notei um comportamento muito diferente entre lme()e lmer()usando meus dados de teste e quero saber o porquê. O conjunto de dados falsos que criei possui medidas de altura e peso para 10 indivíduos, tiradas …

3
Encontrando uma maneira de simular números aleatórios para esta distribuição
Eu estou tentando escrever um programa em R que simula números pseudo-aleatórios de uma distribuição com a função de distribuição cumulativa: F(x)=1−exp(−ax−bp+1xp+1),x≥0F(x)=1−exp⁡(−ax−bp+1xp+1),x≥0F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0 ondea,b>0,p∈(0,1)a,b>0,p∈(0,1)a,b>0, p \in (0,1) Tentei amostragem por transformada inversa, mas a inversa não parece analiticamente solucionável. Ficaria feliz se você pudesse sugerir …


9
Overfitting e Underfitting
Fiz algumas pesquisas sobre sobreaquecimento e desajustamento e compreendi o que elas são exatamente, mas não consigo encontrar os motivos. Quais são as principais razões para sobreajustar e não adequar? Por que enfrentamos esses dois problemas no treinamento de um modelo?


2
FPR (taxa de falsos positivos) vs FDR (taxa de descobertas falsas)
A citação a seguir vem do famoso artigo de pesquisa Estatística significativa para estudos genômicos de Storey & Tibshirani (2003): Por exemplo, uma taxa de falso positivo de 5% significa que, em média, 5% dos recursos verdadeiramente nulos no estudo serão considerados significativos. Um FDR (taxa de descoberta falsa) de …


3
Entendendo o parâmetro input_shape no LSTM com Keras
Estou tentando usar o exemplo descrito na documentação do Keras chamada "LSTM empilhado para classificação de sequência" (consulte o código abaixo) e não consigo descobrir o input_shapeparâmetro no contexto dos meus dados. Eu tenho como entrada uma matriz de sequências de 25 caracteres possíveis codificados em números inteiros para uma …
20 lstm  keras  shape  dimensions 


5
Um exemplo em que o princípio da probabilidade realmente importa?
Existe um exemplo em que dois testes defensáveis ​​diferentes com probabilidades proporcionais levariam um a inferências marcadamente diferentes (e igualmente defensáveis), por exemplo, onde os valores-p estão em ordem de grandeza distante, mas o poder de alternativas é semelhante? Todos os exemplos que vejo são muito tolos, comparando um binômio …


1
Existe alguma explicação intuitiva sobre por que a regressão logística não funciona para um caso de separação perfeito? E por que adicionar regularização irá corrigi-lo?
Temos muitas boas discussões sobre a separação perfeita na regressão logística. Por exemplo, a regressão logística em R resultou em perfeita separação (fenômeno de Hauck-Donner). O que agora? e o modelo de regressão logística não converge . Pessoalmente, ainda acho que não é intuitivo por que será um problema e …

1
Das redes bayesianas às redes neurais: como a regressão multivariada pode ser transposta para uma rede de várias saídas
Estou lidando com um modelo linear hierárquico bayesiano , aqui a rede que o descreve. YYY representa as vendas diárias de um produto em um supermercado (observado). XXX é uma matriz conhecida de regressores, incluindo preços, promoções, dia da semana, clima e feriados. SSS é o nível de estoque latente …

2
Prova de que a estatística F segue a distribuição F
À luz desta pergunta: Prova de que os coeficientes em um modelo OLS seguem uma distribuição t com (nk) graus de liberdade Eu adoraria entender por que F=(TSS−RSS)/(p−1)RSS/(n−p),F=(TSS−RSS)/(p−1)RSS/(n−p), F = \frac{(\text{TSS}-\text{RSS})/(p-1)}{\text{RSS}/(n-p)}, onde é o número de parâmetros de modelo e o número de observações e da variância total, a variância …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.