Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



2
Existe um intervalo de confiança não paramétrico confiável para a média de uma distribuição distorcida?
Distribuições muito distorcidas, como o log-normal, não resultam em intervalos precisos de confiança na inicialização. Aqui está um exemplo que mostra que as áreas da cauda esquerda e direita estão longe do valor ideal de 0,025, independentemente do método de inicialização que você tenta no R: require(boot) n <- 25 …

2
Aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço: princípios básicos do fluxo de trabalho
Aprendizado supervisionado 1) Um humano constrói um classificador com base na entrada e saída de dados 2) Esse classificador é treinado com um conjunto de dados de treinamento 3) Esse classificador é testado com um conjunto de dados de teste 4) Implantação se a saída for satisfatória Para ser usado …


2
Qual é a diferença entre censura e truncamento?
No livro Modelos Estatísticos e Métodos para Dados da Vida , está escrito: Censura: Quando uma observação é incompleta devido a alguma causa aleatória. Truncamento: quando a natureza incompleta da observação se deve a um processo de seleção sistemático inerente ao desenho do estudo. O que se entende por "processo …

7
Inferência vs. estimativa?
Quais são as diferenças entre "inferência" e "estimativa" no contexto do aprendizado de máquina ? Como um novato, sinto que inferimos variáveis ​​aleatórias e estimamos os parâmetros do modelo. Meu entendimento está correto? Caso contrário, quais são exatamente as diferenças e quando devo usar quais? Além disso, qual é o …

13
Qual é a intuição por trás da fórmula para probabilidade condicional?
A fórmula para a probabilidade condicional de acontecer, dado que aconteceu é:UMAUMA\text{A}BB\text{B}P( A | B ) = P( A ∩ B )P(B).P(A | B)=P(A∩B)P(B). P\left(\text{A}~\middle|~\text{B}\right)=\frac{P\left(\text{A} \cap \text{B}\right)}{P\left(\text{B}\right)}. Meu livro explica a intuição por trás disso em termos de um diagrama de Venn. Dado que ocorreu , a única maneira de …






6
Se 'correlação não implica causalidade', se eu encontrar uma correlação estatisticamente significativa, como posso provar a causalidade?
Entendo que correlação não é causalidade . Suponha que obtemos alta correlação entre duas variáveis. Como você verifica se essa correlação é realmente por causa de causalidade? Ou, sob quais condições, exatamente, podemos usar dados experimentais para deduzir uma relação causal entre duas ou mais variáveis?


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.