Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Uma transformação de log é uma técnica válida para testar dados não normais?
Ao revisar um artigo, os autores declaram: "As variáveis ​​de resultados contínuos que exibem uma distribuição distorcida foram transformadas, usando os logaritmos naturais, antes de os testes t serem conduzidos para satisfazer as premissas de pré-requisito da normalidade". Essa é uma maneira aceitável de analisar dados não normais, principalmente se …



3
Aprendizagem semi-supervisionada, aprendizagem ativa e aprendizagem profunda para classificação
Edição final com todos os recursos atualizados: Para um projeto, estou aplicando algoritmos de aprendizado de máquina para classificação. Desafio: dados rotulados bastante limitados e muito mais dados não rotulados. Metas: Aplicar classificação semi-supervisionada Aplique um processo de rotulagem semi-supervisionado (conhecido como aprendizado ativo) Encontrei muitas informações de trabalhos de …


5
Analógico 2D de desvio padrão?
Considere o seguinte experimento: um grupo de pessoas recebe uma lista de cidades e solicita que marque os locais correspondentes em um mapa do mundo (não marcado). Para cada cidade, você receberá uma dispersão de pontos aproximadamente centralizados na respectiva cidade. Algumas cidades, como Istambul, exibem menos dispersão do que …






7
Média de uma janela deslizante em R
Eu tenho um vetor de valores que gostaria de relatar a média nas janelas ao longo de um slide menor. Por exemplo, para um vetor dos seguintes valores: 4, 5, 7, 3, 9, 8 Um tamanho de janela de 3 e um slide de 2 faria o seguinte: (4+5+7)/3 = …
19 r 



2
Por que é necessário colher amostras da distribuição posterior, se já sabemos a distribuição posterior?
Meu entendimento é que, ao usar uma abordagem bayesiana para estimar valores de parâmetros: A distribuição posterior é a combinação da distribuição anterior e da distribuição de probabilidade. Simulamos isso gerando uma amostra da distribuição posterior (por exemplo, usando um algoritmo Metropolis-Hasting para gerar valores, e os aceitamos se estiverem …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.