Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Quando devemos discretizar / classificar variáveis ​​/ recursos independentes contínuos e quando não devemos?
Quando devemos discretizar / bin variáveis ​​/ recursos independentes e quando não devemos? Minhas tentativas de responder à pergunta: Em geral, não devemos fazer bin, porque o binning perderá informações. Na verdade, o binning está aumentando o grau de liberdade do modelo; portanto, é possível causar um ajuste excessivo após …

1
t-SNE versus MDS
Ultimamente, tenho lido algumas perguntas sobre t-SNE ( Incorporação estocástica de vizinhos t-distribuídos ) e também visitou algumas perguntas sobre MDS ( Multidimensional Scaling ). Eles costumam ser usados ​​de forma análoga; portanto, parecia uma boa idéia fazer essa pergunta, pois há muitas perguntas sobre as duas separadamente (ou comparadas …

7
Alguém pode ajudar a explicar a diferença entre independente e aleatória?
Nas estatísticas, independente e aleatório descrevem as mesmas características? Qual a diferença entre eles? Geralmente encontramos a descrição como "duas variáveis ​​aleatórias independentes" ou "amostragem aleatória". Eu estou querendo saber qual é a diferença exata entre eles. Alguém pode explicar isso e dar alguns exemplos? por exemplo, processo não independente, …



4
Os algoritmos de Machine Learning ou Deep Learning podem ser utilizados para "melhorar" o processo de amostragem de uma técnica de MCMC?
Com base no pouco conhecimento que tenho dos métodos MCMC (cadeia de Markov Monte Carlo), entendo que a amostragem é uma parte crucial da técnica mencionada acima. Os métodos de amostragem mais comumente usados ​​são Hamiltoniano e Metrópole. Existe uma maneira de utilizar o aprendizado de máquina ou mesmo o …





2
Impulsionando redes neurais
Bem, recentemente, eu estava trabalhando no aprendizado de algoritmos de impulso, como adaboost, aumento de gradiente, e eu sabia que o mais comumente usado é o árvores. Eu realmente quero saber se existem alguns exemplos bem-sucedidos recentes (refiro-me a alguns artigos ou artigos) para o uso de redes neurais como …

1
Bootstrapping vs Bayesian Bootstrapping conceitualmente?
Estou com problemas para entender o que é um processo bayesiano de inicialização e como isso seria diferente da inicialização normal. E se alguém pudesse oferecer uma revisão intuitiva / conceitual e uma comparação de ambos, isso seria ótimo. Vamos dar um exemplo. Digamos que temos um conjunto de dados …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.