Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados




10
Melhor termo para dados inventados?
Estou escrevendo um exemplo e inventei alguns dados. Quero que fique claro para o leitor que não se trata de dados reais, mas também não quero dar a impressão de malícia, pois serve apenas como exemplo. Não existe nenhum componente (pseudo) aleatório para esses dados em particular, então parece-me que …

3
A redução de dimensionalidade para visualização deve ser considerada um problema "fechado", resolvido pelo t-SNE?
Eu tenho lido muito sobre o algoritmo sne para redução de dimensionalidade. Estou muito impressionado com o desempenho em conjuntos de dados "clássicos", como o MNIST, onde ele consegue uma separação clara dos dígitos ( consulte o artigo original ):ttt Também o usei para visualizar os recursos aprendidos por uma …

4
Problema de Monty Hall com um Monty falível
Monty sabia perfeitamente se a Porta tinha uma cabra atrás dela (ou estava vazia). Este fato permite ao jogador dobrar sua taxa de sucesso ao longo do tempo, trocando "palpites" para a outra porta. E se o conhecimento de Monty fosse menos que perfeito? E se, às vezes, o prêmio …



4
Por que os algoritmos de otimização são definidos em termos de outros problemas de otimização?
Estou pesquisando técnicas de otimização para aprendizado de máquina, mas fico surpreso ao descobrir que um grande número de algoritmos de otimização é definido em termos de outros problemas de otimização. Ilustro alguns exemplos a seguir. Por exemplo, https://arxiv.org/pdf/1511.05133v1.pdf Tudo parece bom e bom, mas há esse na atualização .... …

1
Propriedades do PCA para observações dependentes
Normalmente, usamos o PCA como uma técnica de redução de dimensionalidade para dados em que casos são considerados iid Pergunta: Quais são as nuances típicas na aplicação do PCA para dados dependentes e não-iid? Quais propriedades agradáveis ​​/ úteis do PCA mantidas para dados iid estão comprometidas (ou perdidas totalmente)? …

1
Keras, como funciona o decaimento da taxa de aprendizado SGD?
Se você consultar a documentação http://keras.io/optimizers/, há um parâmetro no SGD para deterioração. Eu sei que isso reduz a taxa de aprendizado ao longo do tempo. No entanto, não consigo descobrir como funciona exatamente. É um valor multiplicado pela taxa de aprendizado, como lr = lr * (1 - decay) …




2
O modelo final (pronto para produção) deve ser treinado em dados completos ou apenas no conjunto de treinamento?
Suponha que eu tenha treinado vários modelos no conjunto de treinamento, escolha o melhor usando o conjunto de validação cruzada e o desempenho medido no conjunto de teste. Então agora eu tenho um melhor modelo final. Devo treiná-lo novamente em todos os dados disponíveis ou enviar soluções treinadas apenas no …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.