Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


2
Como você faz bootstrap com dados de séries temporais?
Recentemente, aprendi sobre o uso de técnicas de inicialização para calcular erros padrão e intervalos de confiança para estimadores. O que eu aprendi foi que, se os dados são IID, você pode tratar os dados da amostra como a população e fazer amostragens com substituição, o que permitirá obter várias …




1
Se eu gerar uma matriz simétrica aleatória, qual é a chance de ela ser definitiva positiva?
Eu tive uma pergunta estranha quando estava experimentando algumas otimizações convexas. A questão é: Suponha que eu aleatoriamente (digamos distribuição normal padrão) gere uma matriz simétrica (por exemplo, eu gere matriz triangular superior e preencha a metade inferior para garantir que seja simétrica), qual é a chance de ser uma …


6
Existem exemplos de onde o teorema do limite central não se sustenta?
A Wikipedia diz - Na teoria da probabilidade, o teorema do limite central (CLT) estabelece que, na maioria das situações , quando variáveis ​​aleatórias independentes são adicionadas, sua soma adequadamente normalizada tende a uma distribuição normal (informalmente uma "curva de sino"), mesmo que as próprias variáveis ​​originais não sejam distribuído …

2
As redes contraditórias generativas foram introduzidas por Jürgen Schmidhuber?
Eu li em https://en.wikipedia.org/wiki/Generative_adversarial_networks : [Redes adversárias generativas] foram introduzidas por Ian Goodfellow et al em 2014. mas Jurgen Schmidhuber afirma ter realizado um trabalho semelhante anteriormente nessa direção (por exemplo, houve algum debate no NIPS 2016 durante o tutorial de redes adversárias generativas: https://channel9.msdn.com/Events/Neural-Information-Processing-Systems- Conferência / Sistemas de processamento …



2
As variáveis ​​altamente correlacionadas na floresta aleatória não distorcem a precisão e a seleção de recursos?
No meu entendimento, variáveis ​​altamente correlacionadas não causarão problemas de multicolinearidade no modelo aleatório de floresta (por favor, corrija-me se estiver errado). No entanto, por outro lado, se eu tiver muitas variáveis ​​contendo informações semelhantes, o modelo pesará muito nesse conjunto e não nos outros? Por exemplo, existem dois conjuntos …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.