Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
O AdaBoost é menos ou mais propenso a sobreajuste?
Eu li várias declarações (aparentemente) contraditórias, independentemente de o AdaBoost (ou outras técnicas de reforço) ser menos ou mais propenso a sobreajuste em comparação com outros métodos de aprendizado. Existem boas razões para acreditar em um ou outro? Se depende, do que depende? Quais são as razões pelas quais o …

2
Existe um estimador imparcial da distância de Hellinger entre duas distribuições?
Em um cenário em que se observa X1,…,XnX1,…,XnX_1,\ldots,X_n distribuído a partir de uma distribuição com densidade fff , gostaria de saber se existe um estimador imparcial (baseado nos XiXiX_i ) da distância de Hellinger a outra distribuição com densidade f0f0f_0 , ou seja, H(f,f0)={1−∫Xf(x)f0(x)−−−−−−−−√dx}1/2.H(f,f0)={1−∫Xf(x)f0(x)dx}1/2. \mathfrak{H}(f,f_0) = \left\{ 1 - \int_\mathcal{X} …



2
Métodos de re-amostragem de sinal de intercalação
Estou usando a biblioteca caretem R para testar vários procedimentos de modelagem. O trainControlobjeto permite especificar um método de re-amostragem. Os métodos são descritos na documentação secção de 2,3 e incluem: boot, boot632, cv, LOOCV, LGOCV, repeatedcve oob. Embora alguns deles sejam fáceis de inferir, nem todos esses métodos estão …
20 r  resampling  caret 





6
Quando descartar um termo de um modelo de regressão?
Alguém poderia aconselhar se o seguinte faz sentido: Estou lidando com um modelo linear comum com 4 preditores. Estou pensando em abandonar o termo menos significativo. O valor de é um pouco acima de 0,05. Argumentei a favor de abandoná-lo ao longo destas linhas: Multiplicar a estimativa deste termo por …


8
Idéias para o software "lab notebook"?
Portanto, este é um ajuste estranho, embora realmente eu pense que seja um ajuste estranho para qualquer site, então pensei em experimentar aqui, entre meus irmãos que processam dados. Cheguei à epidemiologia e bioestatística da biologia e ainda tenho alguns hábitos desse campo. Um deles é manter um caderno de …

3
Teste da significância dos picos na densidade espectral
Às vezes usamos gráficos de densidade espectral para analisar a periodicidade em séries temporais. Normalmente, analisamos o gráfico por inspeção visual e, em seguida, tentamos tirar uma conclusão sobre a periodicidade. Mas os estatísticos desenvolveram algum teste para verificar se algum pico no gráfico é estatisticamente diferente do ruído branco? …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.