Perguntas com a marcação «high-dimensional»

Pertence a um grande número de recursos ou dimensões (variáveis) para dados. (Para um grande número de pontos de dados, use a tag [dados grandes]; se o problema for um número maior de variáveis ​​que os dados, use a tag [indeterminada].)



1
Dados correlacionados de alta dimensão e principais recursos / covariáveis ​​descobertos; teste de múltiplas hipóteses?
Eu tenho um conjunto de dados com cerca de 5.000 recursos / covariáveis ​​frequentemente correlacionados e uma resposta binária. Os dados foram dados para mim, eu não os coletei. Uso Lasso e aumento de gradiente para construir modelos. Eu uso a validação cruzada iterada e aninhada. Relato os maiores coeficientes …





2
Gerando um conjunto de dados de alta dimensão onde o vizinho mais próximo se torna sem sentido
No artigo " Quando o 'vizinho mais próximo' é significativo? ", Lemos que, Mostramos que, sob certas condições amplas (em termos de distribuição de dados e consultas ou carga de trabalho), à medida que a dimensionalidade aumenta, a distância do vizinho mais próximo se aproxima da distância do vizinho mais …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.