Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados




1
One-vs-All e One-vs-One em svm?
Qual é a diferença entre um classificador SVM one-vs-all e one-vs-one? O one-vs-all significa um classificador para classificar todos os tipos / categorias da nova imagem e one-vs-one significa que cada tipo / categoria da nova imagem é classificada com classificador diferente (cada categoria é tratada por um classificador especial)? …

5
Explicação intuitiva da convergência na distribuição e convergência na probabilidade
Qual é a diferença intuitiva entre uma variável aleatória convergindo em probabilidade versus uma variável aleatória convergindo em distribuição? Eu li várias definições e equações matemáticas, mas isso realmente não ajuda. (Lembre-se de que sou estudante de graduação em economia). Como uma variável aleatória pode convergir para um único número, …


4
A diferença de kernels no SVM?
Alguém pode me dizer a diferença entre os kernels no SVM: Linear Polinomial Gaussiano (RBF) Sigmoid Porque, como sabemos, o kernel é usado para mapear nosso espaço de entrada no espaço de recursos de alta dimensionalidade. E nesse espaço de recursos, encontramos o limite linearmente separável. Quando eles são usados …

7
Teste de hipótese de distribuição - qual é o sentido de fazê-lo se você não pode "aceitar" sua hipótese nula?
Vários testes de hipóteses, como o GOF, Kolmogorov-Smirnov, Anderson-Darling etc., seguem este formato básico:χ2χ2\chi^{2} H0 0H0 0H_0 : Os dados seguem a distribuição fornecida. H1 1H1 1H_1 : Os dados não seguem a distribuição fornecida. Normalmente, avalia-se a afirmação de que alguns dados dados seguem alguma distribuição dada e, se …


2
Por que o LDA scikit-learn do Python não está funcionando corretamente e como ele calcula o LDA via SVD?
Eu estava usando a Análise Discriminante Linear (LDA) da scikit-learnbiblioteca de aprendizado de máquina (Python) para redução de dimensionalidade e fiquei um pouco curioso sobre os resultados. Gostaria de saber agora o que o LDA scikit-learnestá fazendo para que os resultados pareçam diferentes, por exemplo, de uma abordagem manual ou …


2
Estimar quantil de valor em um vetor
Eu tenho um conjunto de números reais. Preciso estimar o quantil de um novo número. Existe alguma maneira limpa de fazer isso no R? em geral? Espero que isso não seja ultra-trivial ;-) Muito apreciado pela sua resposta. PK
26 r 

2
Como calcular SVD de uma enorme matriz esparsa?
Qual é a melhor maneira de calcular a decomposição de valor singular (SVD) de uma matriz positiva muito grande (65M x 3,4M) em que os dados são extremamente escassos? Menos de 0,1% da matriz é diferente de zero. Eu preciso de uma maneira que: caberá na memória (eu sei que …
26 svd  numerics 


2
Diagnóstico de colinearidade problemático somente quando o termo de interação é incluído
Fiz uma regressão em condados dos EUA e estou verificando a colinearidade em minhas variáveis ​​'independentes'. O diagnóstico de regressão de Belsley, Kuh e Welsch sugere analisar as proporções de decomposição do índice de condições e da decomposição de variância: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.