Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



4
Pergunta da entrevista da ameba
Fiz essa pergunta durante uma entrevista para uma posição comercial com uma empresa comercial proprietária. Eu gostaria muito de saber a resposta a esta pergunta e a intuição por trás dela. Pergunta da ameba: Uma população de amebas começa com 1. Após 1 período, a ameba pode se dividir em …

2
Como lidar com a análise de dados exploratória e a dragagem de dados em estudos de pequenas amostras?
A análise exploratória de dados (EDA) geralmente leva a explorar outras "trilhas" que não pertencem necessariamente ao conjunto inicial de hipóteses. Eu enfrento essa situação no caso de estudos com um tamanho de amostra limitado e muitos dados coletados através de diferentes questionários (dados sociodemográficos, escalas neuropsicológicas ou médicas - …

2
Confiabilidade entre avaliadores para dados ordinais ou com intervalo
Quais métodos de confiabilidade entre avaliadores são mais apropriados para dados ordinais ou com intervalo? Eu acredito que "Probabilidade conjunta de concordância" ou "Kappa" são projetadas para dados nominais. Embora "Pearson" e "Spearman" possam ser usados, eles são usados ​​principalmente para dois avaliadores (embora possam ser usados ​​para mais de …


3
Gradiente de perda de dobradiça
Estou tentando implementar a descida básica do gradiente e estou testando-a com uma função de perda de dobradiça, ou seja, lhinge=max(0,1−y x⋅w)lhinge=max(0,1−y x⋅w)l_{\text{hinge}} = \max(0,1-y\ \boldsymbol{x}\cdot\boldsymbol{w}) . No entanto, estou confuso sobre o gradiente da perda de dobradiça. Estou com a impressão de que é ∂∂wlhinge={−y x0if y x⋅w<1if y …

3
Aplicação de wavelets a algoritmos de detecção de anomalias baseados em séries temporais
Comecei a trabalhar nos tutoriais de mineração de dados estatísticos de Andrew Moore (altamente recomendado para quem mais se aventurar nesse campo). Comecei lendo este PDF extremamente interessante, intitulado "Visão geral introdutória dos algoritmos de detecção de anomalias baseados em séries temporais", nos quais Moore acompanha muitas das técnicas usadas …

7
Qual é a diferença entre uma probabilidade e uma proporção?
Digamos que eu como hambúrgueres toda terça-feira há anos. Você poderia dizer que eu como hambúrgueres 14% das vezes, ou que a probabilidade de eu comer um hambúrguer em uma determinada semana é de 14%. Quais são as principais diferenças entre probabilidades e proporções? Uma probabilidade é uma proporção esperada? …

5
Procurando certo tipo de explicação ARIMA
Pode ser difícil de encontrar, mas eu gostaria de ler um exemplo bem explicado do ARIMA que usa matemática mínima estende a discussão para além da construção de um modelo, usando-o para prever casos específicos usa gráficos e resultados numéricos para caracterizar o ajuste entre os valores previstos e reais.



3
LASSO com termos de interação - tudo bem se os principais efeitos forem reduzidos a zero?
A regressão LASSO reduz os coeficientes para zero, fornecendo, assim, uma seleção de modelo eficaz. Eu acredito que em meus dados existem interações significativas entre covariáveis ​​nominais e contínuas. Não necessariamente, porém, são os 'efeitos principais' do modelo verdadeiro significativos (diferentes de zero). Claro que não sei disso, pois o …


6
Para problemas convexos, o gradiente na descida do gradiente estocástico (SGD) sempre aponta para o valor extremo global?
Dada uma função de custo convexa, usando o SGD para otimização, teremos um gradiente (vetor) em um determinado ponto durante o processo de otimização. Minha pergunta é, dado o ponto no convexo, o gradiente apenas aponta na direção em que a função aumenta / diminui mais rapidamente, ou o gradiente …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.