Teste de hipóteses e significado para séries temporais

Um teste usual de significância ao observar duas populações é o teste t, teste t pareado, se possível. Isso pressupõe que a distribuição é normal.

Existem suposições simplificadoras semelhantes que produzem um teste de significância para uma série temporal? Especificamente, temos duas populações razoavelmente pequenas de camundongos que estão sendo tratados de maneira diferente e medimos o peso uma vez por semana. Ambos os gráficos exibem funções crescentes sem problemas, com um gráfico definitivamente acima do outro. Como quantificamos a "definitividade" nesse contexto?

A hipótese nula deve ser que os pesos das duas populações "se comportem da mesma maneira" com o passar do tempo. Como se pode formular isso em termos de um modelo simples que é bastante comum (assim como as distribuições normais são comuns) com apenas um pequeno número de parâmetros? Uma vez feito isso, como podemos medir a significância ou algo análogo aos valores-p? Que tal emparelhar os ratos, combinando o maior número possível de características, com cada par tendo um representante de cada uma das duas populações?

Gostaria de receber um ponteiro para algum livro ou artigo relevante, bem escrito e de fácil compreensão sobre séries temporais. Eu começo como um ignorante. Obrigado pela ajuda.

David Epstein

time-series hypothesis-testing statistical-significance

— David Epstein
fonte

Você pode querer lançar uma rede mais ampla, porque essa não é necessariamente uma questão de série temporal. De fato, talvez a questão mais fundamental aqui se refira à maneira melhor ou pelo menos correta de quantificar um "ponto final" de tratamento: é o crescimento médio de uma população após um certo tempo, as taxas médias de crescimento ao longo do tempo, etc.? Se você não sabia disso antes de iniciar o experimento e repentinamente notava diferenças consistentes nas curvas de crescimento , estava trabalhando em um modo exploratório , não confirmatório, e os valores de p de teste de hipóteses serão enganosamente bons.

— whuber

O resultado é qualitativamente conforme o esperado, e um teste unilateral parece apropriado. O motivo pelo qual perguntei sobre séries temporais é que, se alguém mede apenas o peso final (que é a medida mais relevante), então está jogando fora todas as informações de pontos temporais anteriores, e isso parece errado.

— David Epstein #

Você está certo: você não quer jogar fora esses dados. Porém, técnicas de séries temporais vêm à tona para modelos de dados em que as correlações temporais de desvios das curvas idealizadas são importantes, por interesse próprio ou porque podem interferir em uma boa estimativa. É provável que sua situação não se enquadre em nenhum desses casos. Métodos mais simples e cientificamente significativos estão disponíveis.

— whuber

@ whuber, não é o peso ao longo do tempo do conjunto de controle de ratos uma "curva idealizada" em algum sentido? Ou pelo menos, um modelo teórico ajustado a esses dados?

— precisa saber é o seguinte

Sim, @naught, essa é uma maneira razoável de ver as coisas. Mas "curva" não é o mesmo que "série temporal". Por exemplo, a regressão linear pode ser (e geralmente é) vista como curvas ajustadas aos dados, mas é separada da análise de séries temporais, que enfatiza a estrutura das correlações entre os desvios entre os dados e a curva idealizada.

— whuber

Respostas:

Existem várias maneiras de fazer isso, se você pensar nas variações de peso como um processo dinâmico.

Por exemplo, ele pode ser modelado como um integrador $\dot x(t) = \theta x(t) + v(t)$

onde é a variação de peso, se relaciona com a rapidez com que o peso muda e é um distúrbio estocástico que pode afetar a variação de peso. Você pode modelar como , para um conhecido (você também pode estimar). $x(t)$ $\theta$ $v(t)$ $v(t)$ $\mathcal N(0,Q)$ $Q$

A partir daqui, você pode tentar identificar o parâmetro para as duas populações (e sua covariância), usando, por exemplo, um método de erro de previsão. Se a suposição gaussiana for mantida, os métodos de erro de previsão indicarão que a estimativa de também é gaussiana (assintoticamente) e, portanto, é possível construir um teste de hipótese para determinar se a estimativa de é estatisticamente próxima da . $\theta$ $\theta$ $\theta_1$ $\theta_2$

Para uma referência, posso sugerir este livro .

— andrecb
fonte

Eu sugeriria a identificação de um modelo ARIMA para cada camundongo separadamente e, em seguida, os revisaria quanto a similaridades e generalização. Por exemplo, se o primeiro mouse tiver um AR (1) e o segundo um AR (2), o modelo mais geral (maior) seria um AR (2). Estime esse modelo globalmente, ou seja, para as séries temporais combinadas. Compare a soma dos quadrados dos erros do conjunto combinado com a soma das duas somas dos quadrados dos erros individuais para gerar um valor F para testar a hipótese de parâmetros constantes entre os grupos. Desejo que você possa postar seus dados e ilustrarei esse teste com precisão.

COMENTÁRIOS ADICIONAIS:

Como o conjunto de dados é correlacionado automaticamente, a normalidade não se aplica. Se as observações forem independentes ao longo do tempo, pode-se aplicar alguns dos métodos conhecidos de séries não-temporais. Em termos de sua solicitação sobre um livro de fácil leitura sobre séries temporais, sugiro o texto Wei de Addison-Wesley. Os cientistas sociais acharão a abordagem não matemática de Mcleary e Hay (1980) mais intuitiva, mas sem rigor.

— IrishStat
fonte

Isso realmente não parece abordar as questões fundamentais. (1) Por que esse modelo é apropriado? (2) Por que cada mouse deve ser modelado e não, digamos, os pesos médios da população ou ganhos em pesos? (3) Por que um teste de parâmetros constantes é relevante? A pergunta implora por um teste unilateral. A maioria dos parâmetros mencionados não parece cientificamente relevante, nem quantificam diretamente a sensação de um gráfico estar consistentemente acima do outro. (4) Como você controla possíveis diferenças nas características das duas populações no início do experimento?

— whuber

: whuber O teste para a constância dos parâmetros é relevante porque você tem um conjunto de coeficientes para o primeiro grupo de leituras do mouse 1 e um segundo conjunto de coeficientes para o segundo mouse. A questão é "existe uma diferença coletivamente significativa entre os coeficientes". como um dos coeficientes do modelo pode ser uma constante e, se for, a diferença entre os coeficientes pode ser devida ao fato de as constantes serem estatisticamente diferentes umas das outras. Observe que o modelo ARIMA subjacente pode não necessariamente ter constantes, pode ser um modelo de diferença.

— precisa saber é o seguinte

Acho que você está parcialmente certo, mas precisa refinar sua caracterização do problema. Muitos dos coeficientes do ARIMA podem ser cientificamente irrelevantes. Por exemplo, se um deles age como um termo quadrático ao longo do tempo, uma diferença pode dizer algo sobre a forma das curvas de crescimento, mas isso pode ser de pouca utilidade. Se alguém escolher os coeficientes para refletir o (s) ponto final (s) experimental (s) e testá- los apenas , algum bem poderá ser alcançado. Em geral, porém, os modelos de séries temporais introduzem coeficientes (por exemplo, autocorrelação) que provavelmente não têm interesse científico direto aqui.

— whuber

whuber: "Se alguém escolhe coeficientes para refletir o (s) ponto final (s) experimental (s) e apenas os testa, algum bem pode ser alcançado com isso" não faz muito sentido para mim, pois ignora os pontos intermediários. Ao contrário do seu comentário, o modo de série temporal e seus coeficientes são de interesse científico significativo, pois caracterizam a distribuição das leituras e as convertem em um processo aleatório (o termo do erro), livre de estrutura autocorrelativa e, em seguida, passível de testes exigindo normalidade. O teste que proponho exige que essa suposição seja mantida.

— IrishStat

A autocorrelação pode ter pouca importância aqui. O interesse se concentra explicitamente nas tendências: como as curvas de crescimento subjacentes tendem a diferir entre as duas populações? Parâmetros de autocorrelação são parâmetros incômodos, que devem ser introduzidos e tratados apenas na medida em que possam ajudar a melhorar a estimativa dessas curvas de crescimento. A primeira prioridade é adotar um modelo científico de crescimento, representá-lo com parâmetros interpretáveis e de interesse e estimar . A aplicação automática de técnicas de séries temporais dificilmente conseguirá isso.

— whuber