Como você disse, a tendência nos dados de exemplo é óbvia. Se você deseja justificar esse fato apenas pelo teste de hipóteses, além de usar regressão linear (a escolha paramétrica óbvia), pode usar o teste não paramétrico de Mann-Kendall para tendência monotônica. O teste é usado para
avaliar se existe uma tendência monotônica para cima ou para baixo da variável de interesse ao longo do tempo. Uma tendência monotônica para cima (para baixo) significa que a variável aumenta consistentemente (diminui) ao longo do tempo, mas a tendência pode ou não ser linear. ( http://vsp.pnnl.gov/help/Vsample/Design_Trend_Mann_Kendall.htm )
além disso, como observado por Gilbert (1987), o teste
é particularmente útil, pois valores ausentes são permitidos e os dados não precisam estar em conformidade com nenhuma distribuição específica
A estatística do teste é a diferença entre as diferenças negativas e positivas entre todos os pares possíveis, ou seja,xj−xin(n−1)/2
S=∑i=1n−1∑j=i+1nsgn(xj−xi)
onde é uma função de sinal . pode ser usado para calcular estatísticas semelhantes à correlação, pois variam de a , onde o sinal sugere tendência negativa ou positiva e o valor de é proporcional à inclinação da tendência.sgn(⋅)S τ−1+1τ
τ=Sn(n−1)/2
Finalmente, você pode calcular os valores de . Para amostras de tamanho você pode usar tabelas de valores pré-computados para diferentes valores de e diferentes tamanhos de amostra (ver Gilbert, 1987). Com amostras maiores, primeiro você precisa calcular a variação depn≤10pSS
var(S)=118[n(n−1)(2n+5)−∑p=1gtp(tp−1)(2tp+5)]
e depois calcular a estatística de testeZMK
ZMK=⎧⎩⎨⎪⎪⎪⎪S−1var(S)0S+1var(S)if S>0if S=0if S<0
o valor de é comparado aos valores normais padrão ZMK
- ZMK≥Z1−α para tendência de alta,
- ZMK≤−Z1−α para tendência de queda,
- |ZMK|≥Z1−α/2 para tendência ascendente ou descendente.
Em esta discussão pode encontrar código R implementação deste teste.
Como a estatística é comparada com todos os pares possíveis de observações, em vez de usar a aproximação normal para o valor você pode usar o teste de permutação que é óbvio para este caso. Primeiro, você calcula a estatística dos seus dados e, em seguida, embaralha aleatoriamente seus dados várias vezes e calcula-os para cada uma das amostras. é simplesmente a proporção de casos em que para tendência ascendente ou para tendência descendente.Dados S p S p S ≥ S permutação S dados ≤ S permutaçãoSpSpSdata≥SpermutationSdata≤Spermutation
Gilbert, RO (1987). Métodos Estatísticos para Monitoramento da Poluição Ambiental. Wiley, NY.
Önöz, B. & Bayazit, M. (2003). O poder dos testes estatísticos para detecção de tendências. Revista Turca de Engenharia e Ciências Ambientais, 27 (4), 247-251.
frequency=1
) é pouco relevante aqui. Uma questão mais relevante pode ser se você deseja especificar um formulário funcional para o seu modelo.