Aqui está algum contexto. Estou interessado em determinar como duas variáveis ambientais (temperatura, níveis de nutrientes) afetam o valor médio de uma variável de resposta em um período de 11 anos. A cada ano, existem dados de mais de 100 mil locais.
O objetivo é determinar se, durante o período de 11 anos, o valor médio das variáveis de resposta respondeu a mudanças nas variáveis ambientais (por exemplo, temperatura mais quente + mais nutrientes seriam = maior resposta).
Infelizmente, como a resposta é o valor médio (sem olhar para a média, apenas uma variação inter-anual regular irá inundar o sinal), a regressão será de 11 pontos de dados (1 valor médio por ano), com 2 variáveis explicativas. Para mim, mesmo uma regressão linear positiva será difícil de considerar significativa, uma vez que o conjunto de dados é tão pequeno (nem sequer atende aos 40 pontos / variáveis nominais, a menos que o relacionamento seja super forte).
Estou certo em fazer essa suposição? Alguém pode oferecer outros pensamentos / perspectivas que eu possa estar perdendo?
PS: Algumas advertências: não há como obter mais dados sem esperar mais anos. Portanto, os dados disponíveis são com o que realmente precisamos trabalhar.