Estou analisando dados de duas pesquisas que foram mescladas:
Inquérito aos funcionários das escolas, nos anos 2005-06 e 2007-08
Inquérito aos alunos das escolas, para o período de 2005-06 a 2008-09
Para ambos os conjuntos de dados, tenho observações (no nível de alunos ou funcionários) de três distritos escolares diferentes, cada um com amostras representativas por ano em seu distrito escolar distinto.
Para análise, combinei os dados do aluno em dois períodos de dois anos (2005-07 e 2007-09). Depois, apliquei cada conjunto de dados para obter porcentagens de funcionários ou alunos que responderam a perguntas de acordo com os pontos de corte (por exemplo, se eles responderam afirmativamente "Concordo" ou se o aluno marcou que usava álcool, etc.) Portanto, quando mesclamos os conjuntos de dados de funcionários e alunos, a escola é a unidade de análise e só tenho 1 observação por escola por períodos de dois anos (dado que a escola não estava perdendo dados por um determinado período) )
Meu objetivo é estimar as associações entre funcionários e respostas dos alunos. Até agora, meu plano era obter coeficientes de correlação de Pearson entre todas as variáveis (como todas respostas contínuas representando porcentagens) para cada distrito escolar separadamente umas das outras (pois isso elimina a suposição de generalização para os outros distritos neste conjunto de dados) . Para fazer isso, eu calcularia a média dos dados do distrito ao longo dos dois anos para obter apenas uma observação por escola.
Questões:
- Esse é um plano de análise apropriado? Existe algum outro método que eu possa usar que possa me fornecer melhor inferência ou poder?
- Se meu plano for apropriado, devo obter correlações ponderadas com base na matrícula da escola (pois há mais escolas menores que grandes que contribuiriam desproporcionalmente para os coeficientes de correlação)?
Perguntei ao administrador de dados sobre isso e ele mencionou que os principais fatores que determinam a necessidade de ponderar meus dados são se eu acho que o tamanho da escola afeta ou não o grau de correlação e se minha interpretação será no nível do aluno ou da escola. Acho que minha interpretação será no nível da escola (por exemplo, "uma escola com essa porcentagem de funcionários respondendo dessa maneira está correlacionada com essa porcentagem de alunos que respondem dessa maneira ...").