Vamos considerar duas variáveis ( , Y i ). Quando você diz que bin os dados, e você "bin" em X i , você quer dizer repetindo a medição para exatamente o mesmo X i para obter o correspondente Y ' i valor? Se você repetir a medição dessa maneira, o erro médio diminuirá com √XEuYEuXEuXEuY′Eu , e acho que você é livre para fazer o que quiser com ele. Apenas certifique-se de usar um coeficiente de correlação ponderado se considerar pontos de dados com barras de erro muito diferentes.n--√
Agora, digamos que você não esteja repetindo a medição de , mas considerando X i ± δ e o correspondente Y i ± δ ′ e binning em δ e obtenha os valores binados em δ . Penso que nesta situação a solução dependerá da relação entre o tamanho da caixa, o erro na medição e a inclinação da correlação. Espero que, se ambos δ e δ ´ forem pequenos, a situação será semelhante à do parágrafo anterior. Caso contrário, pode ser vantajoso bin ou não; isso mudará os resultados porque o cov ( XXEuXEu± δYEu± δ′δδδδ´ , Y i , b i n ) será diferente dos valores não selecionados, mas acho que ainda é válido fazê-lo. Eu acho que você não está quebrando nenhuma suposição; Eu apenas me certificaria de que é vantajoso fazê-lo e testaria seu significado através de um teste de permutação (para evitar qualquer suposição sobre a distribuição do coeficiente).Xi , b i nYi , b i n