As ferramentas estatísticas padrão são o coeficiente de correlação (consulte a resposta de Michael Chernick), que é um valor entre [-1,1] e é independente da unidade. Relacionada ao coeficiente de correlação está a covariância. A covariância é afetada pelas unidades, mas pode ser mais fácil de interpretar. No entanto, não gosto de nenhuma dessas opções no caso geral. Não gosto deles porque não são independentes da transformação conforme. Considere que uma linha reta horizontal ou vertical é considerada não linear por ambas as medidas.
Uma opção melhor sem unidade é usar uma decomposição de valor singular (SVD). O SVD divide os dados em partes classificadas por magnitude de sua contribuição para o todo. A razão do maior número singular para o segundo maior número singular é, portanto, uma métrica de linearidade. Observe que, para usar esse método, você deve primeiro centralizar os dados (fazer com que as coordenadas X, Y, Z, etc médias sejam iguais a zero).
Exemplo: Pts: 1126640.141 233575.2013; 1126630.008 233572.8567; 1126625.829 233572.7434;
1126625.416 233577.3781;
Pontos centralizados: 9.792639127 0,656480018; -0,340591673 -1,68817349; -4,519928343 -1,801499913; -4,932119113 2,833193384;
Matriz SVD, D: 11.86500017 0; 0 3.813448344
Proporção de valores singulares 3.111357
A proporção acima pode ser interpretada grosseiramente como sendo os dados três vezes mais longos na direção da linha de melhor ajuste que ela é linear.
Para uma solução com unidades que possuem unidades e não requer um SVD. Faça algum ajuste de linha que tenha o centro da linha como um dos parâmetros. Usar os dados centralizados acima é simples: linha pt = 0 0 (sempre o caso para dados centralizados) direção da linha = -0.999956849 -0.009289783
Vetores do centro da linha para cada ponto são as coordenadas centralizadas dos pontos. Encontre os comprimentos da projeção desses vetores na linha (valor absoluto do vetor pontilha a direção da linha) e o comprimento do componente vetorial perpendicular (comprimento da direção da linha transversal do vetor). Comprimento Paralelo, Comprimento Perpendicular 9.798315123, 0.565480194; 0,356259742, 1,684936621; 4.536468847, 1.759433021; 4,905586534, 2,878889448;
O máximo de projeções paralelas é o trecho de dados ao longo da linha. O comprimento máximo da projeção perpendicular é uma medida da não linearidade. A proporção dos dois é uma aproximação da relação de valores singulares acima.
Notas 1. Invariância afim na linearidade não é possível. Considere, em uma transformação afim, poderíamos escalar todos os eixos de coordenadas, exceto um, próximo a zero (tornando qualquer conjunto de pontos linear). Portanto, a invariância conforme é o melhor que podemos fazer. 2. Esses métodos NÃO são ROBUSTAIS para outlier de dados. 3. Exemplos são 2D, mas generalizados para N-dimensional.