Por "circular", entendo que a distribuição está concentrada em uma região circular, como neste gráfico de contorno de um pdf.
Se essa estrutura existe, mesmo que parcialmente, uma maneira natural de identificá-la e mensurá-la é calcular a distribuição circular em torno de seu centro . (Intuitivamente, isso significa que, para cada raio possível , devemos espalhar a probabilidade de estar na distância do centro igualmente em todas as direções.) Denotando as variáveis como , o centro deve estar localizado no ponto de primeiros momentos . Para fazer a média, é conveniente definir a função de distribuição radialr ( X , Y ) ( μ X , μ Y )rr(X,Y)(μX,μY)
F(ρ)=Pr[(X−μX)2+(Y−μY)2≤ρ2],ρ≥0;
F(ρ)=0,ρ<0.
Isto captura a probabilidade total de mentir entre a distância e do centro. Para espalhá-lo para fora em todas as direcções, deixe ser uma variável aleatória com CDF e ser uma variável aleatória uniforme em independente de . A variável aleatória bivariada é a média circular de . (Isso faz o trabalho que a nossa intuição exige de uma "média circular" porque (a) tem a distribuição radial correta, ou seja , , por construção e (b) todas as direções do centro (0ρRFΘ[0,2π]R(Ξ,H)=(Rcos(Θ)+μX,Rsin(Θ)+μY)(X,Y)FΘ) são igualmente prováveis.)
Nesse ponto, você tem muitas opções: tudo o que resta é comparar a distribuição de com a de . As possibilidades incluem uma distância e a divergência de Kullback-Leibler (junto com inúmeras medidas de distância relacionadas: divergência simetrizada, distância de Hellinger, informações mútuas etc. ). A comparação sugere que pode ter uma estrutura circular quando está "próximo" de . Neste caso, a estrutura pode ser "extraídos" de propriedades de . Por exemplo, uma medida da localização central de , como sua média ou mediana, identifica o "raio" da distribuição de(X,Y)(Ξ,H)Lp(X,Y)(Ξ,H)FF(X,Y) e o desvio padrão (ou outra medida de escala) de expressa como "espalhado" está nas direções radiais sobre sua localização central .F(X,Y)(μX,μY)
Ao amostrar a partir de uma distribuição, com dados , um teste razoável de circularidade é estimar a localização central como de costume (com médias ou medianas) e, portanto, converter cada valor em coordenadas polares relação ao centro estimado. Compare o desvio padrão (ou IQR) dos raios com a média (ou mediana). Para distribuições não circulares, a proporção será grande; para distribuições circulares, deve ser relativamente pequeno. (Se você tem um modelo específico em mente para a distribuição subjacente, pode elaborar a distribuição amostral da estatística radial e construir um teste de significância com ela.) Separadamente, teste a coordenada angular para uniformidade no intervalo(xi,yi),1≤i≤n(xi,yi)(ri,θi)[0,2π) . Será aproximadamente uniforme para distribuições circulares (e também para algumas outras distribuições); não uniformidade indica um desvio da circularidade.