Certo. John Tukey descreve uma família de transformações (crescentes, um para um) na EDA . É baseado nestas idéias:
Ser capaz de estender as caudas (em direção a 0 e 1) conforme controlado por um parâmetro.
No entanto, para coincidir com os valores originais (não transformados) perto do meio ( 1/2 ), o que torna a transformação mais fácil de interpretar.
Para tornar a reexpressão simétrica em torno de 1/2. Ou seja, se p for reexpresso como f(p) , então 1−p será reexpresso como −f(p) .
Se você começar com qualquer aumento monotônica função g:(0,1)→R diferenciável em 1/2 você pode ajustá-lo para atender o segundo e terceiro critérios: basta definir
f(p)=g(p)−g(1−p)2g′(1/2).
O numerador é explicitamente simétrico (critério (3) ), porque trocar p com 1−p inverte a subtração, negando-a. Para ver que (2) é satisfeita, nota que o denominador é precisamente o factor necessário para fazer f′(1/2)=1. Recorde-se que os derivados aproxima do comportamento local de uma função com uma função linear; uma inclinação de 1=1:1 significa que f(p)≈p(mais uma constante −1/2 ) quando p é suficientemente perto de 1/2. Este é o sentido no qual os valores originais são "combinado perto do meio."
Tukey chama isso de versão "dobrada" de g . Sua família consiste nas transformações de potência e logarítmica g(p)=pλ onde, quando λ=0 , consideramos g(p)=log(p) .
Vejamos alguns exemplos. Quando λ=1/2 temos a raiz dobrado, ou "froot," f(p)=1/2−−−√(p–√−1−p−−−−√). Quandoλ=0, temos o logaritmo dobrado, ou "flog",f(p)=(log(p)−log(1−p))/4. Evidentemente, esse é apenas um múltiplo constante datransformaçãodologit,log(p1−p).
Neste gráfico dos corresponde linha azul para λ=1 , a linha vermelha intermediário para λ=1/2 , e a linha extrema verde para λ=0 . A linha pontilhada de ouro é a transformação arcsine , arcsin(2p−1)/2=arcsin(p–√)−arcsin(1/2−−−√). O "correspondente" de pistas (critério(2)) faz com que todos os gráficos para perto coincidemp=1/2.
Os valores mais úteis do parâmetro λ estão entre 1 e 0 . (Você pode fazer as caudas ainda mais pesado com valores negativos de λ , mas este uso é raro.) λ=1 não faz nada em tudo, exceto a recentralização dos valores ( f(p)=p−1/2 ). À medida que λ encolhe em direção a zero, as caudas são puxadas ainda mais em direção a ±∞ . Isso satisfaz o critério nº 1. Assim, escolhendo um valor apropriado de λ , você pode controlar a "força" dessa reexpressão nas caudas.