As taxas (por exemplo, = / ) são frequentemente usadas (por exemplo, alterações na expressão do RNAm ou da proteína, índice de massa corporal [IMC], etc.). Muitas pessoas aconselham que variáveis codificadas como proporções (por exemplo, mudança de dobra) devem ser transformadas em log, porque estão fortemente inclinadas para a direita. No entanto, proporções ( / ) são mudanças relativas e distribuições de proporções não são normais (en.wikipedia.org/wiki/Ratio_distribution). Se e são lognormal, então log ( / ) é normal (é / lognormal depois de considerar o viés de retransformação?)
As comparações entre as relações logarítmicas transformadas são mudanças relativas das mudanças relativas (ou seja, as relações). Além disso, a necessidade de transformação de log para variáveis inclinadas à direita ( ) tem sido questionada. Por exemplo, um artigo recente ( http://www.ncbi.nlm.nih.gov/pubmed/22806695 ) alerta sobre os usos indevidos da transformação de log para uma variável. Alguns conselhos foram de que o log ( ) garante distribuição normal apenas se for lognormal. Nomeadamente, ele não garante a normalidade, mesmo para variáveis inclinadas à direita. Além disso, o anti-log de E (log ( )) é a média geométrica (GM) de , que é sempre menor que E ( ) e os testes das diferenças de E ( ) e o GM são diferentes. Finalmente, o GM não é nem mais robusto nem menos suscetível de ser afetado pelos valores extremos.
Outro artigo ( http://econtent.hogrefe.com/doi/10.1027/1614-2241/a000110 ) mostrou que os testes t nas variáveis brutas têm um bom desempenho, mesmo para variáveis distribuídas normalmente em log. Um terceiro artigo ( http://link.springer.com/article/10.1023%2FB%3AEEST.0000011364.71236.f8 ) mostrou que o desempenho do teste t nas relações e do teste t nas relações transformadas em log são semelhantes.
Assim, torna-se a questão de qual é o resultado do interesse. Como o log ( ) precisa ser transformado de volta para as unidades originais para ser significativo e, devido ao viés de retransformação, acho que os testes de E ( ) são mais significativos.
Felizmente, os testes paramétricos (por exemplo, testes t) são robustos à violação da suposição de normalidade depois que a heterocedasticidade é contabilizada (por exemplo, o teste t de Welch). Por exemplo, este artigo ( http://www.ncbi.nlm.nih.gov/pubmed/24738055 ) aconselha o uso da ANOVA para testar as diferenças entre alterações brutas na dobra por imunotransferência.
Portanto, minha pergunta é: se meu objetivo é testar a alteração absoluta das proporções, posso comparar as proporções diretamente sem transformação de log?
Referência: na regressão linear, quando é apropriado usar o log de uma variável independente em vez dos valores reais?
can I compare the ratios directly without log transformation?
Pelo menos no caso a seguir e implicitamente, você está fazendo a "comparação" de proporções. É quando você calcula estatística de uma tabela de contingência. Uma maneira de colocar sua fórmula é , onde é o obs. frequencia. na célula e é a razão dela para a frequência esperada lá. E, portanto, quando você calcula a distância qui-quadrado (ao quadrado) entre as linhas i e i 'na tabela, está computando diferenças entre as proporções: .