Uma transformação para mudar a inclinação sem afetar a curtose?


11

Estou curioso para saber se existe uma transformação que altera a inclinação de uma variável aleatória sem afetar a curtose. Isso seria análogo ao modo como uma transformação afim de um VD afeta a média e a variância, mas não a inclinação e a curtose (em parte porque a inclinação e a curtose são definidas como invariáveis ​​a mudanças de escala). É um problema conhecido?


Você exige que o desvio padrão permaneça constante também com essa transformação?
russellpierce

não, espero que não, mas o excesso de curtose deve permanecer fixo. Eu esperaria que a transformação fosse monotônica, no entanto, e preferencialmente determinística.
21810 shabbychef

1
Caramba - ai da pessoa que quer provar uma função não determinística é monotônico.
russellpierce

Respostas:


6

Minha resposta é o início de um hack total, mas não conheço nenhuma maneira estabelecida de fazer o que você pede.

Meu primeiro passo seria classificar a ordem do seu conjunto de dados para encontrar a posição proporcional no seu conjunto de dados e transformá-lo em uma distribuição normal. Esse método foi usado em Reynolds & Hewitt, 1996. Veja o código R de amostra abaixo no PROCMiracle.

Uma vez que a distribuição é normal, o problema foi revertido - uma questão de ajustar a curtose, mas não distorcer. Uma pesquisa no Google sugeriu que se pudesse seguir os procedimentos de John & Draper, 1980, para ajustar a curtose, mas não a inclinação - mas não pude replicar esse resultado.

Minhas tentativas de desenvolver uma função bruta de expansão / restrição que pega o valor de entrada (normalizado) e adiciona ou subtrai um valor proporcional à posição da variável na escala normal resultam em um ajuste monotônico, mas na prática tende a criar uma distribuição bimodal através de uma que possua os valores desejados de assimetria e curtose.

Sei que essa não é uma resposta completa, mas achei que poderia dar um passo na direção certa.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

Eu estava fazendo algo parecido com isto: classificação, em seguida, use a transformação g-e-h para obter uma curtose fixa e inclinação. No entanto, esta técnica assume que eu realmente sei o achatamento população, o que eu posso estimar, mas eu estou interessado, filosoficamente, se não houver uma transformação que preserva a curtose sem me ter de saber o que é ...
shabbychef

@shabbychef: Ah, desculpe por não adicionar nada de novo. No entanto, você adicionou algo novo, eu nunca tinha ouvido falar da fórmula g-e-h antes. Você tem uma citação livremente acessível que a fornece? Eu tropecei em um papel com ele escrito ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ), mas a noção é um pouco estranha para mim (em particular é que e ^ Z ^ g ou algo mais )? Eu tentei assim ... mas os resultados pareciam estranhos ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).
russellpierce

1
@drnexus: Eu não queria influenciar os resultados mencionando minha técnica. Eu aprendi sobre as distribuições g-and-h e g-and-k de Haynes et. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 , e Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

nn12norma entre as estatísticas da ordem de amostra e a versão transformada sujeita às restrições fornecidas. Esse é um tipo de abordagem maluca, no entanto. Na pergunta original, eu estava procurando por algo mais básico e fundamental. Eu também estava procurando implicitamente uma técnica que pudesse ser aplicada a observações individuais, independentemente de ter uma coorte inteira de amostras.


0

Prefiro modelar esse conjunto de dados usando uma distribuição leptokurtic em vez de usar transformações de dados. Gosto da distribuição sinh-arcsinh de Jones e Pewsey (2009), Biometrika.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.