Existe algum teste estatístico paramétrico e não paramétrico? Esta pergunta foi feita por um painel de entrevistas. É uma pergunta válida?
Existe algum teste estatístico paramétrico e não paramétrico? Esta pergunta foi feita por um painel de entrevistas. É uma pergunta válida?
Respostas:
É fundamentalmente difícil dizer exatamente o que se entende por "teste paramétrico" e "teste não paramétrico", embora existam muitos exemplos concretos em que a maioria concordará se um teste é paramétrico ou não paramétrico (mas nunca ambos) . Uma pesquisa rápida forneceu esta tabela , que, imagino, representa uma distinção prática comum em algumas áreas entre testes paramétricos e não paramétricos.
Logo acima da tabela mencionada, há uma observação:
"... os dados paramétricos têm uma distribuição normal subjacente ... Qualquer outra coisa não é paramétrica."
Pode ser um critério aceito em algumas áreas que assumimos a normalidade e usamos ANOVA, e isso é paramétrico, ou não assumimos a normalidade e usamos alternativas não paramétricas.
Talvez não seja uma definição muito boa e não esteja realmente correta na minha opinião, mas pode ser uma regra prática. Principalmente porque o objetivo final nas ciências sociais, digamos, é analisar dados, e de que adianta formular um modelo paramétrico com base em uma distribuição não normal e depois não poder analisar os dados?
Uma definição alternativa é definir "testes não paramétricos" como testes que não dependem de suposições distributivas e testes paramétricos como qualquer outra coisa.
A primeira e a última definição apresentada definem uma classe de testes e depois definem a outra classe como complemento (qualquer outra coisa). Por definição, isso exclui que um teste pode ser paramétrico e não paramétrico.
A verdade é que também a última definição é problemática. E se houver certas suposições "não paramétricas" naturais, como simetria, que possam ser impostas? Isso transformará uma estatística de teste que, de outra forma, não se baseia em nenhuma premissa de distribuição em um teste paramétrico? A maioria diria não!
Portanto, existem testes na classe de testes não paramétricos que podem fazer algumas suposições distributivas desde que não sejam "muito paramétricos". A fronteira entre os testes "paramétricos" e "não paramétricos" ficou embaçada, mas acredito que a maioria defenderá que um teste é paramétrico ou não-paramétrico, talvez não possa dizer nada além de dizer que é ambos faz pouco sentido.
Sob um ponto de vista diferente, muitos testes paramétricos são (equivalentes a) testes de razão de verossimilhança. Isso possibilita uma teoria geral e temos um entendimento unificado das propriedades distributivas dos testes de razão de verossimilhança sob condições de regularidade adequadas. Os testes não paramétricos não são, pelo contrário, equivalentes aos testes da razão de verossimilhança per se não há probabilidade - e sem a metodologia unificadora baseada na probabilidade de obtermos resultados distributivos caso a caso. A teoria da probabilidade empíricadesenvolvido principalmente por Art Owen em Stanford é, no entanto, um compromisso muito interessante. Ele oferece uma abordagem estatística baseada em probabilidade (um ponto importante para mim, pois considero a probabilidade um objeto mais importante do que um valor , por exemplo) sem a necessidade de suposições distributivas paramétricas típicas. A idéia fundamental é um uso inteligente da distribuição multinomial nos dados empíricos, os métodos são muito "paramétricos", mas válidos sem restringir suposições paramétricas.
Testes baseados em probabilidade empírica têm, IMHO, as virtudes dos testes paramétricos e a generalidade dos testes não paramétricos; portanto, entre os testes em que consigo pensar, eles se aproximam mais para se qualificarem por serem paramétricos e não paramétricos, embora eu Não use essa terminologia.
Paramétrico é usado em (pelo menos) dois significados: A - Para declarar que você está assumindo a família da distribuição de ruído até seus parâmetros. B - Declarar que você está assumindo a relação funcional específica entre as variáveis explicativas e o resultado.
Alguns exemplos:
O termo "semi-paramétrico" geralmente se refere ao caso B e significa que você não está assumindo toda a relação funcional, mas possui suposições mais brandas, como "aditivo em alguma transformação suave dos preditores".
Você também pode ter suposições mais brandas sobre a distribuição do ruído, como "todos os momentos são finitos", sem especificar especificamente o formato da distribuição. Que eu saiba, não há termo para esse tipo de suposição.
Observe que a resposta está relacionada às suposições subjacentes ao processo de geração de dados. Ao dizer "teste a-paramétrico", geralmente se refere a não-paramétrico no sentido A. Nesse sentido, você responderia "não". Seria impossível ser paramétrico e não paramétrico no mesmo sentido e ao mesmo tempo.
Suponho que depende do que eles querem dizer com "paramétrico e não paramétrico"? Ao mesmo tempo, exatamente os dois, ou uma mistura dos dois?
Muitos consideram o modelo de riscos proporcionais de Cox como semi-paramétrico, pois não estima parametricamente o risco da linha de base.
Ou você pode optar por visualizar muitas estatísticas não paramétricas como realmente paramétricas em massa.
Bradley, em seus clássicos Testes estatísticos livres de distribuição (1968, p. 15–16 - veja esta pergunta para uma citação) esclarece a diferença entre testes livres de distribuição e não paramétricos , que, segundo ele, são frequentemente conflitantes entre si e fornece uma exemplo de teste paramétrico livre de distribuição como teste de sinal para a mediana. Este teste não faz suposição sobre a distribuição subjacente da população amostrada de valores variáveis, portanto, é livre de distribuição . No entanto, se a mediana selecionada estiver correta, os valores acima e abaixo devem ser selecionados com igual probabilidade, testando amostras aleatórias de
Atualizar