O que se entende por distribuição categórica?


11

Esse tipo de distribuição é separado (EX: Binomial, Bernoulli, Multinomial) ou qualquer distribuição pode ser representada dessa maneira. Alguém pode elaborar com exemplo simples

Respostas:


11

A distribuição categórica é a generalização da distribuição de Bernoulli para um número fixo de resultados.2k

Equivalentemente, é o caso especial da distribuição multinomial em que o número de "escolhas" é fixo em um.n

Portanto, possui pdf:

i=1kpixi(where 0pi and ipi=1)
sobre o suporte em que
xi{0,1}
ni=1kxi=1.

Em resumo, Bernoulli tem k=2,n=1 , binomial tem k=2,n1 , multinomial tem k2,n1 1 e categórico tem k2,n=1 1 .


é necessário, xi = 0,1. Não posso ser mais do que isso.
Subha 27/08

@subha: Meu entendimento da distribuição categórica é assim. Para multinomial e binomial, é claro que pode ser.
Neil G

5

Variáveis ​​categóricas possuem conjuntos finitos de valores discretos. Exemplos incluem sexo (masculino / feminino), país, planeta etc. Contraste isso com variáveis ​​contínuas, que podem receber um número infinito de valores diferentes. Exemplos incluem peso, longitude, distância etc.

Observe que informações semelhantes às vezes podem ser expressas de maneira categórica e contínua; por exemplo, planet = earthpode ser expresso como distance to sun = 1 astronomical unit ≈ 150 million kilometers. No entanto, não há realmente nenhuma maneira de expressar 200 milhões de quilômetros do sol em termos de planetas, porque não há planeta lá (Marte está a 228 milhões de quilômetros do sol). O mesmo vale para 201 milhões de km, 202 etc. Tudo o que você poderia dizer sobre essas distâncias em termos de planetas é planet = none; você não poderia dizer planet = 4/3×earthou .88×Mars, porque não há maneira significativa de multiplicar um planeta ou qualquer outra variável categórica. Em termos de planetas, essas distâncias seriam indistinguíveis, mas é claro que fazem sentido como distâncias distintas do sol quando expressas como tais - como uma variável contínua.

Também é possível expressar variáveis ​​contínuas com precisão arbitrária (por exemplo, uma unidade astronômica é 149.597.871 km, não exatamente 150 milhões de km). Por outro lado, não há como expressar com planet = earthmais precisão; Terra é exatamente terra, nem mais nem menos. Além disso, não faria sentido dizer que qualquer outro planeta é "mais" ou "menos" que a Terra se planetfor uma variável nominal. Poderia ser codificado como uma variável ordenada (ordinal) - os planetas são ordenados em termos de distância ao sol, volume, número de luas, etc. Esses números são todos contínuos em seus próprios termos (ou pelo menos contam, que são discretos mas não categórico), mas não em termos de planetas. Por exemplo, se os planetas são ordenados pela distância do sol ou pelo número de luas mars > earth > venus,. Se planetas são ordenados por volume,earth > venus > mars. Não é necessário ordenar variáveis ​​categóricas e talvez algumas não possam ser ordenadas, mas adicionar ordem não as torna menos categóricas.

Como a Wikipedia diz, distribuições categóricas são generalizações da distribuição de Bernoulli para mais de dois valores possíveis (a distribuição de Bernoulli é estritamente binária). A distribuição de Bernoulli também é um caso especial da distribuição binomial, mas eu não chamaria a distribuição binomial de categórica (é discreta, mas uma variável de contagem, para que as distâncias entre os valores sejam definidas). Distribuições multinomiais podem estar em conflito com distribuições categóricas, mas a Wikipedia adverte contra isso .

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.