Suponhamos que temos uma amostra a partir da distribuição conjunta de X e Y . Como testo a hipótese de que X e Y são independentes ?
Nenhuma suposição é feita sobre as leis de distribuição conjunta ou marginal de e Y (menos de toda a normalidade conjunta, pois nesse caso a independência é idêntica à correlação sendo 0 ).
Nenhuma suposição é feita sobre a natureza de um possível relacionamento entre e Y ; Como pode ser não linear, as variáveis não são correlacionadas ( r = 0 ), mas altamente co-dependentes ( I = H ).
Eu posso ver duas abordagens:
Bin ambas variáveis e use o teste exato de Fisher ou teste-G .
- Pro: use testes estatísticos bem estabelecidos
- Con: depende do binning
Estime a dependência de e Y : I ( X ; Y ) (este éparaXeYindependentese1quando eles se determinam completamente).
- Pro: produz um número com um significado teórico claro
- Con: depende do cálculo aproximado da entropia (ou seja, binning novamente)
Essas abordagens fazem sentido?
Que outros métodos as pessoas usam?