Não há solução única
Eu não acho que a verdadeira distribuição discreta de probabilidade possa ser recuperada, a menos que você faça algumas suposições adicionais. Sua situação é basicamente um problema de recuperar a distribuição conjunta dos marginais. Às vezes, é resolvido usando cópulas na indústria, por exemplo, gerenciamento de risco financeiro, mas geralmente para distribuições contínuas.
Presença, Independente, AS 205
No problema de presença, não é permitido mais do que uma bomba em uma célula. Novamente, para o caso especial de independência, existe uma solução computacional relativamente eficiente.
Se você conhece o FORTRAN, pode usar este código que implementa o algoritmo AS 205: Ian Saunders, algoritmo AS 205: enumeração de tabelas R x C com totais de linhas repetidos, estatísticas aplicadas, volume 33, número 3, 1984, páginas 340-352. Está relacionado ao algo de Panefield a que @Glen_B se referiu.
Esse algo enumera todas as tabelas de presença, ou seja, passa por todas as tabelas possíveis, onde apenas uma bomba está em um campo. Ele também calcula a multiplicidade, ou seja, várias tabelas com a mesma aparência e calcula algumas probabilidades (não aquelas em que você está interessado). Com esse algoritmo, você poderá executar a enumeração completa mais rapidamente do que antes.
Presença, não independente
O algoritmo AS 205 pode ser aplicado a um caso em que as linhas e colunas não são independentes. Nesse caso, você teria que aplicar pesos diferentes a cada tabela gerada pela lógica de enumeração. O peso dependerá do processo de colocação das bombas.
Conta, independência
O problema da contagem permite mais de uma bomba colocada em uma célula, é claro. O caso especial de linhas e colunas de independentes contagem problema é fácil: Pji=Pi×Pj
, onde Pi e Pj são marginais de linhas e colunas. Por exemplo, a fila P6=3/15=0.2 e coluna P3=3/15=0.2 , portanto, a probabilidade de que uma bomba está em linha 6 e a coluna 3 éP36=0.04 . Você realmente produziu essa distribuição em sua primeira tabela.
Contagens, Não independentes, Cópulas discretas
Para resolver o problema das contagens em que linhas e colunas não são independentes, podemos aplicar cópulas discretas. Eles têm problemas: não são únicos. Mas não os torna inúteis. Então, eu tentaria aplicar cópulas discretas. Você pode encontrar uma boa visão geral deles em Genest, C. e J. Nešlehová (2007). Uma cartilha sobre cópulas para dados de contagem. Astin Bull. 37 (2), 475-515.
Cópulas podem ser especialmente úteis, pois geralmente permitem induzir dependência explicitamente ou estimar a partir dos dados quando os dados estão disponíveis. Quero dizer a dependência de linhas e colunas ao colocar bombas. Por exemplo, pode ser o caso quando, se a bomba for uma na primeira linha, é mais provável que também seja a primeira coluna.
Exemplo
Vamos aplicar a cópula de Kimeldorf e Sampson aos seus dados, assumindo novamente que mais de uma bomba pode ser colocada em uma célula. A cópula para um parâmetro de dependência θ é definida como:
C(u,v)=(u−θ+u−θ−1)−1/θ
Você pode pensar em θ como um análogo do coeficiente de correlação.
Independente
θ=0.000001
Você pode ver como na coluna 5 a probabilidade da segunda linha tem uma probabilidade duas vezes maior que a primeira linha. Isso não é errado, ao contrário do que você parecia sugerir na sua pergunta. Todas as probabilidades somam 100%, é claro, assim como os marginais nos painéis correspondem às frequências. Por exemplo, a coluna 5 no painel inferior mostra 1/3, o que corresponde às 5 bombas indicadas do total de 15, conforme o esperado.
Correlação positiva
θ = 10
Correlação negativa
θ = - 0,2
Você pode ver que todas as probabilidades somam 100%, é claro. Além disso, você pode ver como a dependência afeta a forma do PMF. Para dependência positiva (correlação), você obtém o PMF mais alto concentrado na diagonal, enquanto que para a dependência negativa é fora da diagonal