fundo
Estou projetando uma simulação de Monte Carlo que combina os resultados de séries de modelos e quero ter certeza de que a simulação me permitirá fazer afirmações razoáveis sobre a probabilidade do resultado simulado e a precisão dessa estimativa de probabilidade.
A simulação encontrará a probabilidade de um júri de uma comunidade especificada condenar um determinado réu. Estas são as etapas da simulação:
Usando dados existentes, gere um modelo de probabilidade logística ( M ) regredindo o “voto do primeiro jurado” nos preditores demográficos.
Use os métodos de Monte Carlo para simular 1.000 versões de M (ou seja, 1000 versões dos coeficientes para os parâmetros do modelo).
Selecione uma das 1.000 versões do modelo ( M i ).
Empanel 1.000 júris, selecionando aleatoriamente 1.000 conjuntos de 12 "jurados" de uma "comunidade" ( C ) de indivíduos com distribuições de características demográficas especificadas.
Calcule deterministicamente a probabilidade de um primeiro voto de culpado para cada jurado usando M i .
Transforme o voto provável de cada "jurado" em um voto determinado (com base em se é maior ou menor que o valor selecionado aleatoriamente entre 0-1).
Determine a “votação final” de cada "júri" usando um modelo (derivado de dados empíricos) da probabilidade de um júri condenar, dependendo da proporção de jurados que votam por condenação na primeira votação.
Armazene a proporção de veredictos de culpados para os 1000 júris ( PG i ).
Repita os passos 3-8 para cada um dos 1.000 versões simuladas de M .
Calcular o valor médio de PG e relatório que, como a estimativa pontual da probabilidade de condenação em C .
Identifique os valores dos percentis 2,5 e 97,5 para PG e relate isso como intervalo de confiança de 0,95.
Atualmente, estou usando 1.000 jurados e 1.000 jurados na teoria de que 1.000 sorteios aleatórios de uma distribuição de probabilidade - características demográficas de C ou versões de M preencherão essa distribuição.
Questões
Isso me permitirá determinar com precisão a precisão da minha estimativa? Se assim for, quantos júris que preciso empanel para cada PG i cálculo para cobrir C distribuição de probabilidade (de modo que viés selecção evitar) 's; posso usar menos de 1.000?
Muito obrigado por qualquer ajuda!