Suponha que uma determinada doença ( ) tenha uma prevalência de . Suponha também que um determinado sintoma ( ) tenha uma prevalência (na população geral = pessoas com essa doença D e pessoas sem essa doença [provavelmente com outra doença, mas não é importante]) de . Em uma pesquisa anterior, descobriu-se que a probabilidade condicional (a probabilidade de apresentar o sintoma , dada a doença é de ).
Primeira pergunta : poderia ser interpretado como equivalente à prevalência do sintoma no grupo de pessoas com a doença ?
Segunda pergunta : quero criar em R um conjunto de dados, o que mostra que:
Como fazer isso? Se eu usar simplesmente a sample
função, meu conjunto de dados não possui as informações que :
symptom <- sample(c("yes","no"), 1000, prob=c(0.005, 0.995), rep=T)
disease <- sample(c("yes","no"), 1000, prob=c(0.002, 0.998), rep=T)
Então, minha pergunta é: como criar um bom conjunto de dados, incluindo a probabilidade condicional que desejo?
EDIT : Também postei a mesma pergunta no stackoverflow.com ( /programming/7291935/how-to-create-a-dataset-with-conditional-probability ), porque, na minha opinião, minha pergunta é herdado do programa de linguagem R, mas também da teoria estatística.