Quando leio sobre como configurar seus dados, uma coisa que me deparo com frequência é que transformar alguns dados contínuos em dados categóricos não é uma boa ideia, pois você pode muito bem fazer a conclusão errada se os limites forem mal determinados.
No entanto, atualmente tenho alguns dados (valores de PSA para pacientes com câncer de próstata), onde acho que o consenso comum é que, se você estiver abaixo de 4, provavelmente não o possui, se estiver acima de você corre o risco e, em seguida, algo como acima de 10 e 20, você provavelmente tem. Algo parecido. Nesse caso, ainda seria incorreto categorizar meus valores contínuos de PSA em grupos, digamos 0-4, 4-10 e> 10? Ou é realmente bom, já que os limites são "bem determinados" por assim dizer.