Tenho alguns dados que preciso visualizar e não tenho certeza da melhor maneira de fazê-lo. Eu tenho um conjunto de itens base com as respectivas frequências e os resultados . Agora eu preciso traçar o quão bem meu método "encontra" (isto é, um resultado 1) os itens de baixa frequência. Inicialmente, eu só tinha um eixo x de frequência e um eixo y de 0-1 com gráficos de pontos, mas parecia horrível (especialmente ao comparar dados de dois métodos). Ou seja, cada item is tem um resultado (0/1) e é ordenado por sua frequência.F = { f 1 , ⋯ , f n } O ∈ { 0 , 1 } n q ∈ Q
Aqui está um exemplo com os resultados de um único método:
Minha próxima idéia foi dividir os dados em intervalos e calcular uma sensibilidade local sobre os intervalos, mas o problema com essa idéia é que a distribuição de frequência não é necessariamente uniforme. Então, como devo escolher melhor os intervalos?
Alguém conhece uma maneira melhor / mais útil de visualizar esse tipo de dados para retratar a eficácia de encontrar itens raros (ou seja, de frequência muito baixa)?
EDIT: Para ser mais concreto, estou demonstrando a capacidade de algum método para reconstruir sequências biológicas de uma determinada população. Para validação usando dados simulados, preciso mostrar a capacidade de reconstruir variantes, independentemente de sua abundância (frequência). Portanto, neste caso, estou visualizando os itens perdidos e encontrados, ordenados por sua frequência. Este lote não irá incluir variantes reconstruídos que não estão em .