Eu tenho dados sobre uma série de apostas vencedoras e perdidas em 5 rodadas de apostas com desgaste após cada rodada. Estou usando uma árvore de decisão como a seguinte para exibir os dados.
Os nós em direção ao topo da árvore são aqueles que estão fazendo apostas vencedoras e os que estão em direção ao fundo da árvore estão correndo e perdendo apostas. Eu quero olhar para (a) atrito em cada nó (b) alterações no tamanho médio das apostas em cada nó. Estou analisando a taxa de atrito em cada nó do nó anterior e a taxa de sobrevivência (usando a quantidade esperada de pessoas em cada nó, se a probabilidade for de 50%). Por exemplo, se a probabilidade é de 50% em cada nó, dos 1.000 que começaram, aproximadamente 500 pessoas devem estar em cada um dos segundos nós, W e L. A hipótese é (a) que a taxa de atrito é maior após a perda Apostas (b) O tamanho médio da aposta é reduzido após perdedores e aumentado após vencedores.
Eu só quero fazer isso em um ambiente univariado muito simples primeiro. Como posso executar um teste t para mostrar que a mudança no tamanho médio da aposta do nó WW para o nó WWW é estatisticamente significativa se 50 pessoas desistiram? Não sei se essa é a abordagem correta: cada aposta subsequente é independente, mas as pessoas estão desistindo de perdedores, para que a amostra não seja correspondida. Se fosse apenas um caso da mesma classe fazendo uma série de exames um após o outro sem que ninguém desistisse, eu entenderia como realizar o teste t apropriado, mas acho que isso é um pouco diferente.
Como posso fazer isso? Além disso, se os resultados estão sendo distorcidos por um pequeno número de clientes, como eu poderia obter os 5% e os 5% inferiores? Basta remover os clientes com o maior valor acumulado da aposta 1 - 3?
Eu tenho os dados dos quais a figura foi gerada, então eu tenho a média, std, std erro etc em cada nó.