Eu tenho dois conjuntos de dados sobre a freqüência cardíaca de sujeitos que foram registrados em dois lugares diferentes (dois continentes diferentes para ser exato). Os dois experimentos de pesquisa tiveram como objetivo encontrar as emoções dos sujeitos com base em quanto a frequência cardíaca muda ao longo do tempo. Estou usando o aprendizado de máquina para prever as emoções dos sujeitos e estou obtendo resultados aceitáveis quando testados separadamente em cada conjunto de dados. No entanto, fico com um resultado ainda melhor se mesclar os dois conjuntos de dados.
No entanto, não tenho certeza se a combinação dos dois conjuntos de dados é aceitável. Como eu estou combinando dois conjuntos de dados de alguma forma diferentes, isso criará viés estatístico? Como devo relatar minha descoberta em um jornal?