Use as definições de média
μ1:n=1n∑i=1nxi
e variação da amostra
σ21:n=1n∑i=1n(xi−μ1:n)2=n−1n(1n−1∑i=1n(xi−μ1:n)2)
(o último termo entre parênteses é o estimador de variância imparcial, geralmente calculado por padrão no software estatístico) para encontrar a soma dos quadrados de todos os dados . Vamos ordenar os índices i para que i = 1 , … , n designe elementos do primeiro grupo e i = n + 1 , … , n + m designe elementos do segundo grupo. Divida a soma dos quadrados por grupo e expresse novamente as duas partes em termos de variações e médias dos subconjuntos dos dados:xiii=1,…,ni=n+1,…,n+m
(m+n)(σ21:m+n+μ21:m+n)=∑i=11:n+mx2i=∑i=1nx2i+∑i=n+1n+mx2i=n(σ21:n+μ21:n)+m(σ21+n:m+n+μ21+n:m+n).
A solução algébrica para em termos de outras quantidades (conhecidas) produzσ2m+n
σ21:m+n=n(σ21:n+μ21:n)+m(σ21+n:m+n+μ21+n:m+n)m+n−μ21:m+n.
μ1:m+n=(nμ1:n+mμ1+n:m+n)/(m+n)
μ1:n=μ1+n:m+n=μ1:m+n), the solution for σ2m+n is a weighted mean of the group sample variances.