Eu acho que sua interpretação está incorreta.
Você diz: "Esses tamanhos de efeito são talvez tão pequenos quanto resultam mais provavelmente de pequenos vieses no processo de amostragem do que uma conexão causal (não necessariamente direta) entre as variáveis", o que parece implicar que o valor de P em uma 'sobrecarga' estudo não é o mesmo tipo de valor de P de um estudo 'propriamente' desenvolvido. Isso esta errado. Nos dois casos, o valor P é a probabilidade de obter dados tão extremos quanto os observados, ou mais extremos, se a hipótese nula for verdadeira.
Se você preferir a abordagem de Neyman-Pearson, a taxa de erros positivos falsos obtidos no estudo 'sobre-alimentação' é a mesma de um estudo 'adequadamente' se o mesmo valor alfa for usado para ambos.
A diferença de interpretação necessária é que existe uma relação diferente entre significância estatística e significância científica para estudos sobrecarregados. De fato, o estudo sobrecarregado dará uma grande probabilidade de obter significância, mesmo que o efeito seja, como você diz, minúsculo e, portanto, de importância questionável.
Desde que os resultados de um estudo com excesso de potência sejam interpretados adequadamente (e os intervalos de confiança para o tamanho do efeito ajudem nessa interpretação), não há problema estatístico com um estudo com excesso de potência. Sob esse prisma, os únicos critérios pelos quais um estudo pode realmente ser sobrecarregado são as questões éticas e de alocação de recursos levantadas em outras respostas.