A ponderação baseada em precisão (isto é, variação inversa) é parte integrante da metanálise?


10

A ponderação baseada em precisão é central para a metanálise? Borenstein et al. (2009) escrevem que, para que a meta-análise seja possível, tudo o que é necessário é:

  1. Os estudos relatam uma estimativa pontual que pode ser expressa como um único número.
  2. A variação pode ser calculada para essa estimativa pontual.

Não está imediatamente claro para mim por que (2) é estritamente necessário. Mas, de fato, todos os métodos amplamente aceitos de metanálise baseiam-se em esquemas de ponderação baseados em precisão (ou seja, variância inversa), que exigem uma estimativa da variação para o tamanho do efeito de cada estudo. Observe que, embora o Método de Hedges (Hedges & Olkin, 1985; Hedges & Vevea, 1998) e o Método de Hunter e Schmidt (Hunter & Schmidt, 2004) usem basicamente a ponderação do tamanho da amostra, esses métodos se aplicam apenas a diferenças médias normalizadas e, portanto, requerem um desvio padrão em outro lugar. Faz sentido que pesos inversamente proporcionais à variação em cada estudo minimizem a variação no estimador de tamanho de efeito geral; esse esquema de ponderação é um recurso necessário para todos os métodos?

É possível realizar uma revisão sistemática sem acesso à variação para cada tamanho de efeito e ainda chamar o resultado de meta-análise? O tamanho da amostra parece ter potencial como proxy de precisão quando a variação não está disponível. Por exemplo, alguém poderia usar a ponderação do tamanho da amostra em um estudo em que o tamanho do efeito foi definido como diferença média bruta? Como isso afetaria a consistência e a eficiência do tamanho médio do efeito resultante?


uma boa pergunta Se você fizer uma consulta específica clara, pode ajudar o leitor.
Subhash C. Davar

Especificamente, estou procurando uma maneira de incorporar uma medida de heterogeneidade entre estudos (ou seja, efeitos aleatórios) em meu esquema de ponderação quando os dados de variação não estiverem disponíveis para todos os estudos. Um mais versão anterior, específico da minha pergunta pode ser encontrada aqui: stats.stackexchange.com/questions/155063/...
Jennifer

Respostas:


11

A pergunta é difícil de responder, porque é tão indicativa de uma confusão geral e de situações confusas em grande parte da literatura meta-analítica (o OP não é o culpado aqui - é a literatura e a descrição dos métodos , modelos e suposições que geralmente são uma bagunça).

Mas, resumindo uma longa história: não, se você deseja combinar várias estimativas (que quantificam algum tipo de efeito, grau de associação ou outro resultado considerado relevante) e é sensato combinar esses números, então você pode simplesmente pegar a média (não ponderada) e isso seria perfeitamente aceitável. Nada de errado com isso e de acordo com os modelos que normalmente assumimos quando realizamos uma meta-análise, isso fornece uma estimativa imparcial (assumindo que as estimativas em si são imparciais). Portanto, não, você não precisa das variações de amostragem para combinar as estimativas.

Então, por que o peso da variação inversa é quase sinônimo de realizar uma metanálise? Isso tem a ver com a idéia geral de que atribuímos mais credibilidade a grandes estudos (com variações de amostragem menores) do que estudos menores (com variações de amostragem maiores). De fato, de acordo com as premissas dos modelos usuais, o uso da ponderação de variância inversa leva ao estimador imparcial de variância uniformemente mínima(UMVUE) - bem, mais uma vez, assumindo estimativas imparciais e ignorando o fato de que as variações de amostragem geralmente não são exatamente conhecidas, mas são estimadas por si mesmas e em modelos de efeitos aleatórios, também devemos estimar o componente de variação para heterogeneidade, mas então nós apenas a tratamos como uma constante conhecida, o que também não é correto ... mas sim, nós meio que obtemos o UMVUE se usarmos a ponderação de variação inversa se apenas apertarmos os olhos com muita força e ignorarmos alguns deles problemas.

Portanto, é a eficiência do estimador que está em jogo aqui, não a imparcialidade em si. Mas mesmo uma média não ponderada geralmente não será muito menos eficiente do que usar uma média ponderada de variância inversa, especialmente em modelos de efeitos aleatórios e quando a quantidade de heterogeneidade é grande (nesse caso, o esquema de ponderação usual leva a pesos quase uniformes) de qualquer forma!). Mas mesmo em modelos de efeitos fixos ou com pouca heterogeneidade, a diferença geralmente não é esmagadora.

E, como você mencionou, também é possível considerar facilmente outros esquemas de ponderação, como ponderação por tamanho da amostra ou alguma função dela, mas, novamente, essa é apenas uma tentativa de obter algo próximo dos pesos de variação inversa (já que as variações de amostra são, para em grande parte, determinada pelo tamanho da amostra de um estudo).

Mas, na verdade, pode-se e deve 'dissociar' a questão dos pesos e variações completamente. Na verdade, são duas peças separadas em que é preciso pensar. Mas não é assim que as coisas são tipicamente apresentadas na literatura.

No entanto, o ponto aqui é que você realmente precisa pensar em ambos. Sim, você pode usar uma média não ponderada como sua estimativa combinada e isso seria, em essência, uma meta-análise, mas quando você começar a fazer inferências com base nessa estimativa combinada (por exemplo, realize um teste de hipótese, construa um intervalo de confiança ), você precisa conhecer as variações de amostragem (e a quantidade de heterogeneidade). Pense da seguinte maneira: se você combinar vários estudos pequenos (e / ou muito heterogêneos), sua estimativa pontual será muito menos precisa do que se você combinar o mesmo número de estudos muito grandes (e / ou homogêneos) estudos - independentemente de como você ponderou suas estimativas ao calcular o valor combinado.

Na verdade, existem algumas maneiras de não conhecer as variações de amostragem (e a quantidade de heterogeneidade) quando começamos a fazer estatísticas inferenciais. Pode-se considerar métodos baseados em reamostragem (por exemplo, inicialização, teste de permutação) ou métodos que geram erros padrão consistentes para a estimativa combinada, mesmo quando não especificamos partes do modelo - mas o quão bem essas abordagens podem funcionar precisa ser cuidadosamente avaliado em um Caso a caso.


0

Se você conhece alguns dos erros padrão, mas não todos, aqui está uma solução:

(1) suponha que o SE desconhecido seja extraído aleatoriamente da mesma distribuição que os SE conhecidos ou que a distribuição do SE das estimativas dos trabalhos com os SE desconhecidos seja uma variável livre. Se você quiser ser sofisticado, pode usar a média do modelo nessas opções.

(2) estimativa via probabilidade máxima

Se o seu estudo com SE desconhecida for um "discrepante", o modelo explicará a anomalia em uma combinação destas maneiras:

(a) o estudo provavelmente teve uma SE alta para sua estimativa (o estudo provavelmente tem baixa potência)

(b) o estudo provavelmente possui um grande componente de efeito aleatório (o pesquisador selecionou um conjunto de dados ou método etc., que fornece um resultado atípico)

De fato, este modelo reduzirá a precisão efetiva da estimativa com SE desconhecida à medida que se tornar mais anômala. A este respeito, é altamente robusto à inclusão de 'outliers'. Ao mesmo tempo, se você adicionar muitos estudos com variação desconhecida, mas com resultados típicos, a SE ou sua estimativa final cairá.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.