A atribuição aleatória é valiosa porque garante a independência do tratamento dos possíveis resultados. É assim que leva a estimativas imparciais do efeito médio do tratamento. Mas outros esquemas de atribuição também podem garantir sistematicamente a independência do tratamento dos possíveis resultados. Então, por que precisamos de atribuição aleatória? Em outras palavras, qual é a vantagem da atribuição aleatória sobre os esquemas de atribuição não aleatórios que também levam a inferência imparcial?
Seja um vetor de atribuições de tratamento em que cada elemento é 0 (unidade não atribuída ao tratamento) ou 1 (unidade atribuída ao tratamento). Em um artigo da JASA, Angrist, Imbens e Rubin (1996, 446-47) dizem que a atribuição de tratamento é aleatória se para todos os \ mathbf {c} e \ mathbf {c'} de modo que \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , em que \ iota é um vetor de coluna com todos os elementos iguais a 1.
Em palavras, a reivindicação é que a atribuição é aleatória se qualquer vetor de atribuições que inclui atribuições ao tratamento for tão provável quanto qualquer outro vetor que inclua atribuições ao tratamento.
Mas, para garantir a independência dos resultados potenciais da atribuição do tratamento, basta garantir que cada unidade do estudo tenha igual probabilidade de atribuição ao tratamento. E isso pode ocorrer facilmente, mesmo que a maioria dos vetores de atribuição de tratamento tenha probabilidade zero de ser selecionada. Ou seja, pode ocorrer mesmo sob atribuição não aleatória.
Aqui está um exemplo. Queremos realizar um experimento com quatro unidades nas quais exatamente duas são tratadas. Existem seis vetores de atribuição possíveis:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
onde o primeiro dígito em cada número indica se a primeira unidade foi tratada, o segundo dígito indica se a segunda unidade foi tratada e assim por diante.
Suponha que realizemos um experimento no qual excluamos a possibilidade dos vetores de atribuição 3 e 4, mas no qual cada um dos outros vetores tem chance igual (25%) de ser escolhido. Esse esquema não é uma atribuição aleatória no sentido do AIR. Mas, na expectativa, leva a uma estimativa imparcial do efeito médio do tratamento. E isso não é acidente. Qualquer esquema de atribuição que dê aos sujeitos probabilidade igual de atribuição ao tratamento permitirá uma estimativa imparcial do ATE.
Então: por que precisamos de atribuição aleatória no sentido do AIR? Meu argumento está enraizado na inferência de randomização; se pensarmos em termos de inferência baseada em modelo, a definição do AIR parece mais defensável?