Fichamento: Em Busca do Padrão-Ouro? O Percurso Histórico do Uso de Experimentos na Avaliação de Políticas Sociais

Capítulo 8 de: Leão, L. S., & Eyal, G. (2022). Em busca do padrão-ouro? O percurso histórico do uso de experimentos na avaliação de políticas sociais. In N. M. Koga, P. L. M. Palotti, J. Mello, & M. M. S. Pinheiro (Orgs.), Políticas públicas e usos de evidências no Brasil: conceitos, métodos, contextos e práticas (pp. 285–310). Ipea.

Annotated Bibliography

Sociology of Knowledge

Evidence-Based Policy

Causal Inference

Methodology

Brazil

2022

2020s

Author

Tales Mançano

Published

May 13, 2026

Informações Técnicas e BibTeX

Última atualização: 2026-05-13
Modelo: Perplexity — Claude Sonnet 4.6 Thinking
Prompt Version: v17.4 · 2026-05-13
Gerado em: 2026-05-13T09:54:00-03:00
Ocasião da Leitura:

Entrada BibTeX → Leao-Eyal2022

@incollection{Leao-Eyal2022,
  author    = {de Souza Leão, Luciana and Eyal, Gil},
  title     = {Em busca do padrão-ouro? O percurso histórico do uso de experimentos na avaliação de políticas sociais},
  booktitle = {Políticas públicas e usos de evidências no Brasil: conceitos, métodos, contextos e práticas},
  editor    = {Koga, Natália Massaco and Palotti, Pedro Lucas de Moura and Mello, Janine and Pinheiro, Maurício Mota Saboya},
  year      = {2022},
  publisher = {Instituto de Pesquisa Econômica Aplicada (Ipea)},
  address   = {Brasília},
  pages     = {285--310},
  doi       = {10.38116/978-65-5635-032-5/capitulo8},
}

Ficha Analítica Crítica

Note

Esta seção segue o formato IA Planilhando Textos v17.4.

Ficha Analítica — Tabela Markdown

Dimensão	Raciocínio analítico	Conteúdo
Questão de Pesquisa	A pergunta é formulada de modo comparativo-histórico, o que é uma força: ao invés de perguntar “por que os RCTs crescem agora?”, os autores reformulam de modo mais robusto. A vulnerabilidade está em que a própria pergunta pressupõe que a segunda onda é “um sucesso” — avaliação feita “a partir de 2021” que pode ser prematura.	Por que os RCTs tiveram sucesso na segunda onda (anos 2000–) de avaliação de desenvolvimento internacional, mas foram descontinuados após a primeira onda (1960–1980)? A pergunta é explicativa e foi explicitamente formulada pelos autores.
Questões Secundárias	As questões subsidiárias são necessárias para sustentar o argumento central e estão bem articuladas entre si; a questão sobre as implicações para o Brasil, porém, é inserida quase como apêndice e merecia desenvolvimento mais cuidadoso.	(1) O que explica a resistência política à randomização? (2) Como a composição da rede de expertise varia entre as duas ondas? (3) Que transformações nos campos da economia acadêmica e da ajuda ao desenvolvimento criaram condições de possibilidade para a segunda onda? (4) Quais as implicações do argumento para a hierarquia de evidências no Brasil?
Puzzle-Type	O puzzle é genuíno e generalizável: trata-se de um puzzle explicativo sobre o sucesso diferencial de uma inovação metodológica. A estratégia de “reiterada resolução de problemas” (Haydu, 1998) é elegante e raramente aplicada a objetos metodológicos. Há risco, contudo, de que a seleção de dois períodos discretos (“ondas”) simplifique uma trajetória mais contínua e heterogênea.	Puzzle explicativo sobre difusão diferencial de uma inovação científica em dois momentos históricos. Generalizável como modelo para estudar como métodos se tornam hegemônicos em campos científicos sob pressão política.
Conclusão / Argumento Central	O argumento é sofisticado e evita tanto o determinismo estrutural quanto o voluntarismo estratégico. A tese é que o sucesso dos RCTs é um produto histórico-institucional, não técnico-epistêmico. O claim central é bem sustentado pelos dados comparativos, embora a componente “homologia” seja mais assertiva do que demonstrada empiricamente.	O sucesso contemporâneo dos RCTs na avaliação de políticas sociais deve-se à capacidade dos randomistas de superarem a resistência política à randomização — resistência que destruiu a primeira onda —, o que foi possível graças a: (a) uma nova composição da rede de expertise, centrada em poverty labs universitários aliados a fundações filantrocapitalistas; e (b) a redução do escopo e duração dos experimentos, que minimizou o conflito com implementadores políticos. Esses dois fatores combinados transformaram os RCTs em uma “dobradiça” funcional entre os campos da economia acadêmica e da ajuda ao desenvolvimento.
Métodos	O design comparativo-histórico é adequado para a pergunta. A principal vulnerabilidade é que a amostra de 123 RCTs foi construída para o artigo original (de Souza Leão e Eyal, 2019) e os critérios de seleção são apenas parcialmente descritos neste capítulo, remetendo o leitor ao artigo fonte. Isso limita a verificabilidade interna do fichamento.	Análise de conteúdo de 123 RCTs (55 da primeira onda, 68 da segunda), combinada com análise de fontes secundárias e literatura histórica sobre os dois campos. Estratégia: comparação histórica de dois períodos tratados como casos de “reiterada resolução de problemas” (Haydu, 1998). O fichamento cobre o capítulo em sua integralidade (pp. 285–310). Detalhes do DGP remetem ao artigo original (de Souza Leão e Eyal, 2019).
Data Generation Process (DGP)	A unidade de análise é o RCT individual, mas o argumento opera no nível dos campos sociais — há, portanto, um salto analítico entre o nível micro (características de estudos individuais) e o nível meso/macro (transformações de campos). As tabelas quantitativas são descritivas e não permitem inferência causal; os autores as usam como evidência ilustrativa de padrões, o que é legítimo mas deve ser tratado com cautela.	Fenômeno: difusão diferencial de RCTs em dois períodos. Observação: artigos/relatórios de RCTs coletados sistematicamente. Coleta: amostra de 123 estudos (detalhes em de Souza Leão e Eyal, 2019). Operacionalização: afiliação disciplinar dos autores, tipo de parceiro de implementação, fonte de financiamento e duração da intervenção, codificados categorialmente. Análise: distribuições de frequência comparativas + leitura histórica interpretativa. Tipo de inferência: explicativa-interpretativa, não causal-estatística. Unidade de análise: o estudo de RCT individual, agregado ao nível de campo social.
Achados e Contribuições	A distinção entre “o que está sendo avaliado” (escopo/duração) e “quem avalia” (composição da rede) é conceitualmente original e empiricamente fundamentada. A contribuição teórica ao conceito de “dobradiça” (Abbott) via homologia bourdesiana é genuína. A aplicação ao Brasil é a contribuição mais especulativa — ainda que politicamente relevante.	Empíricos: (1) na segunda onda, 80% dos autores são economistas, versus 0% na primeira; (2) parceiros de implementação da segunda onda são majoritariamente OSCs globais e organizações com fins lucrativos (75%), versus burocracias nacionais na primeira (75%); (3) 52,6% dos RCTs contemporâneos têm duração de intervenção ≤1 mês, versus apenas 4,9% na primeira onda. Teórico-metodológicos: refinamento do conceito de “dobradiça” (Abbott, 2005) via incorporação do conceito de homologia (Bourdieu, 1977); proposta de explicar o sucesso científico por condições institucionais e não por mérito técnico intrínseco.
Análise Crítica dos Achados	(a) A causalidade da “fragmentação do campo” sobre o sucesso dos RCTs é sugerida mas não identificada: há confundidores não controlados (expansão geral do financiamento privado, globalização das ONGs, crescimento da economia comportamental). (b) A “homologia” entre os campos econômico e de desenvolvimento é um mecanismo plausível mas não diretamente observado — trata-se de inferência sobre disposições compartilhadas sem evidência direta das percepções dos atores. (c) A amostra de RCTs pode sofrer viés de publicação (RCTs publicados são mais visíveis que os fracassados). (d) SUTVA não se aplica aqui por se tratar de design qualitativo, mas a validade externa da comparação entre ondas depende de que as categorias de codificação sejam comparáveis entre dois períodos históricos muito distintos — ponto não explicitado. (e) Os autores reconhecem que a segunda onda pode não ser definitivamente “bem-sucedida” (observação feita “a partir de 2021”), mas não desenvolvem essa qualificação.	O argumento responde adequadamente à pergunta, especialmente na dimensão comparativa. É mais forte na explicação do fracasso da primeira onda do que na identificação precisa do mecanismo causal responsável pelo sucesso da segunda.
Limitações	Reconhecidas pelos autores: o foco no contexto do desenvolvimento internacional e das ciências econômicas limita a generalização; detalhes do DGP são remetidos ao artigo original; a análise do Brasil é introdutória. Não reconhecidas ou subestimadas: (1) viés de publicação na amostra de RCTs; (2) o mecanismo de “homologia” é assertivo e carece de evidência direta sobre as percepções dos agentes; (3) a operacionalização de “sucesso” da segunda onda é imprecisa e potencialmente prematura; (4) a dimensão Norte-Sul do argumento — os países receptores dos RCTs aparecem como objetos e não como agentes com lógicas próprias — é subestimada.
Perspectiva Teórica	A combinação Abbott–Bourdieu é produtiva, mas apresenta uma tensão ontológica: Abbott opera com ecologias interativas e Abbott é mais processual, enquanto Bourdieu opera com campos relativamente estáveis e estruturas de disposições. A articulação é feita de modo criativo, mas a coerência plena entre as duas ontologias merece maior explicitação.	STS (Science and Technology Studies) como pano de fundo epistemológico; Teoria dos Campos (Bourdieu) e Ecologia das Profissões (Abbott) como molduras analíticas; análise histórico-comparativa como estratégia de pesquisa. A moldura é adequada à pergunta e coerente com o design comparativo.
Principais Referências	Abbott (2005), Bourdieu (1977), Eyal (2013), Porter (1995), Haydu (1998), Deaton e Cartwright (2016), Krause (2014), Babb e Chorev (2016). O diálogo com a literatura crítica sobre RCTs (Rodrik, 2006; Deaton e Cartwright, 2016) é presente mas poderia ser mais aprofundado. Literatura sobre economia comportamental (Mullainathan e Thaler, 2000) é mobilizada sem explorar sua crítica interna.
Observações	Este capítulo é versão traduzida e adaptada de de Souza Leão e Eyal (2019, Theory and Society), fato declarado em nota de rodapé. A adaptação acrescenta a seção sobre o Brasil e adapta o argumento para o público nacional. O fichamento cobre o capítulo integralmente. A contribuição para pesquisadores interessados em política educacional ou avaliação de políticas no Brasil é direta: oferece instrumental para questionar a naturalização dos RCTs como padrão-ouro e para analisar criticamente a rede de expertise que promove tal enquadramento no contexto brasileiro.

Mapa Argumentativo

Seção	Título / Tema	Função argumentativa	Contribuição para a tese central
Introdução	Crescimento dos RCTs e apresentação do puzzle	Apresentação do puzzle e da tese	Desloca a pergunta de “por que os RCTs crescem agora?” para “por que falharam antes?”; anuncia o argumento central contra a explicação de mérito técnico intrínseco
Seção 2	Referencial teórico: RCTs como “dobradiça” entre campos sociais	Fundamento teórico	Introduz os conceitos de “dobradiça” (Abbott) e homologia (Bourdieu), estabelecendo o mecanismo explicativo central; define o problema da resistência política à randomização
Seção 3	Comparação entre as duas ondas de RCTs	Análise empírica comparativa	Documenta as diferenças nas redes de expertise (disciplina dos autores, parceiros de implementação, financiadores) e no escopo/duração das intervenções; sustenta empiricamente a explicação institucional-histórica
Seção 4	Transformações homólogas dos campos da ajuda ao desenvolvimento e da economia	Extensão do argumento / mecanismo causal	Articula as transformações paralelas nos dois campos (fragmentação da ajuda ao desenvolvimento; anomia metodológica na economia) como condições de possibilidade para a segunda onda; demonstra a homologia estrutural
Seção 5 (Conclusões)	Implicações teóricas e aplicação ao Brasil	Síntese e implicações	Consolida o argumento; aplica o arcabouço ao contexto brasileiro da hierarquia de evidências; propõe agenda crítica para pesquisadores nacionais

Introdução (pp. 285–287)

0.1 Apresentação do fenômeno e do puzzle central [§1–§4]

O capítulo abre contextualizando o crescimento exponencial dos Randomized Controlled Trials (RCTs) no campo da avaliação de políticas sociais nas últimas duas décadas. Os autores ilustram essa expansão com o caso do Abdul Latif Jameel Poverty Action Lab (J-PAL), fundado em 2003 no MIT com quatro professores afiliados conduzindo 33 projetos: em 2017, o laboratório contava com 161 professores afiliados envolvidos em 902 projetos em 72 países, incluindo cinco pesquisadores no Brasil. O Prêmio Nobel de Economia de 2019, concedido aos fundadores do J-PAL — Esther Duflo, Abhijit Banerjee e Michael Kremer —, é apresentado como a expressão mais visível da proeminência que os RCTs alcançaram, com Duflo afirmando que o método “[RCT] tornou-se uma marca (…) tanto na academia como em outras organizações”.

A explicação oferecida pelos próprios randomistas para esse crescimento é a superioridade técnica do método: assim como os ensaios clínicos randomizados representam o padrão-ouro em medicina, os RCTs representariam o padrão-ouro na avaliação de políticas sociais. Duflo é citada diretamente: “Não é mais a Idade Média, é o século 21 (…). Os RCTs revolucionaram a medicina ao permitir a distinção entre drogas que funcionam e drogas que não funcionam. O mesmo tipo de teste randomizado pode ser aplicado a política social”.

Os autores rejeitam essa explicação como insuficiente e — seguindo o vocabulário dos Science and Technology Studies (STS) — como uma versão da falácia retrospectiva: a superioridade de uma inovação científica só pode ser atribuída post hoc, uma vez que tal superioridade não era evidente nas fases iniciais de sua adoção. Para explicar o sucesso de inovações científicas, o campo do STS exige que se examinem as estratégias retóricas e políticas pelas quais seus defensores recrutam aliados e convencem o público relevante — não a suposta qualidade intrínseca da inovação (Latour, 1987; Pinch e Bijker, 1984; Barnes, Bloor e Henry, 1996). Adicionalmente, os econometristas têm questionado de modo convincente a alegação de que os RCTs produzem evidências superiores às de outros métodos (Rodrik, 2006; Deaton e Cartwright, 2016), e a própria história dos ensaios clínicos em medicina revela tanto deficiências metodológicas quanto determinações políticas em sua adoção (Demortain, 2011; Carpenter, 2010; Marks, 1997).

Há ainda outro problema com a explicação dos randomistas: a premissa de que os RCTs são uma inovação recente está incorreta. Observa-se, na verdade, uma segunda onda de RCTs no campo do desenvolvimento internacional, precedida por uma primeira onda iniciada nos anos 1960, nas áreas de planejamento familiar, saúde pública e educação em países em desenvolvimento, encerrada no início dos anos 1980.

Esse diagnóstico conduz à reformulação central do puzzle, que os autores tomam emprestado de Haydu (1998) sob a rubrica de “reiterada resolução de problemas”: em vez de perguntar “por que os RCTs estão aumentando agora?”, cabe perguntar “por que não se difundiram da mesma forma nos anos 1970 e por que foram descontinuados?”. A maneira como se explica o sucesso da segunda onda deve ser consistente com a explicação do fracasso da primeira.

1 Seção 2 — Referencial Teórico: RCTs como “Dobradiça” entre Campos Sociais (pp. 287–290)

1.1 O problema da legitimação recíproca [§5–§7]

A seção teórica parte da identificação do problema comum que estrutura as duas ondas: como transformar a ajuda internacional em uma ciência do desenvolvimento? No campo da cooperação e ajuda internacional, as decisões sobre alocação de recursos escassos precisam ser legitimadas. O recrutamento de especialistas acadêmicos cumpre essa função — sua assessoria serve para neutralizar críticas e conferir racionalidade às decisões. Os acadêmicos, reciprocamente, ganham influência política e recursos materiais. Os interesses cruzados, contudo, não são suficientes para construir a parceria: a assessoria especializada pode ser criticada como subjetiva e tendenciosa, enquanto a pesquisa orientada a políticas é frequentemente percebida como aquém dos padrões de rigor científico.

Esse problema específico é enquadrado como subcategoria de uma questão sociológica mais ampla: como campos sociais governados por lógicas conflitantes se tornam fortemente conectados? O campo acadêmico opera por lógicas de prestígio disciplinar e rigor científico; o campo da ajuda ao desenvolvimento opera por lógicas práticas e políticas. Construir um vínculo duradouro entre ambos é uma tarefa delicada, realizável apenas em condições muito específicas (Murray, 2010).

Note

Os RCTs aparecem como resposta a esse desafio precisamente por oferecerem o que Porter (1995, pp. 6–8) chamou de “objetividade mecânica” — uma forma de objetividade baseada completamente em regras explícitas, em vez de fundamentada no julgamento de especialistas. Ao eliminar a aparência de subjetividade, os RCTs parecem capazes de satisfazer simultaneamente as demandas de rigor do campo acadêmico e as demandas de legitimidade do campo da ajuda ao desenvolvimento. Banerjee (2007, pp. 115–116) sintetiza esse apelo: “a beleza das avaliações de impacto randomizadas é que os resultados são o que são: comparamos os resultados obtidos nos grupos de tratamento e controle, observamos se são diferentes e, em caso afirmativo, quão diferentes eles são.”

1.2 O conceito de “dobradiça” e suas exigências [§8–§10]

Os autores introduzem o conceito central mobilizado para além da explicação meramente retórica. Se a “objetividade mecânica” dos RCTs fosse apenas uma estratégia discursiva, ela deveria ter funcionado de modo semelhante nas duas ondas. Para explicar por que falhou na primeira e funciona na segunda, é preciso um conceito que enfatize a natureza mecanística — e não apenas retórica — das conexões entre campos. Abbott (2005) oferece o conceito de “dobradiça” (hinge): questões ou estratégias que oferecem “dupla recompensa” — isto é, que funcionam bem em ambas as ecologias, permitindo uma aliança entre atores que permeia as fronteiras de seus campos distintos (Abbott, 2005, p. 255).

A metáfora é explicitada em detalhe: uma “dobradiça” é um dispositivo com diferentes partes que devem “ficar juntas” para que o mecanismo funcione. É uma rede de expertise que conecta atores para realizarem uma tarefa que cruza as fronteiras entre campos (Eyal, 2013). Para que os RCTs operem como “dobradiça”, é necessário que haja randomização de beneficiários em grupos de controle e tratamento — operação que remove preconcepções, certifica resultados como científicos e inspira confiança em tomadores de decisão. Porém, alocar pessoas aleatoriamente em um grupo de controle sem receber benefícios suscita forte resistência política dos participantes, da burocracia implementadora e dos políticos. Gueron (2017, p. 5) resume o problema: “por que um político ou administrador arriscaria uma publicidade adversa, um potencial processo judicial, resistências burocráticas ou mesmo uma revolta da equipe?”.

Essa resistência política é o nó central do argumento. A tensão entre a lógica acadêmica — que trata o RCT como “intervenção” sujeita a avaliação — e a lógica da ajuda ao desenvolvimento — que interpreta o experimento como “assistência” para um grupo em detrimento de outro (Rayzberg, 2019) — torna a construção de uma “dobradiça” operacional extremamente difícil.

1.3 Homologias e afinidades eletivas [§11–§12]

A abordagem de Abbott (2005) apresenta uma limitação: não explica por que e como surgem as “dobradiças”. A teoria de campos de Bourdieu (1977) complementa esse ponto por meio do conceito de homologias. Na perspectiva bourdesiana, a construção bem-sucedida de “dobradiças” não resulta de estratégias conscientemente formuladas, mas de predisposições e esquemas perceptivos compartilhados por atores em diferentes campos. As percepções dos atores sobre seus interesses são moldadas pela estrutura relacional e pelas disputas por capital nos campos em que atuam, enquanto a homologia entre essas estruturas relacionais cria afinidades eletivas que aproximam atores de campos distintos.

A seção conclui anunciando a articulação que guiará o restante do capítulo: a análise das homologias entre os campos das ciências econômicas e do desenvolvimento internacional, que aproximaram seus atores e tornaram os RCTs de curto prazo a “dobradiça” que une suas lutas paralelas.

2 Seção 3 — Uma Comparação entre as Duas Ondas de RCTs (pp. 290–300)

2.1 Composição das redes de expertise: disciplinas e centros de coordenação [§13–§17]

A comparação entre as duas ondas opera em duas dimensões analíticas: (i) a composição da rede de expertise necessária para realizar os RCTs; e (ii) as características dos projetos avaliados. Dois fatores explicam por que a resistência política à randomização é menos significativa na segunda onda: a aliança dos economistas com fundações privadas filantrocapitalistas (em contraposição às agências governamentais da primeira onda) e o escopo reduzido e a menor duração dos experimentos contemporâneos.

A diferença mais visível na composição das redes de expertise é disciplinar. Na segunda onda, economistas representam 80% dos autores dos RCTs, enquanto na primeira onda nenhum dos 76 autores da amostra estava filiado à economia — sendo que cerca de 20% tinham formação em ciências sociais afins (psicologia, sociologia, estudos populacionais e estatística) e cerca de 30% provinham da saúde pública (médicos, epidemiologistas). Além disso, 18,3% da amostra da primeira onda eram funcionários de organizações internacionais sem filiação disciplinar identificada. Essa homogeneidade disciplinar da segunda onda confere às suas lideranças maior coesão e autonomia — capacidades fundamentais para negociar com financiadores, obter recursos e converter trabalho em capital acadêmico e científico.

O centro de coordenação da segunda onda é uma entidade organizacional inédita: o poverty lab (laboratório da pobreza). O J-PAL no MIT, liderado por Duflo e Banerjee (Nobel de 2019), é o protótipo e o eixo central de uma rede que inclui laboratórios análogos em Berkeley, Harvard e Stanford, com escritórios regionais em todos os continentes — incluindo uma unidade no Brasil. Esses escritórios são administrados por pesquisadores com formação em economia e realizam todas as funções da cadeia de pesquisa: formulação do desenho experimental, construção de questionários, análise de dados, publicação e negociação com parceiros e financiadores.

Nota: O J-PAL foi fundado em 2003 por Abhijit Banerjee, Esther Duflo e Sendhil Mullainathan. A expansão de quatro para 161 professores afiliados entre 2003 e 2017 é apresentada pelos autores como evidência do crescimento exponencial da segunda onda, mas não é acompanhada de análise sobre a taxa de crescimento ou sobre a distribuição geográfica dos projetos. ppl-ai-file-upload.s3.amazonaws

Na primeira onda, a maioria dos autores ocupava cargos em organizações sem fins lucrativos com sede nos Estados Unidos, estreitamente ligadas a fundações privadas norte-americanas e ao governo desse país. O centro de coordenação, onde os procedimentos operacionais e relatórios eram elaborados, estava fundido com as instituições que também proviam os recursos financeiros, a tecnologia e as equipes de pesquisa — um conjunto institucional estreitamente alinhado ao governo dos EUA, em que havia afinidade entre “cooperação para o desenvolvimento internacional” e a extensão da influência global norte-americana (Heydemann e Kinsey, 2010, p. 222). Essa fusão entre coordenação e financiamento distingue estruturalmente o arranjo da primeira onda do poverty lab universitário contemporâneo — o qual, por estar ancorado no prestígio e na autonomia das grandes universidades americanas, pode negociar com financiadores e parceiros “a partir de uma posição privilegiada, relativamente isolada de pressões políticas” (Rotemberg, 2009).

2.2 Equipes de campo e parceiros de implementação [§18–§21]

A diferença se estende às equipes de campo. Na segunda onda, o poverty lab emprega um grande contingente de recém-formados de universidades americanas em seus escritórios regionais, que funcionam como mediadores entre o centro de coordenação e os atores locais. Na primeira onda, essa camada intermediária de pessoal treinado academicamente era praticamente inexistente — os assistentes de pesquisa eram recrutados em parceria com universidades locais, o que tornava os pesquisadores muito mais dependentes dos parceiros de implementação e das burocracias locais.

A análise dos parceiros de implementação revela uma transformação estrutural. Na primeira onda, 65% dos parceiros eram agências governamentais centrais e locais, universidades e OSCs locais; excluindo-se USAID e Population Council (que eram, estritamente, centros de coordenação), a representação de parceiros nacionais sobe para 75%. Esses parceiros eram muito mais sensíveis às pressões políticas locais e constituíram a principal fonte de resistência à randomização. O caso de El Salvador é exemplar: “o controle experimental não era uma alta prioridade para os administradores salvadorenhos que estavam tentando lidar com uma grande reforma educacional (…) a necessidade política de introduzir a reforma como um pacote superou a preferência [pela RCT]” (Hornick et al., 1973, pp. 274–276).

Na segunda onda, os randomistas dependem muito menos de burocracias nacionais: OSCs globais, organizações com fins lucrativos (principalmente bancos de microcrédito) e empresas de pesquisa locais constituem 75% dos parceiros de implementação. Trabalhar com OSCs em vez de governos é descrito como “a chave para permitir a randomização e superar preocupações éticas”, pois as OSCs não “têm que fingir que servem a todos” (Ogden, 2016, pp. 20–21).

2.3 Fontes de financiamento [§22–§25]

A transformação mais decisiva ocorre nas fontes de financiamento. Na primeira onda, Population Council e USAID representavam 36,9% do financiamento — e somados às Fundações Ford e Rockefeller, o centro de coordenação concentrava 48% do total. As fundações tradicionais trabalhavam em estreita colaboração com o governo dos EUA, com suas atividades subordinadas às prioridades de política externa americana; seus líderes eram recrutados entre ex-funcionários governamentais (Heydemann e Kinsey, 2010, p. 222).

Na segunda onda, organizações internacionais e OSCs constituem um terço do financiamento (com o Banco Mundial respondendo por mais da metade desse montante), e fundações de nova geração — como as fundações Bill e Melinda Gates (6%) e MacArthur (5%) — representam 17,5% do total. Universidades americanas, que também recebem aportes dessas fundações para infraestrutura dos poverty labs, respondem por outros 20%. As novas fundações filantrocapitalistas se distanciam propositalmente da influência governamental americana e substituem o ethos anterior por modelos orientados ao mercado — fazendo “investimentos estratégicos” e alianças com centros universitários.

Important

Os autores identificam a transformação na composição dos financiadores como “a condição necessária e decisiva” que tornou possível a segunda onda. Essa afirmação é teoricamente forte e empiricamente sustentada pelas tabelas comparativas, mas conserva um caráter parcialmente assertivo: a relação causal entre pluralização do financiamento e sucesso da randomização é demonstrada estruturalmente, não por meio de um mecanismo rastreado caso a caso.

2.4 Escopo e duração das intervenções avaliadas [§26–§33]

A segunda dimensão de contraste é o que está sendo avaliado. Os RCTs contemporâneos concentram-se em pequenas intervenções de curto prazo — não no sentido do tamanho da amostra, mas do caráter da intervenção. Em vez de avaliar se uma política geral funciona ou não, a segunda onda testa o efeito de nudges específicos e limitados: por exemplo, o efeito do envio de lembretes por mensagem de texto sobre a taxa de pagamento de empréstimos em esquemas de microfinanciamento (Karlan et al., 2014). Duflo (2017, p. 4) descreve essa prática como “cuidar de detalhes aparentemente irrelevantes como, por exemplo, a maneira de comunicar a política, ou as opções padrão oferecidas aos clientes”.

Os dados são expressivos: 52,6% dos estudos da segunda onda têm duração de intervenção de um mês ou menos — e 35% da amostra envolveram apenas poucas horas de treinamento, workshop ou vídeos durante uma visita de um dia. Na primeira onda, esse tipo de intervenção ultra-curta ocorreu em apenas 4,9% dos estudos. Inversamente, 63,4% dos RCTs da primeira onda duraram um ano ou mais — alguns se estendendo por oito ou nove anos —, contra 38,6% na segunda onda.

Os RCTs dos anos 1960–1970 avaliavam sistemas completos de serviços em amplas áreas de política social, frequentemente comparando diferentes níveis de intervenção para determinar o mais econômico. Um estudo do Population Council (1986), por exemplo, distribuiu aleatoriamente uma, duas ou quatro consultas médicas mensais entre clínicas comunitárias remotas para determinar o nível ideal de atendimento ginecológico — avaliação conduzida durante vários anos com relatórios semestrais. O alcance geográfico era igualmente distinto: era comum realizar experimentos em todo o território nacional de países como Barbados, Nicarágua e Taiwan. Um único estudo de planejamento familiar na Índia empregou 6.500 pesquisadores de campo visitando 2,4 milhões de famílias em 28 mil localidades (Cuca e Pierce, 1977, p. 123).

Tip

O contraste de escalas ilumina o mecanismo central do argumento: intervenções de larga escala e longa duração impossibilitam manter o grupo de controle isolado por tempo suficiente — conforme exemplificado pelo estudo de microfinanças na Índia em que “os concorrentes estavam por toda parte” após três anos (Parker, 2010). Ao reduzir o escopo temporal e substantivo, a segunda onda resolve estruturalmente o problema da resistência política à randomização.

Na segunda onda, o objeto de avaliação é deliberadamente limitado, e a questão da “validade operacional” — como replicar os resultados em escala maior, levando em conta recursos necessários e aceitação política (Cuca e Pierce, 1977, p. 7) — é conscientemente deixada de lado, relegada a outros atores (especialmente governos). Os randomistas enquadram cada avaliação como “uma pequena peça em um quebra-cabeça maior, parte de um lento acúmulo de conhecimento”, deixando estrategicamente ambíguo se o experimento é uma contribuição à teoria econômica ou a solução de um “detalhe de implementação” (Rayzberg, 2019).

3 Seção 4 — As Transformações Homólogas dos Campos da Ajuda ao Desenvolvimento e da Economia (pp. 300–305)

3.1 A fragmentação do campo da ajuda ao desenvolvimento [§34–§38]

A seção 4 move a análise do nível das redes de expertise para o nível das transformações estruturais nos campos sociais que criaram as condições de possibilidade para a segunda onda. O argumento central desta subseção é que, durante a primeira onda (1960–1970), o campo da cooperação internacional era organizado em torno de uma coalizão dominante — composta de organizações bilaterais (USAID), multilaterais (Banco Mundial, UNESCO), governos nacionais dos países em desenvolvimento e fundações privadas que atuavam como braços auxiliares da política externa americana. Essa coalizão se fragmentou durante a segunda onda, e é precisamente essa fragmentação que tornou possível o sucesso dos RCTs.

A fragmentação não envolveu apenas a entrada de novos atores, mas uma transformação do que os autores, seguindo Rodrik (2006) e Babb e Chorev (2016), chamam de “imaginação sobre o desenvolvimento” — uma reorientação em direção a normas de mercado: resposta rápida, resultados mensuráveis, gestão profissionalizada. Esse novo regime epistêmico converteu o “bom projeto” em uma quase-mercadoria produzida por OSCs globais e consumida por doadores privados que exigem “resultados mensuráveis” (Krause, 2014). O Banco Mundial, como emblema dessa transformação, foi descrito pelo seu presidente como uma “agência de consultoria de desenvolvimento” cujo papel é conectar “capital em busca de um maior retorno com países que procuram alcançar sua aspiração mais elevada” (Kim, 2017).

Nesse ambiente, os randomistas puderam apresentar os RCTs como o antídoto à subjetividade dos especialistas em desenvolvimento e à tendência burocrática de se apegar a “programas de grandes dimensões por causa de preconcepções ideológicas”. Para eles, as “grandes questões filosóficas” sobre a utilidade da cooperação internacional não podem ser respondidas — o que os RCTs oferecem são respostas para questões pontuais, práticas e específicas (Banerjee e Duflo, 2011, p. 13).

Note

A fragmentação do campo da ajuda ao desenvolvimento criou um quase-mercado de “bons projetos” no qual as OSCs são pressionadas a apresentar evidências de impacto segundo objetivos estreitamente delimitados — e são desencorajadas a considerar os efeitos mais amplos de suas intervenções (Krause, 2014). Essa lógica fecha o círculo: os RCTs de curto prazo são exatamente o produto adequado para esse quase-mercado, e o quase-mercado é exatamente o ambiente em que os RCTs de curto prazo conseguem operar sem gerar resistência política intransponível.

Os autores destacam a condição contrafatual: a defesa dos RCTs como minimizadores de viés “não poderia ter sido formulada durante a primeira onda”, quando havia “relativo otimismo sobre as possibilidades do campo da ajuda ao desenvolvimento internacional, sobre o poder das organizações multilaterais de fazer o bem e sobre a força da expertise no campo” (Krueger, Michalopoulos e Ruttan, 1989). Foi o colapso do Consenso de Washington e a “perda de esperança na promessa da cooperação internacional” (Krause, 2014, p. 42) que criaram o ambiente de desconfiança em expertise no qual os RCTs, como estratégia de minimização de viés, tornaram-se especialmente valiosos.

3.2 Anomia metodológica na economia acadêmica [§39–§44]

A subseção 4.2 traça as transformações paralelas no campo da economia acadêmica que constituem o lado homólogo da “dobradiça”. No final dos anos 1980 e início dos 1990, a economia atravessava uma “virada empírica” — o declínio da hegemonia da modelagem formal teoricamente orientada e a proliferação de tendências empiricamente orientadas (Angrist et al., 2017). Dois movimentos são particularmente relevantes: os debates sobre identificação causal na economia do desenvolvimento e a ascensão da economia comportamental.

Na economia do desenvolvimento, a virada empírica se manifestou como preocupação intensa com a identificação causal: como separar o impacto de uma política ou fator específico de potenciais fatores correlacionados. Jovens economistas eram treinados tanto para encontrar variáveis instrumentais (VIs) quanto para demonstrar ceticismo em relação a qualquer instrumento proposto por outros — criando uma situação anômica em que “para qualquer instrumento que você propor, alguém propõe uma razão pelo qual o seu instrumento está errado” (Pritchett em Ogden, 2016, p. 141). Os RCTs emergiram como solução para essa anomia: assim como trouxeram um “fechamento” a debates acalorados no campo da ajuda ao desenvolvimento, ofereceram a jovens economistas um meio de praticar econometria empírica com credibilidade metodológica (Angrist e Pischke, 2010).

A economia comportamental, por sua vez, abriu outra frente. Ao criticar o irrealismo do homo economicus neoclássico (Mullainathan e Thaler, 2000), os economistas comportamentais expuseram as teorias microformais a críticas devastadoras — mas ficaram vulneráveis tanto à acusação de irrealismo (por conduzirem estudos em laboratórios artificiais) quanto à de pura descrição (por não explicar como os mercados funcionam apesar da racionalidade limitada). Os randomistas aproveitaram essa dupla abertura: seus experimentos de campo poderiam ser descritos como simultaneamente mais realistas que estudos laboratoriais, empiricamente rigorosos e teoricamente relevantes — capazes de lançar luz sobre “como populações de baixa renda nos países em desenvolvimento realmente tomam decisões em ambientes naturais” (Berndt, 2015).

Tip

O argumento dos autores sobre a defesa estratégica dos RCTs é revelador de sua sociologia: quando desafiados sobre a falta de validade externa e o valor teórico limitado de seus resultados, os randomistas admitem prontamente que a alocação aleatória não elimina todas as fontes de viés — mas sustentam que, diante de um público de “partes interessadas com poder de veto” que não confia no julgamento de especialistas, a comunicação do mínimo viés possível supera quaisquer outras considerações (Banerjee, Chassang e Snowberg, 2016, pp. 2, 11–15). Isso equivale a justificar os RCTs não por seu valor epistêmico absoluto, mas por sua eficácia retórica e política diante de audiências específicas — precisamente a explicação sociológica que os autores propõem.

4 Seção 5 — Conclusões (pp. 305–307)

4.1 Síntese do argumento e implicações para o Brasil [§45–§47]

A conclusão sintetiza o argumento central: o sucesso contemporâneo dos RCTs é melhor compreendido como produto de processos históricos e institucionais — a fragmentação do campo da ajuda ao desenvolvimento e as mudanças profissionais na economia — que transformaram os RCTs em uma “dobradiça” funcional, permitindo aos randomistas maior margem de manobra para contornar a resistência política à randomização. Os RCTs de curto prazo servem de “dobradiça” para a aliança entre randomistas e filantrocapitalistas, gozando assim de amplo apelo — apelo que não seria explicável por mérito técnico intrínseco.

Os autores então voltam o argumento para o contexto brasileiro. No Brasil, o impulso pela formulação de políticas baseadas em evidências foi acoplado a um impulso simultâneo pelo uso de RCTs como padrão-ouro avaliativo, introduzidos inicialmente por organismos internacionais como o Banco Mundial e posteriormente promovidos por especialistas nacionais. Os autores recusam a ideia de que qualquer método seja “automaticamente superior ou mais poderoso para influenciar o processo de formulação de políticas no Brasil” — o poder de métodos específicos resulta do “trabalho político” que é feito em torno deles em contextos institucionais distintos (Mello et al., 2020). O capítulo termina convocando “uma análise mais crítica não apenas da rede de expertise que promove os RCTs no Brasil, mas também das consequências dessa tendência em termos de silenciar, marginalizar ou simplesmente ignorar outras formas de conhecimento no debate público brasileiro”.

4.2 Implicações conceituais mais amplas [§48]

A última seção aponta as implicações teóricas para além do estudo de RCTs. Pesquisadores que investigam como campos sociais se tornam fortemente conectados tendem a privilegiar ou a ação estratégica dos atores ou as restrições estruturais dos campos — sem pensar em como esses dois fatores interagem dadas as contingências históricas em questão. A combinação de “dobradiça” (Abbott) com análise de campo (Bourdieu) oferece uma abordagem mais equilibrada, capaz de demonstrar não apenas que uma estratégia oferece dupla recompensa em dois campos, mas também como ela supera a resistência decorrente das tensões entre eles — sem atribuir peso causal excessivo às intenções estratégicas dos atores. A proposta final é uma análise relacional de “estratégias sem um estrategista” — formadas e coordenadas no curso de lutas paralelas em campos homólogos.

5 Argumento Sintético

Note

Tese central: O sucesso contemporâneo dos RCTs na avaliação de políticas sociais é um produto histórico-institucional — não evidência de sua superioridade técnica como padrão-ouro — resultante da capacidade dos randomistas de superarem a resistência política à randomização que destruiu a primeira onda (anos 1960–1980), o que foi possível graças a: (a) a emergência de poverty labs universitários aliados a fundações filantrocapitalistas (em substituição às agências governamentais da primeira onda); e (b) a redução deliberada do escopo e da duração dos experimentos, que minimizou o conflito com implementadores políticos.

Natureza do argumento: Causal-interpretativo, de base histórico-comparativa. O argumento é construído por contraste de dois casos (duas ondas) tratados como sequência de “reiterada resolução de problemas” (Haydu, 1998), com suporte empírico descritivo em tabelas de frequência e sustentação teórica nos conceitos de “dobradiça” (Abbott, 2005) e homologia (Bourdieu, 1977).

O que o texto demonstra: Que as diferenças estruturais entre as duas ondas — composição disciplinar das redes de expertise, tipo de parceiro de implementação, fonte de financiamento e duração das intervenções — são consistentes com a hipótese de que a resistência política à randomização explica o fracasso da primeira onda e sua superação explica o sucesso da segunda. Demonstra também que a homologia estrutural entre as crises internas ao campo econômico (anomia metodológica, virada empírica) e ao campo da ajuda ao desenvolvimento (fragmentação, quase-mercado) criou afinidades eletivas que tornaram os RCTs de curto prazo uma “dobradiça” mutuamente vantajosa.

O que fica como hipótese ou agenda: O mecanismo de “homologia” é plausível mas não diretamente observado (não há evidência das disposições subjetivas dos agentes). A aplicação ao Brasil é sugestiva mas não desenvolvida empiricamente. A durabilidade do sucesso da segunda onda — admitida como observação feita “a partir de 2021” — permanece em aberto. A dimensão dos países receptores dos RCTs (Sul Global como sujeito e não apenas objeto) é uma lacuna reconhecível.

Contribuição para o debate mais amplo: O capítulo contribui simultaneamente para três debates: (1) a sociologia do conhecimento científico aplicada a métodos de avaliação de políticas; (2) a teoria dos campos sociais e os mecanismos de conexão entre ecologias institucionais distintas; (3) a agenda brasileira de políticas baseadas em evidências, oferecendo instrumental crítico para questionar a naturalização dos RCTs como hierarquia máxima de evidências e para mapear as redes de expertise que sustentam essa naturalização.