“Não tirarás conclusões sobre o comportamento de indivíduos a partir de dados agregados”

A revisão da bibliografia tem seus bons momentos. Para qualquer pessoa que pesquise um tema muito específico, há horas em que – sem nenhum aviso – surge uma pesquisa que se encaixa perfeitamente no que você procura (e não só mostra que há outras pessoas angustiadas com o mesmo problema como que elas já acharam algumas soluções).

Há anos, me estresso vendo economistas que fazem regressões com dados macroeconômicos (e que garantem que elas provam alguma coisa). O crime que eles cometem tem vários nomes. Estatísticos dirão que eles ignoram o Paradoxo de Simpson. Bons economistas dirão que eles violam o Teorema de Nataf. Sociólogos e cientistas políticos dirão que cometem uma Falácia ecológica. Também já vi chamarem de problema macro-micro mas o melhor nome (ou pelo menos o mais claro) é problema da agregação de dados.

Foi na Ciência política que achei a referencia no título deste post: ela está no trecho abaixo, escrito por Gary King, professor de Havard e uma das pessoas que reconhecem o mal uso de dados agregados quando o vêem:

Successive generations of young scholars and methodologists in the making, having been warned off aggregate data analysis with their teachers’ mantra “thou shalt not draw conclusions about individual behavior from aggregate data”, come away with the conviction that the ecological inference problem presents an enormous barrier to social science research. This belief has drawn a steady stream of social science methodologists into the search for a solution over the years, myself included.

São muitas coisas boas em um mesmo parágrafo. Primeiro, em outros campos – fora da economia – as pessoas estão atentas ao problema do mal uso de agregados. Lá, elas alertam os estudantes sobre isso (diferentemente dos economistas) e lá elas pesquisam métodos para lidar com esse problema.

Agora a parte irritante: o livro de King sobre como lidar com problemas de agregação em tabelas de contingência – um caso específico para o qual ele bolou um tratamento também específico – custa quase R$ 400, graças à nossa moeda desvalorizada…

Mais pessoas preocupadas com os problemas de agregação.