Introdução

Esse é um trecho do livro O poder do pensamento matemático

Essa história, como muitas outras da Segunda Guerra Mundial, começa com os nazistas expulsando um judeu da Europa e termina com os nazistas lamentando esse ato. Abraham Wald nasceu em 1902, na cidade que então se chamava Klausenburg, que na época fazia parte do Império Austro-Húngaro. Quando Wald era adolescente, a Primeira Guerra Mundial estava só nos livros, e sua cidade natal havia se tornado Cluj, na Romênia. Ele era neto de rabino e filho de um padeiro kosher, mas desde sempre o jovem Wald fora um matemático. Seu talento para a matéria logo foi reconhecido, e ele foi admitido para estudar matemática na Universidade de Viena, onde se sentiu atraído por temas abstratos e recônditos até pelos padrões da matemática pura: teoria dos conjuntos e espaços métricos.

[…] mudou-se para Nova York.

E foi lá que lutou sua guerra.

O Grupo de Pesquisa Estatística (SRG, de Statistical Research Group), no qual Wald passou grande parte da Segunda Guerra Mundial, era um programa sigiloso que mobilizava o poderio reunido dos estatísticos americanos para o esforço de guerra – algo semelhante ao Projeto Manhattan, exceto que as armas desenvolvidas eram equações, e não explosivos. O SRG era efetivamente em Manhattan, no número 401 da West 118th Street, em Morningside Heights, apenas a uma quadra da Universidade Columbia.

[…]

Problema

Você não quer que seus aviões sejam derrubados pelos caças inimigos,então você os blinda. Mas a blindagem torna o avião mais pesado, e aeronaves mais pesadas são mais difíceis de manobrar e usam mais combustível. Blindar demais os aviões é um problema; blindar os aviões de menos é um problema. Em algum ponto intermediário há uma situação ideal. O motivo de você ter uma equipe de matemáticos enfurnados num aposento na cidade de Nova York é descobrir qual é essa situação ótima.

Os militares foram ao SRG (Statistical Research Group) com alguns dados que julgaram úteis. Quando os aviões americanos voltavam de suas missões na Europa, estavam cobertos de furos de balas. Mas os danos não eram distribuídos uniformemente pela aeronave. Havia mais furos na fuselagem, não tantos nos motores.

      Seção do Avião     | Furos de Balas por pé quadrado  
 ------------------------|--------------------------------  
  Motor                  |                           1,11  
  Fuselagem              |                           1,73  
  Sistema de Combustível |                           1,55  
  Resto do avião         |                            1,8  

Os oficiais viam aí uma oportunidade de eficiência. Pode-se obter a mesma proteção com menos blindagem se a concentrarmos nos locais mais necessários, onde os aviões são mais atingidos. Contudo, exatamente quanto mais de blindagem caberia a essas partes do avião? Essa era a resposta que foram obter de Wald. Mas não a obtiveram.

A blindagem, disse Wald, não devia ir para onde os furos de bala estão, mas para onde os furos não estão, isto é, nos motores.

A grande sacada de Wald foi simplesmente perguntar: onde estão os furos de bala que faltam? Aqueles que estariam sobre todo o revestimento do motor caso os danos tivessem se distribuído de forma igual pelo avião? Wald estava bastante seguro a esse respeito. Os furos de balas que faltavam estavam nos aviões que faltavam. A razão de os aviões voltarem com menos pontos atingidos no motor era que os atingidos no motor não voltavam. A grande quantidade de aviões que retornava à base com a fuselagem semelhante a um queijo suíço era forte evidência de que os tiros sofridos pela fuselagem podem (e portanto devem) ser tolerados. Se você for à sala de recuperação num hospital, verá muito mais gente com furos de bala nas pernas que no peito. Mas isso não ocorre porque as pessoas não são atingidas no peito, e sim porque as pessoas atingidas no peito não se recuperam.

Eis aqui um velho truque matemático que torna o quadro completamente claro: estabeleça algumas variáveis como zero. Nesse caso, a variável a pinçar é a probabilidade de um avião que leve um tiro no motor conseguir permanecer no ar. Estabelecer essa probabilidade como zero significa que um único tiro no motor sem dúvida derruba o avião. Qual deveria ser a aparência dos dados nesse caso? Você teria aviões com furos de bala ao longo das asas, da fuselagem, do nariz, mas nenhum no motor. O analista militar tem duas opções para explicar isso: ou as balas alemãs atingem qualquer parte do avião, menos o motor, ou o motor é o ponto de vulnerabilidade total. Ambas as situações explicam os dados, mas esta última faz mais sentido. A blindagem vai para onde não estão os furos.

As recomendações de Wald foram rapidamente materializadas, e ainda eram empregadas pela Marinha e pela Força Aérea na Guerra da Coreia e do Vietnã. Não sei dizer exatamente quantos aviões americanos elas salvaram, embora os analistas de dados descendentes do SRG e que hoje são militares devam fazer uma boa ideia a respeito. Uma coisa que o establishment de defesa americano tem tradicionalmente compreendido muito bem é que os países não vencem guerras somente sendo mais corajosos que o outro lado, nem mais livres, nem um pouco preferidos por Deus. Os vencedores em geral são os caras que têm 5% a menos de aviões derrubados, ou que utilizam 5% menos combustível, ou que nutrem sua infantaria 5% a mais com 95% do custo. Esse não é o tipo de coisa que figure nos filmes de guerra, mas que constitui a própria guerra. E há matemática em cada passo do caminho.

Por que Wald viu o que os oficiais, que tinham um conhecimento e uma compreensão muito mais vastos dos combates aéreos, não conseguiram ver? Tudo volta para os seus hábitos matemáticos de pensamento. Um matemático sempre pergunta: “Quais são suas premissas? Elas se justificam?” Isso pode ser muito irritante, mas também bem produtivo. Nesse caso, os oficiais tinham uma premissa involuntária, de que os aviões que voltavam eram uma amostra aleatória de todos os aviões. Se isso fosse verdade, você poderia tirar conclusões sobre a distribuição dos furos de bala em todos os aviões examinando a distribuição dos furos apenas nos aviões sobreviventes. Uma vez reconhecendo que a hipótese é esta, basta um instante para perceber que ela está totalmente errada; não há motivo para esperar que os aviões apresentem uma probabilidade igual de sobrevivência, independentemente de onde são atingidos.

Num fragmento de jargão matemático, a taxa de sobrevivência e a localização dos furos de balas estão correlacionados. A outra vantagem de Wald era sua tendência para a abstração. Wolfowitz, que estudara com Wald em Columbia, escreveu que os problemas favoritos de seu colega eram “do tipo mais abstrato possível”, e que ele “sempre estava pronto para falar sobre matemática, mas não se interessava pela popularização nem pelas aplicações específicas”. A personalidade de Wald dificultava que ele focalizasse sua atenção em problemas aplicados, é verdade. A seu ver, os detalhes de aviões e metralhadoras eram puro enchimento– ele mirava direto por entre escoras e pregos que sustentavam a história. Às vezes essa abordagem pode levar você a ignorar características do problema que têm importância. Mas também permite que você veja o esqueleto comum compartilhado por questões que parecem muito diferentes na superfície. Assim você tem uma experiência significativa em áreas nas quais parece não ter vivência alguma.Para um matemático, a estrutura subjacente ao problema do furo de bala é um fenômeno chamado viés de sobrevivência, que sempre ressurge em todos os tipos de contexto. Uma vez que tenha familiaridade com ele, como Wald, você facilmente o percebe, onde quer que ele se esconda.

É como os fundos mútuos. A avaliação da performance dos fundos mútuos é uma área em que ninguém quer estar errado, nem um pouquinho só. Uma variação de 1% no crescimento anual pode ser a diferença entre um ativo financeiro valioso e aquela roubada. Os fundos na categoria Large Blend da Morningstar, investidos em grandes empresas que representam aproximadamente o S&P 500, parecem pertencer ao primeiro tipo. Os fundos nessa classe cresceram em média 178,4% entre 1995 e 2004, saudáveis 10,8% ao ano. Parece que você se sairia bem, se tivesse dinheiro, investindo nesses fundos, não?

Bem, não. Um estudo de 2006, feito pela Savant Capital, lançou luz um tanto mais fria sobre esses números. Pense outra vez em como a Morningstar gera seus cálculos. Estamos em 2004, você pega todos os fundos classificados como Large Blend e vê quanto cresceram nos últimos dez anos.

Mas falta alguma coisa: os fundos que não estão ali. Fundos mútuos não vivem para sempre. Alguns florescem, outros morrem. Os que morrem, de forma geral, são aqueles que não dão dinheiro. Logo, julgar o desempenho de uma década de fundos mútuos a partir daqueles que ainda existem no fim dos dez anos é como julgar as manobras evasivas dos nossos pilotos contando os furos de bala nos aviões que retornam. O que significaria não encontrar nunca mais de um furo de bala por avião? Não que os nossos pilotos sejam brilhantes em se esquivar do inimigo, mas que os aviões que foram atingidos duas vezes despencaram em chamas.

O estudo da Savant descobriu que, se fosse incluída a performance dos fundos mortos junto com a dos sobreviventes, a taxa de retorno cairia para 134,5%, num valor muito mais normal de 8,9% ao ano. Pesquisa mais recente respaldou essa conclusão. Um estudo abrangente realizado em 2011 e publicado na Review of Finance, cobrindo quase 5 mil fundos, descobriu que a taxa de retorno excedente dos 2.641 sobreviventes é cerca de 20% mais alta que a mesma cifra recalculada de modo a incluir os fundos que não deram certo. O tamanho do efeito de sobrevivência pode ter surpreendido os investidores, mas provavelmente não surpreenderia Abraham Wald.

Conclusão

O problema de Wald mostra, de forma elegante e quase desconcertante, que olhar apenas para os dados disponíveis pode levar a decisões erradas. Os furos de bala visíveis nos aviões não indicavam onde o risco era maior, mas justamente onde o dano era tolerável. O verdadeiro perigo estava nos pontos onde não havia dados, pois os aviões atingidos ali simplesmente não retornavam para ser observados.

Essa história cristaliza uma lição central do pensamento estatístico: correlação não implica causalidade — ou, dito de forma direta, “causalidade não é correlação”. O fato de certas áreas aparecerem mais danificadas não significa que elas sejam a causa das perdas; significa apenas que sobreviveram o suficiente para serem medidas. Confundir esses dois conceitos é um erro comum em ciência, negócios, saúde, política e na vida cotidiana.

A estatística, nesse contexto, não é apenas uma ferramenta matemática, mas um modo de pensar. Ela nos obriga a perguntar:

  • Quem ficou de fora dos dados?

  • O que não está sendo observado?

  • Que suposições estou fazendo ao interpretar números?

Em problemas cotidianos — desde avaliar a eficácia de um tratamento, interpretar resultados de IA, julgar estratégias de sucesso profissional ou tomar decisões pessoais — o raciocínio estatístico ajuda a evitar conclusões apressadas, vieses cognitivos e falsas certezas. O legado de Wald é lembrar que bons dados não bastam: é preciso saber o que eles representam, e principalmente o que eles escondem.

Referências