Matemática decompõe causalidades para explicar melhor causa e efeito
Causa e efeito parece ser um conceito que entendemos intuitivamente: Puxe o cordão de um carrinho de brinquedo e o carrinho lhe seguirá. Naturalmente, as coisas vão ficando muito mais complicadas à medida que analisamos sistemas maiores, conforme o número de variáveis aumenta e o ruído entra em cena.
Eventualmente, pode se tornar quase impossível dizer se uma variável está causando um efeito ou está simplesmente correlacionada ou associada a ele – isto sem contar as variáveis fora do tempo, que violam a causalidade, ou o chamado tempo quântico, quando você não precisará esperar o tempo passar.
Mas fiquemos na física clássica, onde podemos considerar exemplos complexos o suficiente, como na ciência climática. Especialistas que estudam grandes padrões de circulação atmosférica e seus impactos no clima global gostariam de saber como esses sistemas podem mudar com o aquecimento do clima. São muitas variáveis que entram em jogo: Temperaturas e pressões do oceano e do ar, correntes e profundidades oceânicas e até mesmo detalhes da rotação da Terra ao longo do tempo. Mas quais variáveis causam quais efeitos medidos?
É aí que entra a teoria da informação, que funciona como um arcabouço para formular a causalidade.
E, para nossa sorte, um trio de pesquisadores do Caltech e do MIT, ambos nos EUA, acabam de desenvolver um método matemático que pode ser usado para determinar a causalidade mesmo em sistemas tão complexos quanto nas análises climáticas.
[Imagem: Álvaro Martínez-Sánchez et al. – 10.1038/s41467-024-53373-4]
Tipos de causalidade: redundante, sinérgica e oculta
A nova ferramenta matemática consegue extrair as contribuições que cada variável em um sistema faz para um efeito medido – tanto separadamente quanto, mais importante, quando as variáveis são consideradas em combinação.
A equipe chama seu novo método de SURD, uma sigla para a expressão em inglês “decomposição sinergística-única-redundante de causalidade”. Isto faz parte de uma campo conhecido como inferência causal, uma área multidisciplinar com potencial para impulsionar o progresso em muitos campos de pesquisas e de aplicações práticas.
O novo método também evita a identificação incorreta de causalidades. Isso ocorre principalmente porque ele vai além da mera quantificação do efeito produzido por cada variável de forma independente. Além do que os autores chamam de “causalidade única”, o método incorpora duas novas categorias de causalidade, a saber, causalidade redundante e causalidade sinérgica.
A causalidade redundante ocorre quando mais do que uma variável produz um efeito que foi medido, mas nem todas as variáveis são necessárias para chegar ao mesmo resultado. Por exemplo, um aluno pode tirar uma boa nota na prova porque é muito inteligente ou porque é um trabalhador esforçado. Ambos podem resultar em uma boa nota, mas apenas um é necessário; as duas variáveis são redundantes.
A causalidade sinérgica, ou sinergística, por outro lado, envolve múltiplas variáveis que devem trabalhar juntas para produzir um efeito – cada variável por si só não produzirá o mesmo resultado. Por exemplo, um paciente toma o medicamento A, mas não se recupera de sua doença. Da mesma forma, quando ele toma o medicamento B, ele não vê melhora. Mas, quando ele toma os dois medicamentos, ele se recupera completamente – os medicamentos A e B são sinérgicos.
O novo método SURD divide matematicamente as contribuições de cada variável no sistema em seus componentes únicos, redundantes e sinérgicos de causalidade. A soma de todas essas contribuições deve satisfazer uma equação de conservação de informação, que pode então ser usada para descobrir a existência de causalidade oculta, ou seja, variáveis que não puderam ser medidas ou que foram consideradas não importantes – se a causalidade oculta for muito grande, é necessário reconsiderar as variáveis incluídas na análise.
[Imagem: Álvaro Martínez-Sánchez et al. – 10.1038/s41467-024-53373-4]
Usos práticos
O novo modelo pode ser usado em qualquer situação em que seja necessário determinar a verdadeira causa ou causas de um efeito mensurável. Isso pode ser qualquer coisa, desde o que desencadeou a queda do mercado de ações, até a contribuição de vários fatores de risco na insuficiência cardíaca, quais variáveis oceânicas afetam a população de certas espécies de peixes, ou quais propriedades mecânicas são responsáveis pela falha de um material.
Para testar seu método, a equipe usou-o para analisar 16 casos de validação, cenários com soluções conhecidas que normalmente representariam desafios significativos para os métodos tradicionais de determinar a causalidade.
Para a equipe, o SURD será particularmente útil no projeto de sistemas de engenharia. Por exemplo, ao identificar qual variável está aumentando o arrasto de uma aeronave, o método pode ajudar os engenheiros a otimizar um projeto aeroespacial.
“Os métodos anteriores só dirão quanta causalidade vem de uma variável ou outra,” explica o pesquisador Ádrian Durán. “O que é único no nosso método é a sua capacidade de capturar o quadro completo de tudo o que está causando um efeito.”
A equipe também usou o SURD para estudar a geração de turbulência quando o ar flui ao redor de uma parede. Neste caso, o ar flui mais lentamente em altitudes mais baixas, e mais rapidamente em altitudes mais altas. Algumas teorias sobre este cenário sugerem que o fluxo de altitude mais alta influencia o que está acontecendo perto da parede e não o contrário; outras teorias sugerem exatamente o oposto, que o fluxo de ar perto da parede afeta o que está acontecendo em altitudes mais altas.
“Nós analisamos os dois sinais com o SURD para entender de que maneira as interações estavam acontecendo,” contou Durán. “Acontece que a causalidade vem da velocidade que está distante [da parede]. Além disso, há alguma sinergia onde os sinais interagem para criar outro tipo de causalidade. Essa decomposição, ou quebra em pedaços de causalidade, é o que é único para o nosso método.”
Artigo: Decomposing causality into its synergistic, unique, and redundant components
Autores: Álvaro Martínez-Sánchez, Gonzalo Arranz, Adrián Lozano-Durán
Revista: Nature Communications
Vol.: 15, Article number: 9296
DOI: 10.1038/s41467-024-53373-4