Anchor Deezer Spotify

A inteligência artificial bebe quilômetros de milhões de litros de água

A inteligência artificial bebe quilômetros de milhões de litros de água

Os moradores de The Dalles, uma pequena cidade do Oregon, vivem uma paradoxo. Apesar de a localidade estar às margens do caudaloso rio Columbia, ela possui um clima quase desértico: as precipitações são escassas e, há dois verões, as temperaturas chegaram perto dos 48 graus. A ameaça de restrições de água paira sobre os 15.000 habitantes da cidade há algum tempo. Por isso, não ficaram satisfeitos ao descobrir no início do ano que mais de um quarto do consumo total desse recurso valioso é atribuído a um centro de dados da Google, usado para refrigerar milhares de computadores que compõem a infraestrutura. De acordo com informações do meio local Oregon Live, os gastos da instalação triplicaram na última década, e a empresa de tecnologia planeja abrir dois centros de dados adicionais na bacia do Columbia. Ecologistas já alertaram que isso pode afetar a flora e fauna da região e até mesmo causar escassez entre os agricultores de The Dalles.

Não é um caso isolado nos Estados Unidos, país que abriga cerca de 30% de todos os centros de dados (datacenters) do mundo. ArizonaUtah e Carolina do Sul estão cientes da sede insaciável desse tipo de infraestrutura. O mesmo ocorre nos Países Baixos, onde a Microsoft se envolveu em um escândalo ano passado ao ser revelado que uma de suas instalações consumia quatro vezes mais água do que declarado em um contexto de seca. Na Alemanha, as autoridades de Brandemburgo negaram as licenças à Google para construir um centro de dados na região, alegando que uma gigafábrica da Tesla já consumia água em excesso.

Assistir a séries em streaming, usar aplicativos online (que não estão instalados no celular) ou armazenar fotos na nuvem é possível graças a uma infraestrutura global composta por uma grande variedade de centros de dados e mais de um milhão de quilômetros de cabos. A crescente complexidade das aplicações usadas diariamente exige cada vez mais poder de processamento. Tudo isso se traduz em legiões de computadores funcionando a plena capacidade dia e noite, cujo consumo de energia já representa pelo menos 2% do total mundial. Para evitar o superaquecimento das máquinas, é necessário refrigerá-las. Isso pode ser feito com sistemas de ventilação semelhantes aos usados em computadores pessoais, mas é mais econômico resfriar os processadores com água.

A sede das empresas de tecnologia está em ascensão. O consumo de água da Google aumentou 20% em 2022, segundo dados fornecidos pela própria empresa. E o da Microsoft, proprietária de 75% da OpenAI (os criadores do ChatGPT), aumentou 34% no mesmo período. Não estão incluídos aqui os recursos hídricos consumidos na geração de eletricidade que alimenta os servidores ou nos processos de fabricação do hardware. A Amazon, que juntamente com as duas anteriores controla quase metade dos hipercentros de dados em todo o mundo (aqueles com mais de 5.000 servidores) e cuja subsidiária AWS lidera o mercado de computação em nuvem, optou por não fornecer dados para este jornal.

A próxima em importância é a Meta, a matriz do FacebookInstagramWhatsApp e Messenger, que gastou 2,7% a mais em 2022. A empresa planeja abrir um desses hipercentros de dados em Talavera de la Reina, que, como antecipado pelo El País, consumirá mais de 600 milhões de litros anuais de água potável. Fontes da empresa afirmam que o projeto está avançando de acordo com as normativas competentes, embora as obras ainda não tenham começado.

Como se explica esse aumento repentino no consumo de água pelas empresas de tecnologia? Por que é menor na Meta ou na Apple do que na Microsoft e Google? Em 4 de novembro de 2022, foi apresentado o ChatGPT, o bot conversacional que deu início à corrida pela inteligência artificial (IA) generativa. O Google já tinha grandes modelos de linguagem semelhantes, como o LaMDA, em fase experimental, mas não os tinha aberto ao público. Para que esses modelos funcionem, é necessário treiná-los antes. Esse processo exige que legiões de computadores de alta potência (as GPUs) processem quantidades enormes de dados dia e noite durante semanas ou até meses para encontrar padrões nos textos que possam ser usados para articular fragmentos com sentido. No caso do GPT-4, a versão mais avançada até o momento do ChatGPT, esse treinamento foi realizado em Des Moines, Iowa, algo totalmente desconhecido pelos moradores até que um alto executivo da Microsoft afirmou em um discurso que “foi literalmente feito ao lado dos campos de milho de Des Moines”, conforme relatado pela Associated Press.

O esforço adicional para desenvolver grandes modelos de IA pode ter aumentado o consumo de água do Google e da Microsoft, as duas empresas que mais investiram nessa tecnologia. Isso é o que acredita o pesquisador Shaolei Ren, professor associado de engenharia elétrica e computacional da Universidade da Califórnia, Riverside, e especialista em sustentabilidade da IA. “Não podemos afirmar com certeza, a menos que as empresas forneçam dados concretos, mas o aumento de 2022 foi significativo em relação a 2021, e sabemos que nessa época elas investiram fortemente em IA generativa, bem como em outros serviços relacionados à IA”, explica por e-mail. “A IA foi integrada em quase todos os produtos diários da Microsoft e do Google, incluindo seus motores de busca”.

As empresas não fornecem dados sobre quanto mais água e energia custa treinar modelos de IA em comparação com o consumo habitual dos centros de dados. “O que sabemos, porque o diretor de uma dessas infraestruturas me confirmou, é que os chips usados no treinamento de IA consomem muito mais do que os servidores comuns”, destaca Ana Valdivia, professora de Inteligência Artificial, Governo e Políticas do Oxford Internet Institute, cuja pesquisa mais recente se concentra em avaliar o impacto ambiental da IA.

Ren publicará no fim do ano, junto com outros três colegas, uma pesquisa na qual oferecem uma estimativa de quanto custa em água conversar com o ChatGPT. Para cada 5 a 50 prompts (perguntas ou instruções), o ChatGPT consome meio litro de água. A faixa de 5 a 50 está relacionada à complexidade dos prompts. O cálculo inclui toda a água usada durante o treinamento do modelo, que é o momento de maior consumo, e a usada pela máquina para processar as ordens dadas à ferramenta.

As empresas afetadas apresentam outros argumentos. Uma porta-voz do Google diz que o grande salto no consumo de água em 2022 “corresponde ao crescimento do negócio”. A resposta da Microsoft é quase idêntica. Outras grandes empresas de tecnologia, como a Meta (2,7%) ou a Apple (8,5%), tiveram um aumento no consumo de água, mas significativamente menor do que o da Microsoft e Google. São gigantes empresariais e sua atividade cresceu, mas seu investimento em IA não é tão alto. Embora essa tecnologia esteja presente em suas aplicações, elas não têm grandes modelos semelhantes ao ChatGPT (ou como Bard, do Google, ou Copilot, da Microsoft).

Como a água é consumida

Os centros de dados têm a aparência de naves industriais, compostas por várias salas. Em cada uma delas, há fileiras de racks, ou torres de computadores do tamanho de um armário. Essas fileiras estão dispostas em corredores para que os operadores possam manipular os circuitos de cada máquina.

Os servidores emitem calor durante o funcionamento. A concentração de tantos computadores em um só lugar intensifica esse efeito. Muitos centros de dados recorrem a torres de resfriamento para evitar o superaquecimento, o mesmo sistema usado em outras indústrias. Esse método envolve expor um fluxo de água a uma corrente de ar em um trocador de calor, de modo que a evaporação resfrie o circuito.

Esse método é mais eficiente em termos energéticos do que os refrigeradores elétricos, mas implica que uma grande quantidade de água evapore (ou seja, não retorne ao circuito). “Essa é a água que aparece como ‘consumida’ nos registros das empresas de tecnologia. Dependendo da temperatura externa do bulbo úmido, uma torre de resfriamento geralmente consome entre um e quatro litros de água (até nove no verão) para cada kWh de energia do servidor“, afirma o estudo de Ren.

Aproximadamente 20% da água usada nos sistemas de resfriamento (a que não evapora) é despejada no fim do ciclo nas estações de tratamento de águas residuais. “Essa água contém grandes quantidades de minerais e sal, por isso não pode ser utilizada para consumo humano sem tratamento prévio”, ilustra Ren.

É difícil estabelecer qual é o consumo médio de um centro de dados. Aqueles localizados em climas mais frios precisam de menos refrigeração do que os demais. Da mesma forma, a demanda por água é diferente nas épocas mais quentes do ano em comparação com as mais frias. No entanto, eles precisam usar água limpa e tratada para evitar obstruções ou o crescimento de bactérias nos dutos. Quando se utiliza água do mar ou recuperada, é necessário purificá-la antes de introduzi-la nos sistemas de resfriamento. No caso do Google, quase 90% de seu consumo nos EUA provém de fontes potáveis, afirma Ren.

A localização é importante. Os centros de dados costumavam estar nas cidades, mas as crescentes necessidades energéticas dessas infraestruturas as expulsaram do ambiente urbano, incapaz de fornecer a quantidade necessária de recursos. “Eles também precisam de uma localização segura, com um fornecimento estável de eletricidade e sem risco de catástrofes climáticas. Por todas essas razões, nas últimas duas décadas, eles se mudaram para a periferia”, explica Lorena Jaume-Palasí, fundadora do Algorithm Watch e The Ethical Tech Society e assessora de ciência e tecnologia do Parlamento Europeu.

“Os centros de dados modernos são muito extensos. Geralmente, estão localizados perto do deserto ou em áreas agrícolas para poderem se expandir em extensão: é comum que módulos de servidores sejam montados e movidos conforme as necessidades”, destaca. Um estudo realizado por pesquisadores da Virginia Tech estima que um quinto dos centros de dados dos EUA consome água de bacias com estresse hídrico moderado ou alto, áreas onde geralmente há disponibilidade de energia solar ou eólica.

Aurora Gómez, do coletivo Tu Nube Seca Mi Río, nascido como reação ao megacentro que a Meta construirá em Talavera de la Reina, identifica um padrão por trás dessas ações. “As empresas costumam buscar para seus centros de dados áreas despovoadas e com altas taxas de desemprego para que haja pouca contestação social”, reflete.

Um problema sem perspectivas de solução

indústria está claramente apostando por integrar a inteligência artificial (IA) em cada vez mais produtos e serviços. Existe uma forma de treinar modelos de IA sem gastar grandes quantidades de água? Ren acredita que não. “Poderiam ser usados secadores elétricos para resfriar os computadores, mas eles consomem muita energia, o que aumentaria muito o consumo de água envolvido na geração de eletricidade. Na teoria, pode-se não usar água no processo, mas vejo isso como muito difícil”, conclui o acadêmico.

Isso é o que as empresas defendem, imersas em planos de melhoria de eficiência de seus sistemas. Segundo fontes da Meta, os novos centros de dados que a empresa planeja desenvolver, especialmente focados em IA, usarão sistemas de secagem elétrica, que não requerem água (além da necessária para gerar eletricidade). Um estudo recente de Javier Farfan e Alena Lohrmann, que leva em consideração os dados de consumo atuais e as perspectivas de crescimento econômico, estima que a Europa precisará de mais de 820 milhões de metros cúbicos de água por ano a partir de 2030 apenas para que possamos usar a internet.

Algumas vozes começam a fazer apelos para que usemos menos as ferramentas digitais. A ideia fundamental é a mesma que com o transporte ou o consumo de carne: a única forma eficaz de reverter a crise climática é reduzir os níveis de produção e consumo. Isso é o que sustentam as teorias do decrescimento.

Valdivia não acredita que o decrescimento digital seja a solução. “Acho que responsabilizar as pessoas por esse consumo é a abordagem errada. Além disso, os centros de dados são muito mais úteis e socialmente necessários do que, por exemplo, os carros elétricos. Existem alternativas para a mobilidade: você pode deixar o carro e pegar o ônibus ou o trem. Mas não há alternativa para os centros de dados“.