Press "Enter" to skip to content
Você está em | Home | Tecnologia | O que é machine unlearning?

O que é machine unlearning?

Compartilhe

Um novo conceito emerge como peça-chave no tabuleiro da inteligência artificial: o machine unlearning.

Você já deve estar familiarizado com o termo machine learning ou “aprendizagem de máquina”, em livre tradução. Mas… e quanto ao seu oposto, o machine unlearning, ou “desaprendizagem de máquina”?

E eu sei que o termo “desaprendizagem” não existe, mas é uma forma de simplificar o entendimento para os mais leigos.

Este conceito está rapidamente se tornando fundamental para moldar o futuro da IA, especialmente no contexto dos modelos generativos. Desaprender se torna fundamental para garantir a confiabilidade e a viabilidade dos chatbots a longo prazo, e vale a pena entender como é importante dar um passo para trás para depois avançar de forma consistente.

 

A IA ainda é muito burra e mentirosa

“Errar é humano”. O problema é quando a borracha começa a gastar mais do que o lápis.

As inteligências artificiais são criadas e treinadas por humanos e, por causa disso, não estão isentas de equívocos. Não podemos nos esquecer que todas as plataformas de IA generativas ou chatbots estão em pleno processo de desenvolvimento e evolução, e podem eventualmente errar nas respostas e até mentir para completar o contexto dos resultados entregues ao usuário.

Um exemplo clássico do que estou falando é o ChatGPT, que ganhou popularidade no final do ano passado. Identificamos três tipos de erros associados a ele: desconhecimento, informações incorretas e geração de conteúdo irreal. Tais características podem ser equiparadas a alucinações e mentiras compulsivas de seres humanos.

Esses comportamentos, inerentes aos modelos generativos, têm causado turbulências entre especialistas em tecnologia e usuários que estão cada vez mais dependentes dessas ferramentas no dia a dia, mas que precisam aprender a lidar com elas neste momento presente, até mesmo para tirar o melhor proveito do que essas plataformas podem oferecer.

 

Por que o machine unlearning pode ser a solução

Para enfrentar esses problemas, a abordagem principal é “retreinar” o modelo de chatbot, seja adicionando ou removendo dados, seja ajustando algoritmos para possíveis melhorias e correções. Pode ser um processo que dá trabalho, mas é mais confiável que deixar a IA mentir o tempo todo para o usuário.

O grande problema aqui é que este processo é notoriamente custoso, estimando-se que treinar um modelo de IA com GPT-3.5 custe cerca de quatro milhões de dólares nos dias atuais. Esse valor possa chegar a 500 milhões de dólares até 2030, dadas as crescentes complexidades envolvidas no processo.

Além disso, o procedimento exige um investimento significativo de tempo, recursos humanos e capacidade de processamento de dados, o que faz com que os custos envolvidos no “retreinamento” sejam cada vez maiores, o que pode deixar essa estratégia ineficiente a longo prazo.

Neste cenário, entra em cena o conceito de machine unlearning. Sua origem remonta a 2007, quando os pesquisadores Alexander Strehl e Joydeep Ghosh introduziram a ideia de aplicar o desaprendizado automático para aprimorar a precisão dos classificadores de machine learning.

Eles demonstraram que o desaprendizado automático poderia reduzir o viés dos classificadores e melhorar sua precisão na entrega dos resultados, mesmo quando os dados de treinamento eram limitados. Na prática, desaprender é mais barato e eficiente que reaprender, e o conceito pode salvar os chatbots de um descrédito que pode ser inevitável se tudo ficar do jeito que está neste momento.

A técnica do machine unlearning ainda está em seus estágios iniciais de desenvolvimento, impulsionada pela proliferação de modelos generativos nos últimos anos. Atualmente, várias abordagens estão sendo empregadas, incluindo a exclusão de dados de treinamento defeituosos ou tendenciosos e a modificação dos pesos atribuídos a esses dados no modelo, com o intuito de minimizar sua influência nas respostas geradas.

Recentemente, a gigante Google lançou a primeira edição de seu desafio de machine unlearning. Essa competição, que teve início em meados de julho e se estenderá até setembro, visa avaliar a eficácia de diversos métodos de desaprendizado ao enfrentar uma mesma tarefa. Além disso, busca estabelecer métricas padronizadas que possam auxiliar na identificação da confiabilidade dessas abordagens.

No final das contas, o machine unlearning é mais um elemento que passa a fazer parte da corrida pela dominância do segmento da inteligência artificial conversacional. Que o uso dessa tecnologia é uma tendência de futuro, isso está mais do que claro. O que fica em dúvida aqui é se esse recurso será algo mais confiável no futuro do que é no presente, ou se teremos apenas uma verdadeira máquina produtora de fake news ambulante, o que é um potencial perigo para todos nós.

Dito isso, desaprender pode ser a salvação em larga escala. Mesmo porque uma IA pode aprender o errado, o ignorante e o maléfico de forma muito simples.


Compartilhe