Se a arte imita a vida, por que não uma Inteligência Artificial (ou os seus responsáveis) imitar a arte? Até porque… quem poderia imaginar que os nerds do mundo inteiro iriam perceber as semelhanças?
Eu amo a Scarlett Johansson, e bem antes dela se tornar a Viúva Negra no MCU. Ela é uma atriz multifacetda e extremamente competente em tudo o que faz, esbanjando talento em todos os papeis que interpreta.
E Johansson é tão competente na atuação, que se tornou inspiração para uma das vozes do novo recurso do ChatGPT. O que, obviamente, rendeu mais falatórios do que a sua própria voz em uma IA do mundo real.
A origem do problema
Na semana passada, a OpenAI apresentou ao mundo o GPT-4o, seu novo modelo de Inteligência Artificial que está por trás do ChatGPT. Eu já estou usando essa nova plataforma no computador e smartphone, e é sim possível detectar melhorias substanciais em relação ao GPT 3.5.
Um dos novos recursos que a plataforma apresentou é o seu modo de interação através de uma conversação natural, que está com um menor tempo de latência para respostas e maior capacidade para manter conversas naturais.
O recurso funciona muito bem. Bem até demais, considerando os fatos apresentados.
A demonstração do recurso durante a apresentação da OpenAI chamou a atenção de muita gente porque uma das vozes da ferramenta integrada ao ChatGPT, a “Sky”, foi comparada à da atriz Scarlett Johansson no filme “Ela” (Her, 2013), dirigido por Spike Jonze.
No filme (que é excelente, diga-se de passagem), o protagonista interpretado por Joaquin Phoenix basicamente se apaixona por um sistema operacional cuja interface interage com o usuário através de uma ferramenta de Inteligência Artificial, cujo assistente tem a voz de Johansson.
E não foram apenas os internautas que assistiram ao evento de apresentação da OpenAI que entenderam a referência ao filme. O programa humorístico Saturday Night Live (NBC) também destacou essa semelhança.
Em seu segmento Weekend Update, os apresentadores Michael Che e Colin Jost, fizeram piadas com o recurso do ChatGPT e a associação direta à voz da atriz.
Ou seja, estava mais do que claro que a OpenAI apontou no filme “Ela” e em Scarlett Johansson para a voz de “Sky”. E muitos chegaram a se perguntar se era realmente a atriz que emprestou a voz para o recurso.
Mas o grande plot twist dessa história vem agora.
Não é… mas bem que a OpenAI tentou…
Desde setembro de 2023, o ChatGPT oferece o recurso de interação por voz, com cinco opções que o usuário pode escolher: Breeze, Cove, Ember, Juniper e Sky (no Brasil, os nomes são diferentes).
Diante de toda essa confusão, a OpenAI teve que se pronunciar sobre o assunto e detalhar como foi o processo de seleção das vozes deste recurso. A empresa colaborou com profissionais de casting para selecionar as vozes, entre mais de 400 opções recebidas.
Os profissionais cujas vozes foram selecionadas receberam uma compensação financeira acima do mercado. Seus nomes não foram revelados para garantir a privacidade e a imagem dos profissionais.
O objetivo da empresa foi garantir que as vozes disponíveis no recurso são de pessoas reais, que foram remuneradas de forma justa. A OpenAI destaca este aspecto até mesmo para tentar responder às dúvidas do público.
A empresa também enfatizou que as vozes de IA não devem intencionalmente imitar celebridades, e afirma que a semelhança da voz “Sky” com a de Scarlett Johansson não foi proposital.
Mas… parece que o “jogo de imitação” realmente aconteceu, e a OpenAI não contou tudo para os seus usuários.
Depois que testemunhou as piadas no SNL e o falatório nas redes sociais, Scarlett Johansson emitiu um comunicado à imprensa afirmando que RECEBEU SIM uma oferta de Sam Altman, CEO da OpenAI, para ser uma das vozes presentes no recurso de interação do GPT-4o, mas recusou a oferta.
A atriz manifestou sua reação ao perceber que a voz de “Sky” era parecida com a sua, e não ficou muito contente com isso:
“Fiquei chocada, irritada e descrente de que o Sr. Altman perseguiria uma voz que soava tão estranhamente semelhante à minha que meus amigos mais próximos e veículos de notícias não podiam dizer a diferença”
Johansson reforça que dois dias antes do lançamento do GPT-4o, a OpenAI voltou a entrar em contato, pedindo que ela reconsiderasse a decisão. Mas antes mesmo que Scarlett pudesse dar uma resposta… BUM: o novo recurso foi apresentado, com a voz de “Sky”, muito semelhante à sua, disponível.
Resultado: Johansson, que não abaixou a cabeça nem mesmo para a Disney para brigar pela sua participação nos lucros como produtora de “Viúva Negra”, já contactou sua assessoria jurídica para um “te vejo nos tribunais” com Sam Altman.
Afinal de contas, a atriz exige esclarecimentos detalhados sobre a criação da “Sky”, já que existe a suspeita da OpenAI ter recorrido à prática de deepfake de voz para conseguir a voz similar ao da atriz em “Ela”.
Como estamos no momento
Em comunicado, a OpenAI anunciou a suspensão do uso da voz “Sky” devido às comparações com a voz de Johansson e as reações do público. E também por causa do processo que a atriz está movendo contra a empresa.
Não está claro se a voz será reabilitada no futuro ou se a suspensão será permanente. Muito provavelmente não veremos a “Sky” dando as caras novamente.
De qualquer forma, não podemos virar as costas para a solução apresentada pela OpenAI. Agora, o ChatGPT pode (inclusive) traduzir em tempo real, o que com certeza vai facilitar as comunicações entre pessoas que falam diferentes idiomas.
As conversas tendem a se tornarem mais fluídas, com um novo leque de possibilidades aberto para a redução das fronteiras idiomáticas.
Isso é… desde que a OpenAI pare de imitar vozes de celebridades de forma dissimulada. Senão, terá que pagar várias indenizações por isso.