“Ela”, filme de Spike Jonze, é um dos meus preferidos da vida. Nele, o personagem de Joaquin Phoenix literalmente se apaixona por um sistema operacional que possui personalidade e identidade.
E qualquer um se apaixonaria por um sistema operacional com a voz da maravilhosa Scarlett Johansson.
Fato é que o sistema operacional de “Ela” possui na sua essência uma Inteligência Artificial com conceito de interação muito parecido com tudo o que é apresentado ultimamente pelas principais empresas do setor.
Se a OpenAI possui o GPT-4o com essa proposta de interação, o Google tem o Project Astra, que é uma evolução do Gemini que pode interagir com você na vida cotidiana de forma mais casual.
O que é o Project Astra?
O Project Astra é uma iniciativa do Google que visa desenvolver “agentes de IA universais que possam ser úteis em nossa vida cotidiana”.
Em outras palavras, trata-se de uma visão do futuro dos assistentes de voz, impulsionada pela inteligência artificial e pela visão computacional.
A “Ela” do filme. Literalmente.
Da mesma forma que a OpenAI propõe com o GPT-4o, o Project Astra deve ser encarado como uma evolução natural na proposta de interação com os chatbots generativos.
Até porque escrever é algo muito chato, e o ato de falar é algo bem mais intuitivo e acessível para todo mundo.
Como funciona o Project Astra?
O Project Astra utiliza a câmera do smartphone (ou de outros dispositivos) para captar informações visuais e combiná-las com a entrada de voz, criando uma experiência multimodal mais rica e interativa.
Isso permite que o assistente (entre outras interações):
- Entenda e responda da mesma forma que os humanos
- Lembre-se do que vê e ouve
- Reconheça objetos e cenas
- Tenha diferentes tons de voz
O Project Astra foi treinado em um enorme conjunto de dados de texto e código, o que lhe permite entender a linguagem natural e responder de forma contextual e informativa.
A ferramenta pode armazenar e recuperar informações do mundo real, fornecendo dessa forma respostas mais precisas e relevantes com base no contexto da conversa.
A visão computacional permite que o Project Astra identifique e classifique objetos, cenas e até mesmo pessoas em tempo real, abrindo um leque de possibilidades novas funcionalidades e interações.
Para uma interação mais pessoal, natural e expressiva, o Project Astra está sendo desenvolvido para oferecer modelos de síntese de voz com maior qualidade e variedade de entonações.
Onde (e como) o Project Astra pode ser útil
Se cumprir com tudo o que promete, o Project Astra tem tudo para ser uma revolução na interação homem-máquina no dia a dia.
Ele vai além de ser um assistente pessoal que agenda compromissos, define lembretes, envia mensagens ou realiza chamadas telefônicas. Ele poderá responder perguntas complexas e fornecer informações relevantes de forma mais intuitiva.
Pesquisar no Google será uma atividade de pessoas primitivas. É muito melhor perguntar para o assistente do Project Astra, que a resposta vem completa, ditada em segundos, com uma voz bem natural.
Ou seja, a Alexa poderá ser considerada uma ignorante em um futuro a médio prazo.
É claro que o Project Astra também pode controlar todos os dispositivos de nossa casa com comandos de voz e gestos, e a interação com óculos de realidade aumentada vai sobrepor informações no mundo real em formato digital.
Let the battle begin!
O Project Astra do Google chama o GPT-4o para a briga sem muitos constrangimentos.
As duas plataformas são semelhantes na proposta de interação por voz e em múltiplos dispositivos. Vamos ver como que cada uma se sai para convencer o grande público sobre a acessibilidade de suas respectivas soluções.
A OpenAI está sim na frente na corrida de Inteligência Artificial, mas o Google está investindo pesado nas suas soluções.
Lembre-se que essa corrida para ser a IA de referência apenas começou. E é uma longa jornada.