Press "Enter" to skip to content

Já dá para editar imagens no Google Gemini

Compartilhe

O Gemini quer mesmo o protagonismo no mercado de inteligência artificial, evoluindo de uma ferramenta generativa para um ecossistema visual avançado. Parte da transformação está na chegada do recurso de edição de imagens a partir do diálogo natural.

A ideia aqui é oferecer uma experiência de edição de imagens intuitiva para milhões de usuários ao redor do mundo, onde é possível realizar as alterações apenas e tão somente com a interação por texto, dispensando o uso de interfaces visuais mais complexas.

Vamos entender melhor o que o Google preparou para o Gemini no segmento de edição de imagens. E descobrir se o Photoshop está com os dias contados.

 

Os recursos de edição visual

O novo recurso permite modificações complexas através de simples comandos de texto, eliminando interfaces técnicas. Com o Gemini, os usuários transformam imagens próprias ou geradas pela IA solicitando alterações como substituição de objetos, mudança de cenários e experimentação com retratos pessoais.

Basta expressar em linguagem natural: “colocar chapéu azul no cachorro” ou “substituir grama por areia”, e o sistema executa mantendo coerência visual da imagem original.

Diferentemente de ferramentas tradicionais, o Gemini integra edição de imagens diretamente no ambiente de diálogo, permitindo ajustes contínuos até o resultado desejado.

Esse tipo de integração cria oportunidades para narrativas enriquecidas onde texto e imagem se complementam.

Um exemplo prático do recurso é a geração de histórias ilustradas em tempo real, com imagens que se adaptam à narrativa, ampliando possibilidades criativas e educacionais.

 

Do experimental ao integrado

Antes da implementação oficial, os recursos foram testados no Google AI Studio, laboratório que permitiu explorar capacidades de manipulação visual em ambiente controlado.

A plataforma permitiu o refinamento das funcionalidades agora incorporadas ao ecossistema principal, demonstrando o compromisso do Google com qualidade, usabilidade e segurança.

Todas as imagens produzidas ou modificadas incorporam o SynthID, marca d’água digital invisível desenvolvida pelo Google DeepMind. Essa é uma tecnologia que identifica automaticamente os conteúdos gerados por IA, funcionando como certificado digital da imagem.

Disponível como código aberto, ela permite que outros desenvolvedores implementem sistemas similares.

O Google também experimenta marcas d’água visíveis, criando camadas de segurança essenciais para estabelecer confiança no ecossistema digital.

 

Disponibilidade e impacto global

Desde abril de 2025, o Google iniciou a liberação do recurso de edição de imagens no Gemini em mais de 45 idiomas e na maioria dos países, em um lançamento escalonado para realizar ajustes com base no feedback dos usuários. Os recursos ainda não estão disponíveis para contas Workspace e Education.

O lançamento representa uma grande mudança na relação entre usuário e conteúdo digital, democratizando ferramentas avançadas de edição que, a partir de agora, estarão nas mãos de educadores, criadores de conteúdo, profissionais de marketing e usuários comuns.

A combinação fluida de texto e imagem em interface conversacional acelera os processos criativos e abre caminhos para novas formas de comunicação visual.

Assim, o Gemini vai se consolidando como plataforma verdadeiramente multimodal, transcendendo limitações de sistemas baseados apenas em texto, redefinindo o seu papel como inteligência artificial generativa.

E o Photoshop (e o Canva, e vários outros aplicativos similares) que se cuide, pois a concorrência começou a ficar mais pesada.

E inteligente.

 

Via Google Blog


Compartilhe