Você está em | Home | Inteligência Artificial e chatbots | Tudo sobre a DeepSeek (até agora)

Tudo sobre a DeepSeek (até agora)

Compartilhe

Foi só eu ficar um tempo fora (por conta de uma mudança de apartamento), e tão logo liguei novamente o notebook, e temos um novo chatbot de Inteligência Artificial para capitalizar todas as atenções: o DeepSeek.

Não se fala em outra coisa. Ele está tão popular, que superou o ChatGPT nas principais lojas de aplicativos, e em uma velocidade impressionante. Sim, eu sei… é um pouco assustador, considerando que temos mais uma plataforma para saber mais sobre nós….

Mas… quem realmente se importa com isso? Desde que você possa contar com mais uma alternativa de chatbot para ser o seu amigo nas noites solitárias, é o que importa.

 

O que é o DeepSeek?

DeepSeek é uma empresa chinesa especializada em inteligência artificial, que dá o nome para esse chatbot de IA que destacamos neste artigo.

Esse modelo de linguagem é uma alternativa a ferramentas como ChatGPT e Google Gemini, oferecendo soluções voltadas para o desenvolvimento de software, processamento de linguagem natural e automação empresarial.

Ou seja, não se anime muito com a ideia de produzir receitas inusitadas de miojo com essa IA, pois não é exatamente o foco da plataforma.

Seu diferencial está no fato de ser open source, permitindo que desenvolvedores tenham acesso ao código-fonte para personalizações, inclusive comerciais. Dessa forma, qualquer um (pessoa física ou jurídica) pode se valer dos seus benefícios, sem precisar pagar os royalties disso (por enquanto).

É uma transparência que contrasta com todo o sigilo de outros modelos de Inteligência Artificial proprietários. E, mesmo assim, o DeepSeek tem o potencial de competir e até mesmo superar as alternativas privadas.

Sendo de código aberto, totalmente colaborativo, com vários forks que serão desenvolvidos e contando com uma gratuidade mais do que desejada (sem qualquer tipo de assinatura para o modelo mais avançado), o DeepSeek é um paraíso na Terra, certo?

Calma…

 

Os dois modelos de IA do DeepSeek

Neste primeiro momento, a DeepSeek (como plataforma de Inteligência Artificial), trabalha com dois modelos específicos para o seu desenvolvimento e retorno de resultados para os usuários.

  • DeepSeek V3: Um modelo de linguagem de larga escala que superou ferramentas como Llama 3.1 e GPT-4 em eficiência e custo. Com apenas US$ 5,5 milhões em treinamento, ele é economicamente mais viável do que os US$ 80 milhões investidos no GPT-4.
  • DeepSeek R1: Especializado em raciocínio, o R1 alcançou resultados superiores em testes matemáticos e de programação, como os 97,3% de acerto no MATH-500, superando os 96,4% do OpenAI. Embora eficiente e inovador, o modelo reflete a regulamentação chinesa, alinhando suas respostas à ideologia do governo, restringindo temas sensíveis como Taiwan ou Tiananmen.

A maioria dos meros mortais deve utilizar o DeepSeek V3 sem maiores problemas. Ele deve comtemplar a maioria das necessidades da maioria dos usuários.

Para os mais exigentes, ou aqueles com questões específicas que precisam ser resolvidas por uma IA, a DeepSeek R1 passa a ser uma necessidade.

A tendência é que a versão mais básica “herde” recursos da versão mais avançada com o passar do tempo.

 

Como o DeepSeek funciona na prática

O DeepSeek foi desenvolvido com aprendizado por reforço puro, sem dados previamente rotulados. Esse é um marco técnico que permite à IA aprender por tentativa e erro, refinando suas respostas com o tempo.

É uma estratégia para evitar as tais alucinações de resultados, que se tornaram comuns em outras plataformas de IA.

Após essa etapa de treinamento, o modelo recebeu ajustes supervisionados para maior consistência e confiabilidade nos resultados.

Porém, como já destaquei no texto, o DeepSeek ainda deve “alucinar” nos temas sensíveis aos chineses, de modo que é importante comparar como que a plataforma se sai diante de outras plataformas em cenários específicos.

Sua interface é amigável, com funcionalidades semelhantes a outros chatbots, incluindo um histórico de conversas e recursos como o botão DeepThink R1, que oferece respostas mais elaboradas.

O aplicativo da plataforma pode ser acessado tanto online quanto por meio de uma versão móvel, sendo totalmente gratuito nos dois casos.

A IA é capaz de entender contextos complexos e oferecer respostas detalhadas com base em seu treinamento ou na internet.

O DeepSeek é extremamente versátil e pode ser usado para diversas finalidades:

  • Consultas Gerais: Responde a perguntas sobre personagens, lugares e conceitos de forma direta e clara.
  • Explicações Complexas: Pode simplificar tópicos complicados mediante solicitação.
  • Análise de Documentos: Permite extrair informações e responder a perguntas relacionadas ao conteúdo.
  • Desenvolvimento de Software: Escreve, otimiza e corrige códigos.
  • Produção de Conteúdo: Cria ideias, textos, poemas e estruturas para artigos, além de revisar e corrigir redações.

 

E ainda tem gerador de imagens por IA

Não satisfeita em abalar o mercado apresentando um chatbot com enorme potencial para bater de frente com a concorrência, a DeepSeek ainda apresentou o Janus Pro 7B, IA voltada para a geração de imagens a partir de texto e compreensão de outras imagens.

O modelo também é de código aberto, mas possui restrições específicas de licenciamento, semelhante ao Llama. Ele pode unificar tarefas de geração e compreensão de imagens, um desafio que outros modelos multimodais enfrentam ao comprometer eficiência ou desempenho em uma das áreas.

O Janus Pro 7B utiliza uma arquitetura baseada no conceito de “dupla trilha” para processamento visual. Isso significa que ele separa os caminhos de codificação para entender e gerar imagens, mas mantém um único transformador para processar todas as informações.

Ele também incorpora o SigLIP-L como codificador visual, otimizando o trabalho com imagens de 384×384 pixels. É uma resolução menor que a de modelos como Midjourney, mas que prioriza a velocidade de processamento e a qualidade dentro de seu escopo de aplicações.

O Janus Pro 7B é considerado compacto no seu tamanho, com “apenas” 7 bilhões de parâmetros, mas consegue entregar um desempenho competitivo em relação a modelos maiores e mais especializados.

Sua eficiência será fundamental para aplicações que exigem rapidez e precisão em tarefas multimodais. A combinação da arquitetura com o tamanho reduzido faz do Janus Pro 7B um modelo ideal para desenvolvedores que buscam implementar soluções ágeis e robustas.

O Janus Pro 7B combina duas licenças complementares:

  1. a licença MIT, que permite uso e modificação livres para fins comerciais;
  2. e a licença específica da DeepSeek, que adiciona restrições éticas, como a proibição de uso militar e a geração de desinformação.

É uma proposta de licenciamento que busca equilibrar a acessibilidade com a responsabilidade ética no uso da tecnologia.

A ideia aqui é oferecer uma abordagem singular e unificada, priorizando uma eficiência na arquitetura de IA e, em função disso, resultados melhores e mais rápidos na geração de imagens.

O Janus Pro 7B é baseado no DeepSeek-LLM-7b, que já oferecia capacidades avançadas de processamento de linguagem e agora incorpora recursos visuais superiores.

O sistema de sub-amostragem 16x para geração de imagens é outro aspecto que chama a atenção nessa proposta.

A técnica permite manter a alta eficiência sem sacrificar a qualidade do material gerado. E esse é um grande desafio para qualquer plataforma de IA neste momento.

 

O DeepSeek é melhor que o ChatGPT?

Essa é a principal pergunta que todo mundo está fazendo neste momento. E os primeiros testes comparando o DeepSeek com o seu principal concorrente já aconteceram.

Os testes comparativos mostram que ambas as inteligências artificiais respondem corretamente a perguntas lógicas, mas o DeepSeek oferece explicações mais detalhadas e visuais, especialmente com a funcionalidade “DeepThink”.

A ferramenta permite que os usuários acompanhem o processo de pensamento da IA em tempo real, agregando transparência e profundidade às respostas.

O DeepSeek possui a funcionalidade de busca direta na internet, classificando as informações localizadas por categorias como internacional, nacional e econômica, o que facilita a organização e compreensão dos dados apresentados.

Embora o ChatGPT também acesse informações em tempo real, o DeepSeek oferece maior riqueza de detalhes e transparência nas fontes.

Por outro lado, o DeepSeek é limitado pelas já mencionadas imposições políticas da China, como restrições ao gerar conteúdo sobre alguns temas.

O que contrasta com o ChatGPT, que tem maior liberdade para abordar esses tópicos, embora também possa apresentar vieses tendenciosos, dependendo da fonte de dados e até mesmo do usuário que está interagindo com o chatbot.

Ao comparar serviços ou responder a questões técnicas, o DeepSeek se destaca por entregar explicações mais naturais e menos mecânicas.

Sua capacidade de criar tabelas e resumos visuais oferece uma experiência mais interativa e intuitiva, especialmente em cenários que exigem comparações detalhadas.

Um dos maiores trunfos do DeepSeek é o custo reduzido de geração de respostas. O modelo é até 96,4% mais econômico que o ChatGPT, tornando-se uma alternativa viável para pesquisas em larga escala.

E o fato de ser um chatbot de código aberto torna a proposta colaborativa, além de facilitar a inovação por parte de pesquisadores e desenvolvedores.

Já o ChatGPT te obriga a jogar dinheiro na cara do Sam Altman para obter os mesmos resultados.

Neste momento, cravar que o DeepSeek é melhor que o ChatGPT soa quase como um atrevimento. Mas é preciso ficar de olho nele e no seu potencial.

A China está fazendo grandes avanços no campo de Inteligência Artificial, com investimentos generosos no setor. E não será surpresa se essa e outras plataformas suplantarem os resultados alcançados pelas ferramentas ocidentais.

O DeepSeek pode ser a primeira grande quebra de paradigma nessa grande disputa que é o universo das IAs. Ou pode não significar absolutamente nada, além de mais uma grande briga do governo norte-americano contra uma empresa chinesa.

Como sempre, é o tempo que vai dizer se é uma coisa ou outra. Ou se serão várias.


Compartilhe