Google lança novo modelo de IA; saiba como usar


O Google lançou, nesta quarta-feira (11), o “Gemini 2.0”. A ferramenta é o novo modelo de IA (Inteligência Artificial) da empresa, que ajuda os usuários a criarem textos, imagens e até falas. O Primeira Página te explica as mudanças, como utilizar e quais são as intenções práticas da ferramenta.

Ferramenta cria textos, áudios e imagens. (Imagem: Google/Reprodução).
  1. 36 milhões devem ser beneficiados com isenção do Imposto de Renda

  2. Google oferta 70 mil bolsas gratuitas em 7 áreas de tecnologia

Por ora, a versão experimental da IA está disponível por meio da API Gemini e das plataformas de desenvolvedores de IA do Google. Os recursos de geração de áudio e imagem serão liberados apenas para mais usuários apenas em janeiro.

Há um ano, a Google lançou a ferramenta “Gemini”. A IA é capaz de realizar tarefas que exigem mais capacidade de raciocínio. A inteligência artificial ajuda programadores com códigos complexos quanto estudantes com a lição de casa, por exemplo. O modelo também contribui para oferecer respostas à pesquisas de usuários na aba de “busca” do próprio site.

Agora, na versão “tunada”, a IA utiliza raciocínio avançado e contexto expandido para atuar como um assistente de pesquisa, capaz de explorar temas complexos e criar relatórios detalhados. A ferramenta já está disponível para o Gemini Advanced.

Conforme comunicado da BigTech, o novo modelo de IA foi desenvolvido com hardware personalizado. “O Gemini 1.0 representou um avanço importante na forma como organizamos e entendemos informações. Com o Gemini 2.0, avançamos ainda mais, tornando essas informações mais úteis e impactantes. Mal posso esperar para ver tudo o que essa nova era pode trazer”, destacam na nota.

Na prática, o que o Gemini 2.0 Flash faz?

O Gemini 2.0 Flash é uma evolução do 1.5 Flash. Segundo a Google, a nova versão oferece desempenho ainda mais robusto e, em muitos casos, supera o 1.5 Pro em padrões de desempenho importantes, mantendo o dobro de velocidade. Entre os novos recursos, estão:

  • suporte a entradas multimodais, como imagens, vídeos e áudio;
  • geração de saídas multimodais (inteligência artificial gerar informações em vários formatos), incluindo imagens nativas combinadas com texto e áudio multilíngue ajustável por meio de texto-para-fala;
  • a geração de áudio é outro recurso destacado pelo Google. O modelo pode narrar texto usando uma das oito vozes “otimizadas” para diferentes sotaques e idiomas.

Como ter acesso?

A partir desta quinta, os usuários do Gemini do mundo inteiro poderão acessar a versão otimizada para chat do 2.0 Flash Experimental. Basta escolher a opção no menu de modelos, disponível para computadores e dispositivos móveis.



Fonte do Texto

VEJA MAIS

Trump pede que juiz rejeite processo por difamação do caso Central Park

O presidente eleito dos Estados Unidos, Donald Trump, pediu nesta quarta-feira (11) que um juiz…

Polícia prende agiota que ameaçou vítima com arma na cabeça

A Polícia Civil de Mato Grosso do Sul prendeu, nesta quarta-feira (11), um agiota acusado…

Que tal se aventurar pela Rota 66? Essa que é uma das mais famosas rodovias do mundo

A Rota 66, a lendária “Mãe das Estradas”, continua a encantar viajantes do mundo todo.…