Curiosidades Vinicius Delmondes

O Gemini 1.5 Pro do Google agora pode nos ouvir e nos entender

O evento Google Next marcou o lançamento do Gemini 1.5 Pro, cuja disponibilização ao público foi anunciada através da plataforma de criação de aplicações de IA, a Vertex AI. Este anúncio representa a primeira atualização significativa desde o lançamento da nova versão da IA em fevereiro.

A mais recente versão do Google Gemini, conhecida como Gemini 1.5 Pro, traz uma série de avanços notáveis. Agora equipado com capacidade de reconhecimento de áudio, suporte para uma variedade ilimitada de arquivos multimídia e a habilidade de interpretar comandos, esta IA oferece aos desenvolvedores uma liberdade sem precedentes para explorar suas potencialidades no formato JSON. Com uma estrutura totalmente gratuita, o Gemini 1.5 Pro emerge como uma das ferramentas mais poderosas disponíveis no mercado de IA.

Uma das atualizações mais impactantes do Gemini 1.5 Pro é sua capacidade aprimorada de interpretar áudio. Agora capaz de processar até 9,5 horas de conteúdo sonoro, esta IA não apenas transcreve palavras, mas também captura nuances como entonação e emoção. Além disso, sua capacidade de reconhecimento estende-se a outros sons ambientais, como latidos de cachorro ou sons de chuva.

Com o Gemini 1.5 Pro, os usuários agora podem fazer upload de uma quantidade ilimitada de arquivos, incluindo imagens, vídeos e áudios, de forma gratuita. Esta expansão abre novas possibilidades criativas, permitindo que profissionais e estudantes utilizem a IA para gerar insights e soluções inovadoras. Seja criando quizzes com base em gravações de palestras ou resumindo teses a partir de documentos e fotografias, o Gemini oferece uma plataforma versátil e acessível.

Enquanto 2023 foi marcado pelo avanço das Inteligências Artificiais baseadas em texto, como o ChatGPT, 2024 promete ser o ano em que os agentes de IA assumirão tarefas em nome dos usuários. O Gemini pode compreender uma ampla gama de comandos e, com base nisso, executar ações personalizadas. Esta capacidade abre caminho para o desenvolvimento de assistentes virtuais personalizados, superiores aos modelos existentes como Siri ou Alexa, e com potencial para aplicação em diversos contextos, incluindo serviços de atendimento ao cliente.

Uma das características mais significativas do Gemini 1.5 Pro é seu modo JSON acessível ao público e livre de lista de espera. Este modo permite aos desenvolvedores extrair informações estruturadas a partir de texto, voz, vídeos ou imagens. Com uma capacidade de processamento notável, capaz de lidar com até 128 mil tokens, o Gemini oferece uma plataforma robusta para o desenvolvimento de soluções avançadas de IA.

Com o Gemini 1.5 Pro, o Google reforça seu compromisso com a inovação em IA. Este lançamento representa um passo significativo rumo a um futuro onde as capacidades das IA parecem ilimitadas. Estamos ansiosos para acompanhar os avanços contínuos nesta área, pois parece que ainda há muito a explorar.

Sobre o autor | Website

Para enviar seu comentário, preencha os campos abaixo:

Deixe um comentário

Seja o primeiro a comentar!

Por gentileza, se deseja alterar o arquivo do rodapé,
entre em contato com o suporte.