Na quarta-feira (03), o Google revelou o Gemma 4 12B, um novo modelo de inteligência artificial projetado para realizar tarefas multimodais diretamente em notebooks. Esta inovação permite que o sistema processe áudio e visão sem depender de hardware em nuvem, proporcionando maior flexibilidade e autonomia aos usuários.

Características do Gemma 4 12B

De acordo com o anúncio, a família de modelos Gemma já ultrapassou 150 milhões de downloads. O Gemma 4 12B é um modelo de tamanho médio, posicionado entre as versões E4B e 26B da linha. Este é o primeiro modelo intermediário que oferece suporte nativo para entradas de áudio, expandindo suas capacidades.

Arquitetura e eficiência

A principal inovação do Gemma 4 12B é sua arquitetura unificada, que elimina a necessidade de codificadores multimodais separados. Em sistemas tradicionais, a tradução de imagens e sons envolve componentes distintos, o que aumenta o consumo de memória e a latência. O novo modelo, por sua vez, foi treinado com uma estrutura simplificada que permite o fluxo direto de dados visuais e sonoros para o núcleo do modelo de linguagem.

Desempenho comparativo

Nos testes de eficiência, o Gemma 4 12B, com 12 bilhões de parâmetros, obteve resultados próximos ao modelo 26B MoE, mas com um consumo de memória reduzido para menos da metade. Essa otimização é crucial para permitir a execução de fluxos de trabalho complexos e o funcionamento de agentes autônomos em hardware convencional.

Recursos adicionais

Além disso, o modelo inclui preditores de múltiplos tokens, que visam diminuir o tempo de resposta em suas operações. Essa característica é especialmente valiosa para desenvolvedores que buscam criar aplicações de IA eficientes e responsivas.

Acesso e personalização

O ecossistema do Gemma 4 12B está disponível publicamente sob a licença de código aberto Apache 2.0, permitindo que desenvolvedores acessem o código-fonte. Isso possibilita a criação de automações locais e ferramentas personalizadas, ampliando ainda mais as aplicações da tecnologia.