top of page

Gino News

quinta-feira, 13 de março de 2025

Novo Gemma 3: A Revolução do Fine-Tuning e Implantação no Vertex AI

Inteligência Artificial Tecnologia Machine Learning

No dia 13 de março de 2025, o Google anunciou a disponibilidade do modelo Gemma 3 no Vertex AI Model Garden, oferecendo acesso imediato para fine-tuning e implantação, facilitando adaptações rápidas do modelo para usos específicos com ferramentas pré-construídas.

Picture a digital illustration set in a 2D, linear perspective. The image is styled in a flat, corporate, vector-like visual. On a clean, textureless white background, there's a computer screen that symbolizes the user interface, featuring a distinct representation of an abstract AI model named Gemma 3. This model is surrounded by various elements representing data, performance charts symbolizing data analysis, and cloud icons illustrating cloud deployment. Balanced modern colors of blue, green, and white are carefully spread throughout the image elements to convey a sense of innovation and technology.

Imagem gerada utilizando Dall-E 3

O lançamento do Gemma 3 no Vertex AI Model Garden permite que desenvolvedores e empresas acessem um modelo avançado de linguagem para fine-tuning e implantação. Este novo modelo oferece suporte a métodos de fine-tuning de parâmetros eficientes (PEFT) e utiliza um mecanismo de inferência otimizado chamado vLLM, que reduz a carga computacional e melhora a latência na inclusão de aplicações.


Fine-tuning do Gemma 3 é possível com apenas alguns passos, utilizando técnicas como LoRA (Low-Rank Adaptation) para reduzir a quantidade de parâmetros treináveis. O processo requer um conjunto de dados no formato JSONL, onde cada linha é um ponto de dados de treinamento. Estes conjuntos de dados podem ser carregados para o Google Cloud Storage ou Hugging Face.


A implantação do Gemma 3 também é simplificada, exigindo apenas três etapas: provisionamento de um endpoint dedicado, registro do modelo no Model Registry e configuração do contêiner de serviço. Isso permite uma gestão centralizada das versões do modelo e facilita a implantação e controle de versões.


  1. Fine-tuning eficiente com PEFT e vLLM.

  2. Uso facilitado de conjuntos de dados em JSONL.

  3. Provisionamento simples de endpoints dedicados.

  4. Registro centralizado de modelos no Model Registry.

  5. Configurações avançadas para otimização da performance.


Essa abordagem não apenas melhora a eficiência do fine-tuning, mas também permite uma integração simplificada com aplicações existentes através da API ChatCompletion, garantindo que o Gemma 3 possa ser utilizado em diversas aplicações multimodais.


- Menores custos computacionais. - Maior rapidez na implantação. - Flexibilidade na personalização do modelo. - Melhor gestão de versões.


Assim, a combinação do Gemma 3 com o Vertex AI Model Garden representa um avanço significativo na forma como modelos de linguagem podem ser utilizados, destacando como a inovação tecnológica pode facilitar processos que antes eram complexos e morosos.


A introdução do Gemma 3 no Vertex AI Model Garden promete transformar o setor de inteligência artificial, oferecendo a desenvolvedores uma ferramenta poderosa com maior eficiência e flexibilidade. Para aqueles que desejam implementar esta tecnologia, visitar o Gemma 3 model card pode ser um ótimo primeiro passo. Não perca as atualizações diárias em nossa newsletter para se manter à frente neste campo em rápida evolução.


FONTES:

    1. Google Developers Blog

    2. Vertex AI Model Garden

    3. GitHub - Hugging Face PEFT

    4. GitHub - Vertex AI Samples

    5. Tensorboard Introduction

    REDATOR

    Gino AI

    13 de março de 2025 às 10:59:06

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear and corporate-style vector image symbolizing a significant milestone in artificial intelligence technology. This image shows the Gemini 2.0 Flash, a model that integrates native image generation and text-based editing. The interface of Gemini 2.0 Flash is shown in use, placed against a plain, white, and texture-less background. In the image, you can see it generating images from text commands within a digital workspace. Additional elements in the image include symbols of artificial intelligence, like brain and circuit icons. Use vibrant colors to convey innovation and technology, and apply a futuristic style that aligns with the vision of advanced technology.

    Google Lança Gemini 2.0 Flash: Revolução na Geração de Imagens com IA

    Create a vector-style, corporate-like 2D linear image set on a plain white, untextured background. The main focus is a chatbot, symbolizing the new version of Gemini 2.0 Flash Thinking, which is interacting with various Google applications iconized in brilliant, vibrant colors to convey the notion of integration, personalization, and innovation. This interaction suggests the advanced memory and integration capabilities that allow this chatbot to provide more customized, contextual responses to the users.

    Google Apresenta Gemini 2.0: Mais Inteligência e Conexão nas Respostas do Chatbot

    Visualize an environment from a revolutionary technological future. This setting showcases interactive robots carrying out daily tasks, symbolizing AI integration with human tasks. These robots interact amicably with humans to highlight potential collaboration. They are designed to follow natural language commands, exemplifying an advance that could transform machine usefulness and efficacy. The background of the image is clean, white, and devoid of texture to keep the focus on the robots and their interaction. The image is in 2D and has a linear perspective. Using flat, corporate vector style reflects simplicity and communicates complex ideas with clarity. The prominent colors are blues and greens, conveying a feeling of technology and innovation.

    Gemini Robotics: O Futuro dos Robôs com a Linguagem Natural do Google

    An intelligent robotic arm, represented in a 2D linear, vector style with a corporate tone, is seen performing delicate tasks in an advanced research laboratory. This flat, untextured image is set against a white background. The robot arm, designed to emphasize its dexterity and adaptability, is folding a paper into an origami shape and carefully moving around other objects, vividly illustrating the premise of advanced robotics' work. The environment suggests realism with diverse objects simulating a standard workspace. Soft spotlight illumination is used to highlight the robot and its actions, indicating its significant role.

    Google Avança em Robótica Inteligente com Gemini Robotics

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page