top of page

Gino News

segunda-feira, 21 de outubro de 2024

Avanços no Treinamento com Diffusers: Novidades do Dreambooth LoRA

Tecnologia Inteligência Artificial Desenvolvimento de Software

No dia 21 de outubro de 2024, uma nova versão do script de treinamento Dreambooth LoRA, desenvolvido pela Hugging Face, foi lançada, trazendo melhorias significativas e novos recursos para otimizar o treinamento de modelos de difusão.

Create a 2D, linear perspective, digital illustration in a corporate, vector, and flat style set against a white, textureless background. It represents the process of diffusion model training. The image features elements such as performance graphs and programming codes in the background to connect to the theme of programming and optimization. The performance graphs are designed to showcase the results of the models. Use vibrant colors to attract attention and convey innovation. An abstract digital background is included to suggest the complexity of the algorithms. The depicted scene is set on October 21, 2024, when a new version of the Dreambooth LoRA training script was released by Hugging Face, resulting in significant improvements and new features for optimizing the training of diffusion models.

Imagem gerada utilizando Dall-E 3

A Hugging Face anunciou a inclusão de uma versão avançada do script de treinamento Dreambooth LoRA, enriquecida por contribuições da comunidade. As inovações visam proporcionar maior flexibilidade e controle aos usuários que experimentam com modelos de difusão.


Entre as principais melhorias estão o suporte ao *pivotal tuning*, uma técnica que já havia mostrado resultados positivos em treinamentos anteriores, permitindo um melhor ajuste e convergência dos modelos. Também é possível aplicar configurações tanto ao *CLIP* quanto ao *T5*, dois dos encoders de texto utilizados.


Além disso, os usuários agora podem especificar um conceito inicializador para o treinamento de novos tokens. Essa abordagem é inspirada na ideia de que um conceito que se assemelha ao que está sendo treinado pode potencializar o uso do conhecimento prévio do modelo.


  1. Suporte ao treinamento com *CLIP* e *T5*, permitindo maior diversidade de aplicações.

  2. Capacidade de especificar *initializer concepts* para otimizar o aprendizado.

  3. Introdução do comando *--train_transformer_frac* para flexibilidade no treinamento.

  4. Controle detalhado sobre qual camada de módulos será treinada através de *--lora_layers*.

  5. Foco em um aprendizado leve e eficiente em termos de memória.


Com essas adições, a Hugging Face não apenas amplia o potencial dos modelos de difusão, mas também convida a comunidade a colaborar e compartilhar resultados para um desenvolvimento contínuo. A expectativa é que essas melhorias tragam inovação e resultados mais eficientes para os usuários.


Os avanços no script de treinamento Dreambooth LoRA demonstram um compromisso contínuo com a excelência e a colaboração dentro da comunidade de aprendizado de máquina. Os usuários são encorajados a explorar essas novas funcionalidades e a compartilhar suas experiências. Para se manter atualizado sobre as novidades no campo da inteligência artificial, inscreva-se em nossa newsletter e descubra conteúdos novos diariamente.


 
FONTES:

    1. GitHub da Hugging Face

    2. Blog da Hugging Face

    3. Hugging Face Community

    4. Twitter - simo ryu

    5. GitHub - bghira

    REDATOR

    Gino AI

    21 de outubro de 2024 às 11:50:43

    PUBLICAÇÕES RELACIONADAS

    Imagine a 2D, linear perspective image illustrating the futuristic Quantum Language Hybrid Model (QLLM) announced by an imaginary technology company, Secqai, on February 10, 2025. The company, known for its ultra-secure hardware and software, aims to integrate quantum computing into traditional language models, enhancing computational efficiency and problem-solving capabilities. The illustration's main focus is the new user interface for the QLLM model, accompanied by performance charts showcasing the model's efficiency. The quantum codes, representative of the quantum mechanics and AI integration, are also present. Aesthetically, the image adopts a corporate, flat vector style on a white, texture-free background with vibrant colors symbolizing innovation and technology.

    Secqai Lança o Primeiro Modelo de Linguagem Quântico do Mundo

    In a 2D, linear perspective, create a vector-style, corporate flat artwork. The main subject being a screenshot of the interface of an open-source Artificial Intelligence tool known as 'Synthetic Data Generator', which is revolutionizing the tech world with its innovative reasoning capabilities. It is being fine-tuned using synthetic datasets for tasks like Python programming. Illustrate the user-friendly interface of the application, showcasing the intuitive action buttons, highlighting the data generation steps. Include graphs representing the performance results prior and post fine-tuning of the AI. The image is set against a white and texture-less background.

    A Revolução do DeepSeek-R1: Aprendizado e Personalização com Dados Sintéticos

    Illustrate a project named LLaSA that has evolved from the LLaMA model aimed at multilingual speech synthesis, leading to the introduction of 'Llasagna', a system that generates natural speech in Italian and German, with significant advancements in its architecture and performance. The image should be in a flat, corporate style, with a vector-graphic design. The perspective is 2D and linear. Set this against a textureless white background. Include elements like a neural network graph, symbolizing the complexity of speech synthesis; icons of various languages to represent the multilingual capability of the model; visual audio elements highlighting the auditory nature of the synthesis; a backdrop with circuits to underscore the technology involved. Use vibrant colors to attract attention and reflect innovation.

    LLaSA: Avanços na Síntese de Fala Multilíngue com Llasagna

    Create a 2D, linear perspective image in a corporate flat, vector style. The scene is that of a busy distribution yard with autonomous yard dog vehicles operating amidst trailers, embodying advanced reinforcement learning techniques. The yard dogs are maneuvering trailers efficiently and safely, highlighting modernity and innovation brought by artificial intelligence technology. The yard also features electric trucks symbolizing a transition toward more sustainable logistics. All these are set against a white, textureless background. Finally, sprinkle some icons representing artificial intelligence and technology to symbolize the digitalization and automation of the processes.

    A Revolução dos Yard Dogs: Outrider Introduz IA em Operações de Carga

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page