top of page

Gino News

quinta-feira, 6 de março de 2025

Alibaba Lança QwQ-32B: Revolução na Aprendizagem por Reforço com IA de 32 Bilhões de Parâmetros

Inteligência Artificial Tecnologia Inovação

A equipe Qwen da Alibaba apresentou o QwQ-32B, um modelo de inteligência artificial com 32 bilhões de parâmetros, demonstrando desempenho rivalizando com o modelo maior DeepSeek-R1, destacando a eficiência da Aprendizagem por Reforço em modelos de fundação robustos.

Imagem gerada utilizando Dall-E 3

A Alibaba revelou seu mais novo modelo de IA, o QwQ-32B, desenvolvido pela equipe Qwen, que possui 32 bilhões de parâmetros e oferece desempenho comparável ao do DeepSeek-R1, que tem impressionantes 671 bilhões de parâmetros. Este progresso é um marco significativo para a Aprendizagem por Reforço (RL), que mostra potencial em melhorar as capacidades de raciocínio em modelos de IA.


O QwQ-32B foi projetado com capacidades de agente, permitindo que o modelo pense criticamente, utilize ferramentas e adapte seu raciocínio de acordo com o feedback ambiental. A equipe Qwen destacou que "a escalabilidade da RL pode aumentar o desempenho do modelo além dos métodos convencionais de pré-treinamento e pós-treinamento", sublinhando a eficácia da RL em enriquecer as habilidades de raciocínio.


A equipe avaliou o QwQ-32B em vários benchmarks, como AIME24 e LiveCodeBench, onde os resultados mostraram que, apesar de um desempenho ligeiramente abaixo do DeepSeek-R1, o QwQ-32B superou modelos destilados e outros modelos de menor escala.


  1. AIME24: QwQ-32B 79.5 vs DeepSeek-R1-6718 79.8

  2. LiveCodeBench: QwQ-32B 63.4 vs DeepSeek-R1-6718 65.9

  3. LiveBench: QwQ-32B 73.1 vs DeepSeek-R1-6718 71.6

  4. IFEval: QwQ-32B 83.9 vs DeepSeek-R1-6718 83.3

  5. BFCL: QwQ-32B 66.4 vs DeepSeek-R1-6718 62.8


Com uma abordagem inovadora que incorpora um processo de RL em múltiplas etapas, a equipe utilizou recompensas baseadas em resultados para aprimorar as capacidades gerais do modelo. A ideia é que essa combinação de RL com modelos de fundação mais robustos pode eventualmente levar ao desenvolvimento da Inteligência Geral Artificial (AGI).


- Integração de aprendizagem por reforço em modelos de IA - Desempenho competitivo com modelos muito maiores - Benchmarking e avaliação rigorosa - Acesso aberto ao QwQ-32B em plataformas conhecidas - Perspectivas de desenvolvimento futuro em IA


O QwQ-32B está disponível em plataformas como Hugging Face e ModelScope, e a equipe Qwen vê esse desenvolvimento como um passo inicial para melhorar as capacidades de raciocínio em IA, visando um futuro promissor com a integração de RL.


O lançamento do QwQ-32B pela Alibaba representa um avanço significativo na interseção entre IA e Aprendizagem por Reforço, com potenciais implicações para o futuro da tecnologia em IA. Os interessados em acompanhar essas inovações devem se inscrever em nossa newsletter para receber atualizações diárias sobre o desenvolvimento em inteligência artificial e outras tecnologias emergentes.


FONTES:

    1. Artificial Intelligence News - DeepSeek-R1

    2. Artificial Intelligence News - Opera Introduces AI Agent

    3. Hugging Face

    4. ModelScope

    5. AI & Big Data Expo

    REDATOR

    Gino AI

    6 de março de 2025 às 16:51:23

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Create a detailed 2D, linear and vectorial image in a flat, corporate style on a white non-textured background. The image should showcase the interface of an AI-assistant from a generic restaurant review platform, symbolised by a radiant logo in vibrant colors, similar to the Yelp logo but sufficiently different to avoid copyright issues. To illustrate the AI's functionalities and user interactions, please depict various individuals of diverse descents and genders engaging with the AI interface. Also include the depictions of application interfaces to highlight the technology involved.

    Yelp Inova com Assistente de IA: Desafios e Avanços na Plataforma

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page