top of page

Gino News

quinta-feira, 12 de setembro de 2024

OpenAI Lança Modelo de Raciocínio Econômico o1-mini

Tecnologia Inteligência Artificial Educação

A OpenAI lançou o o1-mini, um modelo de raciocínio econômico otimizado para STEM, que oferece desempenho quase equivalente ao modelo o1 em benchmarks como AIME e Codeforces, mas com um custo 80% menor. Disponível para usuários da API de nível 5, o o1-mini promete maior velocidade e eficiência em aplicações que exigem raciocínio sem amplo conhecimento mundial.

Create a 2D vector-style image on a plain white background. The scene takes place in a classroom or lab setting, with an artificial intelligence robot or avatar at its center, representing the o1-mini model from OpenAI. This AI figure is actively solving mathematical and coding problems, underscoring its STEM specialization. The room around the AI is filled with relevant symbols of reasoning and analysis - charts and equations. Use a color palette primarily composed of blues and greens to convey a sense of technology and innovation.

Imagem gerada utilizando Dall-E 3

O o1-mini é um modelo de raciocínio econômico lançado pela OpenAI, otimizado para tarefas de STEM, especialmente matemática e codificação. Ele quase iguala o desempenho do modelo o1 em benchmarks como AIME e Codeforces, mas com um custo significativamente menor. O modelo está disponível para usuários da API de nível 5 a um custo 80% mais barato que o o1-preview.


  1. Desempenho competitivo em AIME: 70.0% (o1-mini) vs. 74.4% (o1)

  2. Desempenho em Codeforces: 1650 Elo (o1-mini) vs. 1673 Elo (o1)

  3. Maior velocidade e menor latência em comparação com o o1-preview


O o1-mini foi treinado com o mesmo pipeline de aprendizado por reforço de alta computação que o o1, alcançando desempenho comparável em muitas tarefas úteis de raciocínio, enquanto é significativamente mais econômico. No entanto, o modelo tem desempenho inferior em tarefas que exigem conhecimento factual não-STEM.


- Desempenho em benchmarks acadêmicos como GPQA (ciência) e MATH-500 - Avaliações de preferência humana mostram vantagem em domínios de raciocínio - Segurança e robustez aprimoradas em comparação com GPT-4o


A OpenAI também destacou a segurança do o1-mini, que foi treinado com as mesmas técnicas de alinhamento e segurança que o o1-preview. O modelo mostrou 59% mais robustez contra jailbreaks em comparação com o GPT-4o. Limitações incluem conhecimento factual menor em tópicos não-STEM, com melhorias planejadas para versões futuras.


O lançamento do o1-mini pela OpenAI representa um avanço significativo na criação de modelos de raciocínio econômicos e eficientes, especialmente para aplicações em STEM. Com um custo reduzido e desempenho competitivo, o o1-mini tem o potencial de ampliar o acesso a tecnologias avançadas de IA. Futuras versões do modelo prometem abordar suas limitações atuais e explorar novas modalidades e especialidades.


 
FONTES:
  1. OpenAI

  2. OpenAI o1-preview

  3. Tier 5 API users

  4. Model Speed

  5. Limitations and What's Next

  6. o1-preview vs GPT-4o comparison

  7. System Card

  8. Souly et al. 2024

REDATOR

Gino AI

27 de setembro de 2024 às 20:18:26

PUBLICAÇÕES RELACIONADAS

Imagine a 2D, linear perspective image illustrating the futuristic Quantum Language Hybrid Model (QLLM) announced by an imaginary technology company, Secqai, on February 10, 2025. The company, known for its ultra-secure hardware and software, aims to integrate quantum computing into traditional language models, enhancing computational efficiency and problem-solving capabilities. The illustration's main focus is the new user interface for the QLLM model, accompanied by performance charts showcasing the model's efficiency. The quantum codes, representative of the quantum mechanics and AI integration, are also present. Aesthetically, the image adopts a corporate, flat vector style on a white, texture-free background with vibrant colors symbolizing innovation and technology.

Secqai Lança o Primeiro Modelo de Linguagem Quântico do Mundo

Create a 2D vector image in a flat and corporate style on a white, texture-less background. The image should prominently display a graph that illustrates a decrease in critical thinking as the usage of generative AI in the workplace increases, specifically shown through contrasting scales. Relevant to the data, include sober colors instilling a sense of caution about the situation. Additionally, design assorted icons that symbolize cognitive abilities, representative of those abilities at risk due to over-reliance on AI technology.

A Dependência da Inteligência Artificial e o Risco ao Pensamento Crítico

The image depicts the launch of ROOST, a dedicated organization for developing robust open online safety tools, and their partnership with Hugging Face on the 10th of February, 2025. The digital illustration, in a flat, corporate, vectorial style, shows a diverse team of developers; including a Caucasian male developer, an Hispanic female developer, a Black non-binary individual and a South Asian female, collaborating in a technology-centered environment. They are surrounded by icons of security and innovation, symbolizing ROOST's initiative. Elements such as computers, screens, and data graphics represent digital collaboration and security analysis in AI systems. The white, texture-less background is filled with data, representing an AI and open tools environment.

ROOST: A Revolução nas Ferramentas de Segurança Abertas para Tecnologias

In a 2D, linear perspective, create a vector-style, corporate flat artwork. The main subject being a screenshot of the interface of an open-source Artificial Intelligence tool known as 'Synthetic Data Generator', which is revolutionizing the tech world with its innovative reasoning capabilities. It is being fine-tuned using synthetic datasets for tasks like Python programming. Illustrate the user-friendly interface of the application, showcasing the intuitive action buttons, highlighting the data generation steps. Include graphs representing the performance results prior and post fine-tuning of the AI. The image is set against a white and texture-less background.

A Revolução do DeepSeek-R1: Aprendizado e Personalização com Dados Sintéticos

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page