OpenAI Lança Modelo de Raciocínio Econômico o1-mini

Tecnologia Inteligência Artificial Educação

A OpenAI lançou o o1-mini, um modelo de raciocínio econômico otimizado para STEM, que oferece desempenho quase equivalente ao modelo o1 em benchmarks como AIME e Codeforces, mas com um custo 80% menor. Disponível para usuários da API de nível 5, o o1-mini promete maior velocidade e eficiência em aplicações que exigem raciocínio sem amplo conhecimento mundial.

Imagem gerada utilizando Dall-E 3

O o1-mini é um modelo de raciocínio econômico lançado pela OpenAI, otimizado para tarefas de STEM, especialmente matemática e codificação. Ele quase iguala o desempenho do modelo o1 em benchmarks como AIME e Codeforces, mas com um custo significativamente menor. O modelo está disponível para usuários da API de nível 5 a um custo 80% mais barato que o o1-preview.

Desempenho competitivo em AIME: 70.0% (o1-mini) vs. 74.4% (o1)
Desempenho em Codeforces: 1650 Elo (o1-mini) vs. 1673 Elo (o1)
Maior velocidade e menor latência em comparação com o o1-preview

O o1-mini foi treinado com o mesmo pipeline de aprendizado por reforço de alta computação que o o1, alcançando desempenho comparável em muitas tarefas úteis de raciocínio, enquanto é significativamente mais econômico. No entanto, o modelo tem desempenho inferior em tarefas que exigem conhecimento factual não-STEM.

- Desempenho em benchmarks acadêmicos como GPQA (ciência) e MATH-500 - Avaliações de preferência humana mostram vantagem em domínios de raciocínio - Segurança e robustez aprimoradas em comparação com GPT-4o

A OpenAI também destacou a segurança do o1-mini, que foi treinado com as mesmas técnicas de alinhamento e segurança que o o1-preview. O modelo mostrou 59% mais robustez contra jailbreaks em comparação com o GPT-4o. Limitações incluem conhecimento factual menor em tópicos não-STEM, com melhorias planejadas para versões futuras.

O lançamento do o1-mini pela OpenAI representa um avanço significativo na criação de modelos de raciocínio econômicos e eficientes, especialmente para aplicações em STEM. Com um custo reduzido e desempenho competitivo, o o1-mini tem o potencial de ampliar o acesso a tecnologias avançadas de IA. Futuras versões do modelo prometem abordar suas limitações atuais e explorar novas modalidades e especialidades.