![](https://static.wixstatic.com/media/5032c8_7bc7cfbdef134417b652aefe00ba3b3c~mv2.png/v1/fill/w_81,h_81,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/5032c8_7bc7cfbdef134417b652aefe00ba3b3c~mv2.png)
Gino News
quinta-feira, 12 de setembro de 2024
OpenAI Lança Modelo de Raciocínio Econômico o1-mini
A OpenAI lançou o o1-mini, um modelo de raciocínio econômico otimizado para STEM, que oferece desempenho quase equivalente ao modelo o1 em benchmarks como AIME e Codeforces, mas com um custo 80% menor. Disponível para usuários da API de nível 5, o o1-mini promete maior velocidade e eficiência em aplicações que exigem raciocínio sem amplo conhecimento mundial.
![Create a 2D vector-style image on a plain white background. The scene takes place in a classroom or lab setting, with an artificial intelligence robot or avatar at its center, representing the o1-mini model from OpenAI. This AI figure is actively solving mathematical and coding problems, underscoring its STEM specialization. The room around the AI is filled with relevant symbols of reasoning and analysis - charts and equations. Use a color palette primarily composed of blues and greens to convey a sense of technology and innovation.](https://static.wixstatic.com/media/5032c8_fa27cab09f6e4748a46318925c011613~mv2.png)
Imagem gerada utilizando Dall-E 3
O o1-mini é um modelo de raciocínio econômico lançado pela OpenAI, otimizado para tarefas de STEM, especialmente matemática e codificação. Ele quase iguala o desempenho do modelo o1 em benchmarks como AIME e Codeforces, mas com um custo significativamente menor. O modelo está disponível para usuários da API de nível 5 a um custo 80% mais barato que o o1-preview.
Desempenho competitivo em AIME: 70.0% (o1-mini) vs. 74.4% (o1)
Desempenho em Codeforces: 1650 Elo (o1-mini) vs. 1673 Elo (o1)
Maior velocidade e menor latência em comparação com o o1-preview
O o1-mini foi treinado com o mesmo pipeline de aprendizado por reforço de alta computação que o o1, alcançando desempenho comparável em muitas tarefas úteis de raciocínio, enquanto é significativamente mais econômico. No entanto, o modelo tem desempenho inferior em tarefas que exigem conhecimento factual não-STEM.
- Desempenho em benchmarks acadêmicos como GPQA (ciência) e MATH-500 - Avaliações de preferência humana mostram vantagem em domínios de raciocínio - Segurança e robustez aprimoradas em comparação com GPT-4o
A OpenAI também destacou a segurança do o1-mini, que foi treinado com as mesmas técnicas de alinhamento e segurança que o o1-preview. O modelo mostrou 59% mais robustez contra jailbreaks em comparação com o GPT-4o. Limitações incluem conhecimento factual menor em tópicos não-STEM, com melhorias planejadas para versões futuras.
O lançamento do o1-mini pela OpenAI representa um avanço significativo na criação de modelos de raciocínio econômicos e eficientes, especialmente para aplicações em STEM. Com um custo reduzido e desempenho competitivo, o o1-mini tem o potencial de ampliar o acesso a tecnologias avançadas de IA. Futuras versões do modelo prometem abordar suas limitações atuais e explorar novas modalidades e especialidades.
FONTES:
REDATOR
![](https://static.wixstatic.com/media/5032c8_e66e56f34bf54dc7b94651b02da23d40~mv2.png/v1/fill/w_108,h_108,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/5032c8_e66e56f34bf54dc7b94651b02da23d40~mv2.png)
Gino AI
27 de setembro de 2024 às 20:18:26
PUBLICAÇÕES RELACIONADAS