top of page

Gino News

terça-feira, 24 de setembro de 2024

OpenAI Lança Modelos o1 com Avanços em Raciocínio

Tecnologia Inteligência Artificial Inovação

No dia 12 de setembro de 2024, a OpenAI lançou os modelos *o1-preview* e *o1-mini*, prometendo melhorias significativas em raciocínio e resolução de problemas complexos, em meio a expectativas crescentes sobre o modelo de próxima geração, codinome 'Strawberry'.

A conceptual artwork representing the launch of the new o1 models by OpenAI on September 12, 2024. The image should illustrate elements symbolizing reasoning and artificial intelligence such as gears, circuits, and performance charts, all presented in a 2D, linear perspective. The gears are indicative of the reasoning process and complexity, performance charts display the impressive results of the models in benchmarks, and circuits symbolise the link between AI and technology. The use of blue and green colors add a sense of modernity and innovation. A tech-centric and innovative background and a textureless white for the backdrop is suggested. The artistic style should be corporate, flat, and vectorial.

Imagem gerada utilizando Dall-E 3

Os novos modelos *o1* foram projetados para tarefas que exigem múltiplos passos complexos e demonstraram desempenho excepcional em benchmarks desafiadores, especialmente em áreas como programação avançada, matemática e ciências. O *o1-preview* se destacou em tarefas de seguimento de instruções precisas e fluência em espanhol, enquanto o *o1-mini* se mostrou mais eficiente em tarefas de codificação, sendo 80% mais barato que seu predecessor.


  1. *o1-preview* lidera em Precise Instruction Following com uma pontuação de 87.27.

  2. *o1-mini* ocupa o primeiro lugar no Coding Leaderboard com uma pontuação de 1271.

  3. *o1-preview* é o melhor em fluência em espanhol, com uma pontuação de 1119.


Entretanto, os modelos *o1* apresentam limitações em comparação ao *GPT-4o*, pois não suportam funcionalidades como navegação na web ou entrada de imagens. Além disso, a engenharia de prompts precisa ser adaptada, pois os novos modelos não respondem bem a instruções que solicitam raciocínio em cadeia, exigindo um novo conjunto de melhores práticas.


Apesar de suas limitações, os modelos *o1* representam um avanço significativo na capacidade de raciocínio, com resultados impressionantes em benchmarks como AIME e Codeforces, e são considerados ferramentas poderosas para resolver problemas complexos.


Os modelos *o1* da OpenAI marcam um progresso notável em capacidades de raciocínio, mas seu uso eficaz pode exigir mais experimentação do que os usuários estão acostumados. A validação de resultados por meio de avaliações independentes, como as do Scale’s SEAL Leaderboards, é crucial para que desenvolvedores escolham os melhores modelos para suas aplicações.


 
FONTES:
  1. Scale’s SEAL Leaderboards

  2. OpenAI technical blog

  3. OpenAI documentation

  4. Cognition Labs

REDATOR

Gino AI

1 de outubro de 2024 às 00:54:14

PUBLICAÇÕES RELACIONADAS

An image visualizing a politician echoing the policies of AI during the AI Action Summit in Paris, on February 11, 2025, emphasizing innovation and protection of American workers. The scene is set in a corporate, vector and flat style, with a 2D linear perspective, against a white, textureless backdrop. The politician is seen highlighting the importance of AI, with an attentive audience and surrounded by flags of numerous nations symbolizing international collaboration. Additional elements include a microphone that represents the speech platform, and an eager global audience showcasing their interest in the event.

Vice-presidente dos EUA destaca oportunidades da IA em discurso em Paris

Imagine a 2D, linear perspective image illustrating the futuristic Quantum Language Hybrid Model (QLLM) announced by an imaginary technology company, Secqai, on February 10, 2025. The company, known for its ultra-secure hardware and software, aims to integrate quantum computing into traditional language models, enhancing computational efficiency and problem-solving capabilities. The illustration's main focus is the new user interface for the QLLM model, accompanied by performance charts showcasing the model's efficiency. The quantum codes, representative of the quantum mechanics and AI integration, are also present. Aesthetically, the image adopts a corporate, flat vector style on a white, texture-free background with vibrant colors symbolizing innovation and technology.

Secqai Lança o Primeiro Modelo de Linguagem Quântico do Mundo

Imagine an image depicting February 10, 2025, symbolizing Google Cloud's Cross-Cloud Network solution improving Artificial Intelligence (AI) workload implementation. This image is in 2D, linear perspective. In this vector representation, set against a white, texture-less background, visualize a Google datacenter with servers symbolizing Google Cloud's infrastructure. These servers are connected in a network, demonstrating the Cross-Cloud Network. Elements representative of AI, such as data charts symbolize data analysis and processing, flow between clouds, which represent the cloud connectivity between different platforms. All this is done using a flat, corporate style.

Otimização de Redes para Workloads de IA no Google Cloud

Title: Homage to a Tech Icon. Here is an image representing the 70th anniversary of a tech entrepreneurial icon, co-founder of a leading tech company, an emblem of technological innovation whose legacy continues to shape the design and human interaction with technology even years after his passing in 2011. The image is a distinctive visual montage including iconic tech products such as a smartphone and a laptop, set against a background evoking minimalist designs characteristic with the corporation. The image has a vector style, is flat, and corporate in nature. The background of the image is white and textureless. The perspective is 2D and linear. Additional elements in the image include a smartphone which symbolize a revolution in mobile communication, a laptop that symbolizes accessibility and innovation in personal computing, minimalistic colors that reflect the design philosophy of the tech icon, and silhouettes of people using technology, emphasizing the human impact of these innovations.

Steve Jobs: Legado de Inovação e Design em Tecnologia

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page