top of page

Gino News

terça-feira, 7 de janeiro de 2025

NVIDIA Lança Cosmos World Foundation Models para Avanço da IA Física

Tecnologia Inteligência Artificial Inovação

A NVIDIA anunciou o lançamento dos Cosmos World Foundation Models (WFMs), uma inovadora família de modelos pré-treinados destinados à geração de vídeos e estados de mundos conscientes da física, com o intuito de impulsionar o desenvolvimento da inteligência artificial física. A iniciativa foi divulgada em 7 de janeiro de 2025, no site oficial da NVIDIA.

A visualization in the style of a flat, corporate vector illustration set in a 2D perspective. The primary scene consists of a robot interacting in a virtual environment, embodying the practical applications of AI models in real-world scenarios. Snapshots of digital circuits, with futuristic blue, green, and silvery colors, emphasize the high-tech nature of the content and pervade the background. The ambiance appears promising and driven by innovation, represented by the simulated realities and the technology elements. The background should be white and devoid of any textures, putting the focus squarely on the action in the foreground.

Imagem gerada utilizando Dall-E 3

Os Cosmos WFMs incluem modelos autoregressivos e de difusão, otimizados para gerações Text-to-World e Video-to-World. Esses modelos têm aplicações significativas em áreas como o desenvolvimento de modelos de políticas para robótica, veículos autônomos e sistemas de IA física.


Um dos aspectos centrais dos Cosmos é o sistema de segurança conhecido como Cosmos guardrails, que implementa medidas preventivas e de avaliação para garantir a integridade dos prompts e a consistência dos resultados gerados. Os modelos Cosmos se destacaram em benchmarks de consistência 3D e alinhamento físico, superando os modelos de síntese de vídeo existentes.


A formação dos Cosmos WFMs envolveu o treinamento em 20 milhões de horas de dados de vídeo, utilizando 10.000 GPUs NVIDIA H100, abordando ações como manipulação de objetos e movimento de câmera. Os modelos estão disponíveis para desenvolvedores, permitindo integração com a plataforma NVIDIA Omniverse, especialmente em cenários multiverso.


  1. Desenvolvimento e avaliação de modelos de políticas.

  2. Modelagem preditiva de foresight.

  3. Integração com a plataforma NVIDIA Omniverse.

  4. Processamento de dados em alta velocidade com o NVIDIA NeMo Curator.

  5. Geração de vídeos conscientes da física a partir de entradas textuais ou visuais.


Com a contínua evolução dos Cosmos, a NVIDIA busca integrar esses modelos a plataformas de IA física mais amplas, abordando desafios do mundo real em robótica e veículos autônomos. O futuro parece promissor, com a expansão das capacidades dos modelos e a melhoria contínua da curadoria de dados.


A NVIDIA posiciona os Cosmos WFMs como um marco no avanço da IA física, oferecendo ferramentas poderosas para desenvolvedores. Para se aprofundar neste tema e acompanhar as evoluções na área, recomenda-se que os leitores assinem nossa newsletter e fiquem atentos a conteúdos atualizados diariamente.


 
FONTES:

    1. NVIDIA Cosmos Official Page

    2. Hugging Face - Cosmos World Foundation Models

    3. NVIDIA Omniverse

    4. GitHub - NeMo Framework

    5. Aegis AI Content Safety

    REDATOR

    Gino AI

    7 de janeiro de 2025 às 11:40:28

    PUBLICAÇÕES RELACIONADAS

    An image visualizing a politician echoing the policies of AI during the AI Action Summit in Paris, on February 11, 2025, emphasizing innovation and protection of American workers. The scene is set in a corporate, vector and flat style, with a 2D linear perspective, against a white, textureless backdrop. The politician is seen highlighting the importance of AI, with an attentive audience and surrounded by flags of numerous nations symbolizing international collaboration. Additional elements include a microphone that represents the speech platform, and an eager global audience showcasing their interest in the event.

    Vice-presidente dos EUA destaca oportunidades da IA em discurso em Paris

    Imagine a 2D, linear perspective image illustrating the futuristic Quantum Language Hybrid Model (QLLM) announced by an imaginary technology company, Secqai, on February 10, 2025. The company, known for its ultra-secure hardware and software, aims to integrate quantum computing into traditional language models, enhancing computational efficiency and problem-solving capabilities. The illustration's main focus is the new user interface for the QLLM model, accompanied by performance charts showcasing the model's efficiency. The quantum codes, representative of the quantum mechanics and AI integration, are also present. Aesthetically, the image adopts a corporate, flat vector style on a white, texture-free background with vibrant colors symbolizing innovation and technology.

    Secqai Lança o Primeiro Modelo de Linguagem Quântico do Mundo

    Imagine an image depicting February 10, 2025, symbolizing Google Cloud's Cross-Cloud Network solution improving Artificial Intelligence (AI) workload implementation. This image is in 2D, linear perspective. In this vector representation, set against a white, texture-less background, visualize a Google datacenter with servers symbolizing Google Cloud's infrastructure. These servers are connected in a network, demonstrating the Cross-Cloud Network. Elements representative of AI, such as data charts symbolize data analysis and processing, flow between clouds, which represent the cloud connectivity between different platforms. All this is done using a flat, corporate style.

    Otimização de Redes para Workloads de IA no Google Cloud

    Title: Homage to a Tech Icon. Here is an image representing the 70th anniversary of a tech entrepreneurial icon, co-founder of a leading tech company, an emblem of technological innovation whose legacy continues to shape the design and human interaction with technology even years after his passing in 2011. The image is a distinctive visual montage including iconic tech products such as a smartphone and a laptop, set against a background evoking minimalist designs characteristic with the corporation. The image has a vector style, is flat, and corporate in nature. The background of the image is white and textureless. The perspective is 2D and linear. Additional elements in the image include a smartphone which symbolize a revolution in mobile communication, a laptop that symbolizes accessibility and innovation in personal computing, minimalistic colors that reflect the design philosophy of the tech icon, and silhouettes of people using technology, emphasizing the human impact of these innovations.

    Steve Jobs: Legado de Inovação e Design em Tecnologia

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page