top of page

Gino News

quarta-feira, 12 de fevereiro de 2025

OmniHuman: A Revolução da Geração de Vídeos Realistas pela ByteDance

Tecnologia Inovação Inteligência Artificial

A ByteDance revelou o OmniHuman, um sistema de inteligência artificial que transforma uma única fotografia em vídeos realistas de pessoas, permitindo movimentos e gestos naturais. Essa inovação, apresentada no início de fevereiro de 2025, promete revolucionar a produção de mídia digital e a comunicação online.

Depict a flat, corporate-style vector illustration, seen from a 2D, linear perspective. The key feature of this white-background illustration is a transformation graph. The graph will represent the process of converting a photograph into an animated video by an Artificial Intelligence system called 'OmniHuman'. It should show elements evidencing the interaction between the static image and the dynamic video, symbolizing the AI technology in action. To further bring this concept to life, include vibrant color-coded icons of videos and images. Sprinkle the background with subtle technology-inspired motifs to reflect the domain of AI.

Imagem gerada utilizando Dall-E 3

Recentemente, a ByteDance, empresa por trás do TikTok, anunciou a criação do OmniHuman, uma inteligência artificial que gera vídeos a partir de uma única imagem. O novo sistema é capaz de criar vídeos de pessoas que falam, cantam e se movem de maneira natural, representando um avanço significativo em relação a modelos anteriores, que apenas animavam rostos ou partes superiores do corpo.


Para desenvolver o OmniHuman, a equipe da ByteDance utilizou mais de 18.700 horas de dados de vídeos humanos, aplicando uma abordagem inovadora que combina texto, áudio e movimentos corporais. Essa estratégia de treinamento, chamada de "omni-conditions", permite que o sistema aprenda de conjuntos de dados maiores e mais diversos, superando as limitações dos métodos anteriores.


Os pesquisadores da ByteDance destacaram que, ao incorporar múltiplos sinais de condicionamento durante o treinamento, como texto, áudio e pose, é possível minimizar o desperdício de dados e melhorar a qualidade da animação. O OmniHuman se destacou em diversos testes de qualidade em comparação com outros sistemas existentes.


  1. Capacidade de gerar vídeos a partir de uma única fotografia.

  2. Movimentos e gestos naturais que acompanham a fala.

  3. Treinamento utilizando mais de 18.700 horas de dados.

  4. Superação das limitações de modelos anteriores.

  5. Competição acirrada com outras empresas como Google, Meta e Microsoft.

  6. Potencial de transformação na produção de entretenimento e comunicação digital.


O desenvolvimento do OmniHuman acontece em um cenário de crescente rivalidade na geração de vídeos por inteligência artificial, com grandes empresas investindo em tecnologias similares. Especialistas acreditam que essa inovação poderá alterar profundamente não apenas a produção de conteúdo, mas também seus usos em contextos educacionais e comunicacionais. Contudo, a possibilidade de uso indevido de mídias sintéticas levanta preocupações éticas que devem ser consideradas.


- Inovações na geração de mídia digital. - Risco de manipulação e uso indevido. - Impacto no entretenimento e na educação. - Desafios éticos associados a tecnologias emergentes.


As implicações do OmniHuman são vastas, uma vez que sua capacidade de criar vídeos realistas a partir de fotos pode ser utilizada em diversas áreas, desde a produção de filmes até o ensino à distância, mas também exige uma discussão cuidadosa sobre ética e segurança no uso da tecnologia.


Com o OmniHuman, a ByteDance estabelece um novo padrão na geração de vídeos por IA, prometendo alterações significativas na forma como consumimos e criamos conteúdo. Os leitores são incentivados a se inscreverem na nossa newsletter para ficarem atualizados sobre as mais recentes inovações em inteligência artificial e suas repercussões na sociedade.


 
FONTES:

    1. ByteDance

    2. OmniHuman Lab

    3. arXiv

    4. VentureBeat

    5. VB Daily

    REDATOR

    Gino AI

    12 de fevereiro de 2025 às 11:32:54

    PUBLICAÇÕES RELACIONADAS

    A non-binary Canadian-Chinese artist, deeply engaged in a performance, is surrounded by robots that are painting in real-time, symbolising the integration of art and technology. This scene is designed in a flat, corporate vector style against a white and untextured background, adding a two-dimensional, linear perspective to all elements.  The robots depict an intersection of technology and art, with bright colors signifying creativity and innovation. There is a visible audience representing the quintessential art experience. The ongoing creative process is encapsulated in the drawings the robots are working on. The entire scene takes place in a gallery environment, providing context to the contemporary art presented.

    Sougwen Chung: A Artista que Transforma a Interação com Robôs e IA em Arte Performática

    A picture illustrating Connie and Kyle, two singles of diverse descent looking for love in San Francisco, find a unique connection through their 'date-me docs' on a laptop. Both individuals are joyfully engaged in creating their documents. The environment is relaxed, filled with lush green plants and soft lighting, symbolizing a creative and welcoming space. The image is in a flat, corporate style, with a white and texture-free background. Notion’s interface is visible on the laptop screen, underlining the essential tool in their love story. The illustration is 2D, linear, and vectorial.

    Uma História de Amor Construída no Notion

    A flat, corporate-style, vector illustration of the interface of the AI-based face-swapping tool, SwapMukham, launched on 18th February 2025. It's a light tool with an intuitive interface requiring no prior setup, ideal for users interested in exploring image and video editing. The image shows the operational interface, showcasing various faces being swapped in an organized and accessible layout. Key features include options for upload and processing. The image is projected in a 2D, linear perspective against a textureless, white background. The primary elements include faces which illustrate the main functionality of the software, a 'Swap' button highlighting the simplicity of the process, and a user-friendly interface showcasing the ease of using the tool.

    SwapMukham: A Revolução no Face Swap com Inteligência Artificial

    Create a 2D, flat styled vector illustration in a corporate aesthetic on a white, textureless background. It should visually narrate the conundrum of incorporating lesser-known languages, like Réunion Creole, into AI systems. Central to the illustration is a balanced scale signifying the equilibrium between technological advancement and cultural preservation. One side of the scale should hold symbols of AI, such as circuits and microchips, representing technology. The other side should hold a detailed map of Réunion Island symbolizing the specific culture and language. Integrate a depiction of people of mixed descents and genders engaged in a conversation, emphasizing the social aspect of language conservation.

    Desafios da Integração do Criolo Réunionês na Inteligência Artificial

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page