真情服务  厚德载物
联系我们

市场部:0564-3227239
技术部:0564-3227237
财务部: 0564-3227034
公司邮箱:lachs@126.com
技术邮箱:cc1982@163.com
地址:六安市淠望路103号

当前位置:首 页 > 新闻中心 > 业界动态 > 查看新闻
字节跳动展示 OmniHuman 多模态框架:图片 + 音频 = 逼真动画,半身全身均可生成
作者:永辰科技  来源:IT之家  发表时间:2025-2-7 8:07:42  点击:161

字节跳动的研究人员近日展示了一款 AI 模型,可以通过一张图片和一段音频生成半身、全身视频。

字节跳动表示,和一些只能生成面部或上半身动画的深度伪造技术不同,OmniHuman-1 能够生成逼真的全身动画,且能将手势和面部表情与语音或音乐精准同步

字节跳动在其 OmniHuman-lab 项目页面发布了多个测试视频,包括 AI 生成的 TED 演讲和一个会说话的阿尔伯特 爱因斯坦。

在周一发布的一篇论文中,字节跳动指出,OmniHuman-1 模型支持不同的体型和画面比例,从而使视频效果更自然。

据了解,字节跳动表示,OmniHuman-1 模型基于约 19000 小时的人类运动数据训练而成,能够在内存限制内生成任意长度的视频,并适应不同的输入信号。

研究人员还表示,OmniHuman-1 在真实性和准确性方面,超越了其他同类动画工具。目前,该工具暂不提供下载或有关服务。

 
 
 
合作伙伴
华为 | 微软中国 | 联想集团 | IBM | 苹果电脑 | 浪潮集团 | 惠普中国 | 深信服 | 爱数软件
六安市永辰科技有限公司 版权所有 © Copyright 2010-2021 All Rights 六安市淠望路103号 最佳浏览效果 IE8或以上浏览器
皖公网安备34150102000370号

访问量:3196382    皖ICP备11014188号-1