字节跳动展示 OmniHuman 多模态框架：图片 + 音频 = 逼真动画，半身全身均可生成_六安市永辰科技有限公司

真情服务厚德载物

联系我们

市场部：0564-3227239
技术部：0564-3227237
财务部: 0564-3227034
公司邮箱：lachs@126.com
技术邮箱：cc1982@163.com
地址：六安市淠望路103号

新闻分类

业界动态

行业资讯

推荐新闻

突发！存储巨头宣布停产

“十五五”规划纲要，全文发布：

央采批量台式机3&4月中标公告：华

铸基之路：中国信创产业能力引力

中国操作系统银河麒麟V11正式发布

龙芯新品发布会官宣！64核心128线

华为携手产业达成移动AI基础网共

互联网账号“一键解绑”让“二次

USB 接口插座国家标准 11 月起实

Lonestar 和 Phison 的数据中心基

国家公共数据资源登记平台已开发

华为万兆智能OLT OptiXaccess MA

湘钢联合华为云Stack全球首个钢铁

浪潮云率先发布671B DeepSeek大模

华为官宣！这一重要平台，全面支

当前位置：首页 > 新闻中心 > 业界动态 > 查看新闻

字节跳动展示 OmniHuman 多模态框架：图片 + 音频 = 逼真动画，半身全身均可生成

作者：永辰科技来源：IT之家发表时间：2025-2-7 8:07:42 点击：1771

字节跳动的研究人员近日展示了一款 AI 模型，可以通过一张图片和一段音频生成半身、全身视频。

字节跳动表示，和一些只能生成面部或上半身动画的深度伪造技术不同，OmniHuman-1 能够生成逼真的全身动画，且能将手势和面部表情与语音或音乐精准同步。

字节跳动在其 OmniHuman-lab 项目页面发布了多个测试视频，包括 AI 生成的 TED 演讲和一个会说话的阿尔伯特爱因斯坦。

在周一发布的一篇论文中，字节跳动指出，OmniHuman-1 模型支持不同的体型和画面比例，从而使视频效果更自然。

据了解，字节跳动表示，OmniHuman-1 模型基于约 19000 小时的人类运动数据训练而成，能够在内存限制内生成任意长度的视频，并适应不同的输入信号。

研究人员还表示，OmniHuman-1 在真实性和准确性方面，超越了其他同类动画工具。目前，该工具暂不提供下载或有关服务。

上条新闻：华为又一个五星排名第1！Mate 70 Pro+的通信新技术

下条新闻：Gartner：使用国产基础设施软件，避免业务中断风险

合作伙伴	华为 \| 微软中国 \| 联想集团 \| IBM \| 苹果电脑 \| 浪潮集团 \| 惠普中国 \| 深信服 \| 爱数软件

六安市永辰科技有限公司版权所有 © Copyright 2010-2021 All Rights 六安市淠望路103号最佳浏览效果 IE8或以上浏览器

皖公网安备34150102000370号

访问量：4060136 皖ICP备11014188号-1