TiaoYue发布|嘴型合成模型全面升级,秒杀国内外数字人竞品

在数字人领域中,嘴型合成(Lip Sync)是非常核心的技术环节,直接影响数字人的逼真程度。贴合声音的嘴唇运动和唇型清晰度,是数字人与观众进行情感互动和建立信任的关键。嘴型合成的效果可以提高用户对内容的理解度,提供更加真实的交互体验感,应用视频数字人中嘴型好坏的包括牙齿清晰度、嘴型合理性、以及张闭及时性。

跳悦智能原创的全新AI模型结构,在独家积累的100T真实数据上多次训练,消耗了数千个GPU小时后,正式发布全新V3嘴型合成模型。新的嘴型模型使数字人具有更加自然逼真、“真情实感”的外貌效果。让您的视频内容更容易深入人心,创造出更大的价值与可能。

下面,让我们看看跳悦数字人嘴型和各家竞品的对比。

在这三段与国内外数字人公司对比视频中可以看到,效果差的数字人普遍具有嘴型大小不准确;牙齿不清楚;嘴巴的张闭不能跟随语音的问题。跳悦数字人的嘴形大小合理,张闭自然,牙齿清晰。无论是头部晃动的自然感、嘴巴的张闭节奏、唇型准确度、还是牙齿清晰度,跳悦的数字人逼真度都更胜一筹。

数字人作为数字化的重要组成部分, 对于个体、企业和社会的发展是一种机遇,也具有重要意义。数字化的时代给予了用户更多的选择、可能和机会。

未来跳悦智能将继续引领技术创新,持续提供领先的 “个性化、智能化、平民化” 数智人解决方案,上线更多AI数智化与AIGC产品,帮助企业实现降本提效,助力线上线下融合,以AI赋能人类生活的每一个角落。更多新鲜事物和前沿科技,突破想象的数智人创意玩法和新奇体验,由Spring.Ai持续为您推送,敬请期待!

北京跳悦智能科技有限公司成立于2021年,专注真实和智能的拟人AI(数智人)技术研发,是AI数智人产品化开拓者、数智人技术解决方案服务商;已获得真格基金和汉能资本的投资,以及HICOOL、中关村创业大赛、创客北京、itec创业大赛等多个奖项。

业务情况:

跳悦智能的市场定位是领先的AI数智人技术解决方案服务商,专注为政企客户提供AI数字人解决方案。例如:

  • 为某头部大模型公司提供数字人创建和视频合成产品,为其语言模型产品线增加可视化的互动能力。
  • 为某著名电视台提供数字主播创建产品,帮助降低主持人视频制作成本,提高视频产量。
  • 为某上市民营医院提供数字医生克隆产品,实现医疗科普视频的低成本制作,在APP中植入可互动的AI医生功能。
  • 为某殡葬行业上市公司提供数字人方案,打造集团的数字发言人,并为其客户提供逝者复刻服务。
  • 为某电商平台提供数字主播能力,帮助其商家低成本高质量的日不落直播。除此之外,在淘宝、美团、京东、唯品会等平台上,在AI主播每日互动直播数量上,跳悦智能稳居市场前列。

三大产品优势:

个性化:使用跳悦智能的产品线,客户可以快速容易的创建自己的数字人,包括逼真的形象和声音复刻,以及准确的音画同步效果。而市场上大部分数字人竞品,都需要较长的制作周期,才能创作效果较好的数字人模型。

智能化:跳悦数字人不仅外貌逼真,还可以实现音视频互动。而市场上大部分数字人竞品,都只有视频能力,缺少互动。

平民化:基于跳悦自研的AI推理框架,跳悦智能数字人可以在普通PC主机上独立运行,企业部署难度小,让数字人走进每个人的电脑。而市场上大部分数字人竞品,都是基于GPU云服务器推流实现,使用成本高,部署难度大。

技术优势:

跳悦智能核心算法已有6年的积累,是国内积累时间最久最成熟的数字人技术服务上。除了核心算法,跳悦智能遵循数据飞轮原则,不断巩固数据壁垒。

数据积累优势:目前已真实场景100Tb高质量视频数据;电商政务客服场景1000万句文本;1000+人物动作和服饰

模型算法优势:基于大模型的第三代数智人核心算法;源自核心团队6年技术积累;基于 RLHF原理在使用中提升效果;端到端自研模型,可实现人物躯体和微表情控制

算力规模成本优势:自建GPU数据中心控制成本;自研高可靠大规模推理软件架构;峰值支持1000块GPU同时在线

顶尖技术团队:创始人包英泽博士,清华电子工程本科,密西根/斯坦福计算机博士;成功创业者+AI创业项目百度收购;国际AI期刊审稿人,论文引用次数1000+;河北省省级技术领军人才;前VIPKID首席科学家(VP级)、百度主任架构师(T9)

顶级AI团队:达摩院、滴滴研究院算法负责人;中国移动研究院语音算法专家;VIPKid数字人算法高级工程师。 

想获取更多信息?

扫码添加「有AI小悦」

为您提供定制服务

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注