TiaoYue发布|嘴型合成模型全面升级,秒杀国内外数字人竞品

在数字人领域中,嘴型合成(Lip Sync)是非常核心的技术环节,直接影响数字人的逼真程度。贴合声音的嘴唇运动和唇型清晰度,是数字人与观众进行情感互动和建立信任的关键。嘴型合成的效果可以提高用户对内容的理解度,提供更加真实的交互体验感,应用视频数字人中嘴型好坏的包括牙齿清晰度、嘴型合理性、以及张闭及时性。

跳悦智能原创的全新AI模型结构,在独家积累的100T真实数据上多次训练,消耗了数千个GPU小时后,正式发布全新V3嘴型合成模型。新的嘴型模型使数字人具有更加自然逼真、“真情实感”的外貌效果。让您的视频内容更容易深入人心,创造出更大的价值与可能。

下面,让我们看看跳悦数字人嘴型和各家竞品的对比。

在这三段与国内外数字人公司对比视频中可以看到,效果差的数字人普遍具有嘴型大小不准确;牙齿不清楚;嘴巴的张闭不能跟随语音的问题。跳悦数字人的嘴形大小合理,张闭自然,牙齿清晰。无论是头部晃动的自然感、嘴巴的张闭节奏、唇型准确度、还是牙齿清晰度,跳悦的数字人逼真度都更胜一筹。

数字人作为数字化的重要组成部分, 对于个体、企业和社会的发展是一种机遇,也具有重要意义。数字化的时代给予了用户更多的选择、可能和机会。

未来跳悦智能将继续引领技术创新,持续提供领先的 “个性化、智能化、平民化” 数智人解决方案,上线更多AI数智化与AIGC产品,帮助企业实现降本提效,助力线上线下融合,以AI赋能人类生活的每一个角落。更多新鲜事物和前沿科技,突破想象的数智人创意玩法和新奇体验,由Spring.Ai持续为您推送,敬请期待!

END

北京跳悦智能科技有限公司成立于2021年,专注真实和智能的拟人AI(数智人)技术研发,是数智人产品化的开拓者、AI数智化应用体系服务商。

数智人直播市场领先:跳悦智能在2021年开创了数智人直播市场,产品具有“个性化”“智能化”“平民化”的优势,在数智人直播开播数量上,稳居市场第一。

核心技术领先:跳悦智能技术部门是国内最早研发数智人技术的团队,通过5年的持续研发,积累了全AI人物创建、低成本AI推理、低延迟问答互动等独特的技术优势,截止目前已建立数智人AI化创建、数智人视频合成、数智人互动直播组成的完整产品线。尤其是跳悦智能的互动视频合成大模型技术,相较于传统的3D数字人和2D视频数字人技术具有更加千人千面和成本大幅降低的优势。这得益于遥遥领先与行业友商的数据积累:真实场景100Tb高质量视频数据;电商政务客服场景1000万句文本;1000+人物动作和服饰。基于大模型的第三代数智人核心算法基于 RLHF进行训练,通过专属数据训练LLM,更符合直播和短视频场景。跳悦领先的端到端视频合成模型可以对人物躯体和微表情控制。

算力资源领先:跳悦还具有成本优势明显的算力资源,包括自建GPU数据中心,自研高可靠大规模GPU集群推理软件架构技术,可以实现1000+GPU同时运行,服务全球多地区客户。

有疑问?想获取更多信息?

扫码添加「有AI小悦」

为您提供定制服务

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注