TiaoYue发布|跳悦成功研发CPU实时互动数智人技术

数智人是可互动的仿真数字人。传统数智人产品需要云服务器推流或者运行在装配有GPU的电脑上运行,用户配置流程复杂,设备成本高。跳悦智能经过近半年的研发,成功实现了仅用普通CPU就能实时互动的数智人技术,极大降低了用户的使用门槛和成本,又一次实现了数智人领域的技术突破。

数智人广泛应用于电商直播、互动客服、线下互动屏等领域,这些应用要求数智人有快速实时的问答响应能力。当一个用户提出问题后,数智人产品需要进行问题识别、文字答案合成、语音合成、嘴型合成、肢体合成及动作外貌渲染等多个步骤的算法操作,这些算法操作不仅需要效果准确逼真,还需要在极短时间内全部完成,对数智人的整体系统实现有极高要求。市场上常见的普通数智人产品,很难有效解决这个快速算法处理的问题;一部分数智人产品通过牺牲合成效果质量,解决高算力要求问题,另一部分数智人产品要求用户配置高性能的电脑或云服务器资源,解决算法大数据处理的问题。但是,前者会出现数智人外貌声音失真,反应呆板的问题;后者需用户支付每月数千元的高昂费用。

跳悦智能研发的CPU实时互动数智人技术——仅用普通CPU电脑,即可实现高仿真度的智能交互,为市场首创。数智人实时互动的过程中每一个步骤,如问题识别、文字合成、语音合成、嘴型合成、肢体合成及动作外貌渲染,都要求极高的算力。将这些步骤都完成处理加速集成到一个产品中,有三大难点:难点之一是如何压缩AI模型结果,重新训练保持高仿真度的声音、嘴型、和肢体动作模型;难点之二是如何将业界常见的基于GPU的AI模型架构重构,改为利用现代CPU架构中底层加速模块;难点之三是如何将全新的核心算法植入产品,适配各种电脑型号,符合用户习惯。

跳悦智能从2021年首创高仿真数字人直播产品开始,收获了庞大的用户群体,通过和用户合作进行数据标注,跳悦智能积累了超过100Tb的高仿真人物姿态嘴型和声音数据,数据规模远超学术开源和同行友商。利用数据优势,跳悦团队经过数十次原创算法迭代,成功研发了具有超高推理速度的数智人合成模型,解决了上述难点。

跳悦智能是一个高技术团队占比,推崇技术驱动的创业团队。跳悦在2021年推出了高仿真数字人直播带货,改变了早期3D数字人为主的市场局面,提高了数字人的合成效果。在2022年3月,跳悦率先引入了大语言模型技术,极大提高了初始化数智人的效率,让数智人问答智能性有本质提升,改变了传统数字人配置复杂、只能口播不能问答的问题。

本次跳悦推出的CPU实时互动数智人技术,进一步解决了数字人使用成本问题,每年仅需数千元费用,您即可拥有美观、智能、可靠的数智人。

市场合作请联系bd@jumpy.ai

北京跳悦智能科技有限公司成立于2021年,专注真实和智能的拟人AI(数智人)技术研发,是AI数智人产品化开拓者、数智人技术解决方案服务商;已获得真格基金和汉能资本的投资,以及HICOOL、中关村创业大赛、创客北京、itec创业大赛等多个奖项。

业务情况:

跳悦智能的市场定位是领先的AI数智人技术解决方案服务商,专注为政企客户提供AI数字人解决方案。例如:

  • 为某头部大模型公司提供数字人创建和视频合成产品,为其语言模型产品线增加可视化的互动能力。
  • 为某著名电视台提供数字主播创建产品,帮助降低主持人视频制作成本,提高视频产量。
  • 为某上市民营医院提供数字医生克隆产品,实现医疗科普视频的低成本制作,在APP中植入可互动的AI医生功能。
  • 为某殡葬行业上市公司提供数字人方案,打造集团的数字发言人,并为其客户提供逝者复刻服务。
  • 为某电商平台提供数字主播能力,帮助其商家低成本高质量的日不落直播。除此之外,在淘宝、美团、京东、唯品会等平台上,在AI主播每日互动直播数量上,跳悦智能稳居市场前列。

三大产品优势:

个性化:使用跳悦智能的产品线,客户可以快速容易的创建自己的数字人,包括逼真的形象和声音复刻,以及准确的音画同步效果。而市场上大部分数字人竞品,都需要较长的制作周期,才能创作效果较好的数字人模型。

智能化:跳悦数字人不仅外貌逼真,还可以实现音视频互动。而市场上大部分数字人竞品,都只有视频能力,缺少互动。

平民化:基于跳悦自研的AI推理框架,跳悦智能数字人可以在普通PC主机上独立运行,企业部署难度小,让数字人走进每个人的电脑。而市场上大部分数字人竞品,都是基于GPU云服务器推流实现,使用成本高,部署难度大。

技术优势:

跳悦智能核心算法已有6年的积累,是国内积累时间最久最成熟的数字人技术服务上。除了核心算法,跳悦智能遵循数据飞轮原则,不断巩固数据壁垒。

数据积累优势:目前已真实场景100Tb高质量视频数据;电商政务客服场景1000万句文本;1000+人物动作和服饰

模型算法优势:基于大模型的第三代数智人核心算法;源自核心团队6年技术积累;基于 RLHF原理在使用中提升效果;端到端自研模型,可实现人物躯体和微表情控制

算力规模成本优势:自建GPU数据中心控制成本;自研高可靠大规模推理软件架构;峰值支持1000块GPU同时在线

顶尖技术团队:创始人包英泽博士,清华电子工程本科,密西根/斯坦福计算机博士;成功创业者+AI创业项目百度收购;国际AI期刊审稿人,论文引用次数1000+;河北省省级技术领军人才;前VIPKID首席科学家(VP级)、百度主任架构师(T9)

顶级AI团队:达摩院、滴滴研究院算法负责人;中国移动研究院语音算法专家;VIPKid数字人算法高级工程师。 

想获取更多信息?

扫码添加「有AI小悦」

为您提供定制服务

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注