TiaoYue发布|跳悦成功研发CPU实时互动数智人技术

数智人是可互动的仿真数字人。传统数智人产品需要云服务器推流或者运行在装配有GPU的电脑上运行,用户配置流程复杂,设备成本高。跳悦智能经过近半年的研发,成功实现了仅用普通CPU就能实时互动的数智人技术,极大降低了用户的使用门槛和成本,又一次实现了数智人领域的技术突破。

数智人广泛应用于电商直播、互动客服、线下互动屏等领域,这些应用要求数智人有快速实时的问答响应能力。当一个用户提出问题后,数智人产品需要进行问题识别、文字答案合成、语音合成、嘴型合成、肢体合成及动作外貌渲染等多个步骤的算法操作,这些算法操作不仅需要效果准确逼真,还需要在极短时间内全部完成,对数智人的整体系统实现有极高要求。市场上常见的普通数智人产品,很难有效解决这个快速算法处理的问题;一部分数智人产品通过牺牲合成效果质量,解决高算力要求问题,另一部分数智人产品要求用户配置高性能的电脑或云服务器资源,解决算法大数据处理的问题。但是,前者会出现数智人外貌声音失真,反应呆板的问题;后者需用户支付每月数千元的高昂费用。

跳悦智能研发的CPU实时互动数智人技术——仅用普通CPU电脑,即可实现高仿真度的智能交互,为市场首创。数智人实时互动的过程中每一个步骤,如问题识别、文字合成、语音合成、嘴型合成、肢体合成及动作外貌渲染,都要求极高的算力。将这些步骤都完成处理加速集成到一个产品中,有三大难点:难点之一是如何压缩AI模型结果,重新训练保持高仿真度的声音、嘴型、和肢体动作模型;难点之二是如何将业界常见的基于GPU的AI模型架构重构,改为利用现代CPU架构中底层加速模块;难点之三是如何将全新的核心算法植入产品,适配各种电脑型号,符合用户习惯。

跳悦智能从2021年首创高仿真数字人直播产品开始,收获了庞大的用户群体,通过和用户合作进行数据标注,跳悦智能积累了超过100Tb的高仿真人物姿态嘴型和声音数据,数据规模远超学术开源和同行友商。利用数据优势,跳悦团队经过数十次原创算法迭代,成功研发了具有超高推理速度的数智人合成模型,解决了上述难点。

跳悦智能是一个高技术团队占比,推崇技术驱动的创业团队。跳悦在2021年推出了高仿真数字人直播带货,改变了早期3D数字人为主的市场局面,提高了数字人的合成效果。在2022年3月,跳悦率先引入了大语言模型技术,极大提高了初始化数智人的效率,让数智人问答智能性有本质提升,改变了传统数字人配置复杂、只能口播不能问答的问题。

本次跳悦推出的CPU实时互动数智人技术,进一步解决了数字人使用成本问题,每年仅需数千元费用,您即可拥有美观、智能、可靠的数智人。

市场合作请联系bd@jumpy.ai

END

北京跳悦智能科技有限公司成立于2021年,专注真实和智能的拟人AI(数智人)技术研发,是数智人产品化的开拓者、AI数智化应用体系服务商。

数智人直播市场领先:跳悦智能在2021年开创了数智人直播市场,产品具有“个性化”“智能化”“平民化”的优势,在数智人直播开播数量上,稳居市场第一。

核心技术领先:跳悦智能技术部门是国内最早研发数智人技术的团队,通过5年的持续研发,积累了全AI人物创建、低成本AI推理、低延迟问答互动等独特的技术优势,截止目前已建立数智人AI化创建、数智人视频合成、数智人互动直播组成的完整产品线。尤其是跳悦智能的互动视频合成大模型技术,相较于传统的3D数字人和2D视频数字人技术具有更加千人千面和成本大幅降低的优势。这得益于遥遥领先与行业友商的数据积累:真实场景100Tb高质量视频数据;电商政务客服场景1000万句文本;1000+人物动作和服饰。基于大模型的第三代数智人核心算法基于 RLHF进行训练,通过专属数据训练LLM,更符合直播和短视频场景。跳悦领先的端到端视频合成模型可以对人物躯体和微表情控制。

算力资源领先:跳悦还具有成本优势明显的算力资源,包括自建GPU数据中心,自研高可靠大规模GPU集群推理软件架构技术,可以实现1000+GPU同时运行,服务全球多地区客户。

有疑问?想获取更多信息?

扫码添加「有AI小悦」

为您提供定制服务

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注