TiaoYue动态|投入数千万开发“能说会动的妙鸭相机”,跳悦智能已为数万个直播间提供数智人直播服务

不得不说,借助ChatGPT大模型的风口,人工智能热潮再度被掀起,AI赋能全行业成为了又一个增长引擎和财富密码。

AI数字人也成为了直播短视频行业的新宠,甚至都喊出了“不要工资、无需五险一金、永不离职,只要7999,数字人员工带回家”的口号。

在短视频和直播领域,AI数字人以其降本增效的优势和稳定输出的能力,正对传统直播模式进行重塑和改造。数字人直播,在直播间塑造了另一个增长范式,也正成为商家带货的必争之路。

艾媒咨询数据显示,中国直播行业总规模预计到2025年规模将达到21373亿元。《数字人产业发展趋势报告(2023)》显示,数字人将进入大规模应用期,转化现实生产力创造价值。到2026年中国AI数字人市场规模将达102.4亿元,数字人市场将呈现高速增长态势。其中,2022 年一年虚拟主播(数字人)企业注册增加数就高达 948 家,增速达 68 %。财经作家吴晓波在跨年演讲中更是直言:2023 年每家公司都可能需要一个数字人,可以用来做本地生活、直播、短视频等。

同时, AI 大模型爆发,对数字人在生成直播脚本、智能应答提问等方面有了更加迅猛的发展,让数字人有了更强大的发展基础。

在数字人赛道上,目前大厂、创业团队、AI公司和一些此前做智能客服营销的数字化服务商都在这一赛道频繁动作,腾讯、百度、阿里、京东、火山引擎等平台此前基于直播带货等多个场景,都推出过数字人产品平台或服务。同时一些科技公司也秀出了各自代表性产品,还吸引了谦寻控股这样的跨界玩家。此外,猎云网还关注到一些创业公司的数字人产品也取得了不错的市场效果。可以说,数字人市场正在逐步爆发。

但目前数字人直播行业,依然存在着制作成本高昂、带货质量堪忧、平台政策和监管政策不明朗、加盟商代理商割韭菜、缺乏情感价值、与真人差异较大等问题,也亟需行业的创业者破局。

成立于2021年的跳悦智能,专注真实和智能的拟人AI(数智人)技术研发,是数智人产品化较早实践者,在仿真数智人直播市场有不错积累;截止目前已建立数智人AI化创建、数智人视频合成、数智人互动直播组成的完整产品线,实现了市场技术双领先。

跳悦智能创始人兼CEO包英泽博士告诉猎云网,跳悦智能于2021年推出仿真数智人直播产品。在此之前,国内大部分AI直播都采用3D建模卡通人形式。跳悦智能开创了仿真数智人直播的产品形态,率先打开市场。跳悦智能技术部门是国内较早研发数智人技术的团队,通过5年的持续研发,积累了全AI人物创建、低成本AI推理、低延迟问答互动等独特的技术优势,在AI训练数据积累和人物AI模型推理效果方面领先同行。

目前,跳悦智能可以创作千人千面的数智人,而传统技术只能提供千篇一律的公版数字人形象。据包博士介绍,目前数字人市场上,对公版数字人的需求越来越少,大部分客户都需要根据自身场景打造的个性化数字人。跳悦智能依托大模型原理,实现了仅用一张照片就可以创建身体可以运动的数智人。

依托这样的技术,跳悦智能推出了跳悦AI直播、跳悦数智人视频合成平台、跳悦数智分身、跳悦直播API等多种AIGC产品可助力企业数智化升级。如跳悦AI直播是用AI算法合成的模拟真人形象的音视频流,可以应用在电商购物、团购券销售、留资获客、智能客服等领域实时与观众进行互动。其优势直播画面“所见即所得”,人物形象由用户录制和合成,AI主播可以手持商品进行展示,并且运用大模型理解和回答问题,更贴切准却,让AI主播的话术可以灵活演绎、千变万化。据悉,北京“滚爷吃面”餐厅运用跳悦AI直播产品不足一周即荣登带货日榜前10名、带货周榜长时间名列前排。

“可以理解我们的产品是能说会动的妙鸭相机”,包英泽这样告诉猎云网。

市面上较流行的3D数字人技术,从创意、建模、到应用要花费数十万元,这让很多中小型创业公司望而却步。相较于传统的3D数字人和2D视频数字人技术,跳悦智能的第三代数字人技术(跳悦数智人),具有更加千人千面和成本大幅降低的优势。

包英泽博士表示,将数智人技术平民化是跳悦创业的目标。跳悦通过深度自研嵌入式技术,在国内首先实现了可以运行在普通电脑的高仿真互动数字人产品。和传统依赖GPU推流的方法比,跳悦大大降低了产品售价。例如,在美团平台直播,跳悦的产品仅需699元每月,而其他竞品售价普遍在2000-3000元每月。

形象逼真、成本低廉、适应需求等条件对于数字人行业发展尤为重要,谁能够掌握核心技术和市场,就等于拿到了制胜法宝。AI的发展,也对数字人的算力资源提出了更高的要求,跳悦智能具备成本优势明显的算力资源,包括自建GPU数据中心,自研高可靠大规模GPU集群推理软件架构技术,可以实现1000+GPU同时运行。另外,得益于跳悦智能的海量数据积累:真实场景100Tb高质量视频数据;电商政务客服场景1000万句文本;1000+人物动作和服饰。基于大模型的第三代数智人核心算法基于 RLHF进行训练,通过专属数据训练LLM,更符合直播和短视频场景。

目前,跳悦智能已应用于直播电商、短视频创作、达人/主理人数智化、本地生活、智能客服、党建政务、银行保险、新能源汽车以及文商旅产运营等行业和领域,营收主要通过AI直播、数字分身等标准化产品和私有化部署付费,超过2万个直播间选择跳悦AI直播产品。

包英泽博士向猎云网透露,跳悦智能此前凭借过硬的技术实力,以及产品个性化、智能化和平民化的特点,在行业积累了不错的商业化效果。未来跳悦智能将上线更多AI数智化与AIGC产品,以AI赋能生活,帮助中小企业实现降本提效,线上线下无限融合,支持多种基础实用型应用场景量化输出。

融资方面,跳悦智能已获得来自真格基金、汉能创投的数千万元投资。汉能创投管理合伙人王威曾表示,看好跳悦智能团队在多模态智能领域的核心技术实力、快速迭代的产品开发潜力、多场景探索的商业化落地能力。

团队方面,CEO包英泽博士本科毕业于清华大学,博士毕业于密歇根大学和斯坦福大学。作为早期员工加入AR公司 Magic Leap,后在硅谷创立xPerception并被百度收购,再之后曾任VIPKID首席科学家,在AI领域具有十五年研发经验和百万级用户产品经验。跳悦核心团队由原百度和VIPKID技术骨干组成,兼具人工智能、互联网、电商等多行业经历。

北京跳悦智能科技有限公司成立于2021年,专注真实和智能的拟人AI(数智人)技术研发,是AI数智人产品化开拓者、数智人技术解决方案服务商;已获得真格基金和汉能资本的投资,以及HICOOL、中关村创业大赛、创客北京、itec创业大赛等多个奖项。

业务情况:

跳悦智能的市场定位是领先的AI数智人技术解决方案服务商,专注为政企客户提供AI数字人解决方案。例如:

  • 为某头部大模型公司提供数字人创建和视频合成产品,为其语言模型产品线增加可视化的互动能力。
  • 为某著名电视台提供数字主播创建产品,帮助降低主持人视频制作成本,提高视频产量。
  • 为某上市民营医院提供数字医生克隆产品,实现医疗科普视频的低成本制作,在APP中植入可互动的AI医生功能。
  • 为某殡葬行业上市公司提供数字人方案,打造集团的数字发言人,并为其客户提供逝者复刻服务。
  • 为某电商平台提供数字主播能力,帮助其商家低成本高质量的日不落直播。除此之外,在淘宝、美团、京东、唯品会等平台上,在AI主播每日互动直播数量上,跳悦智能稳居市场前列。

三大产品优势:

个性化:使用跳悦智能的产品线,客户可以快速容易的创建自己的数字人,包括逼真的形象和声音复刻,以及准确的音画同步效果。而市场上大部分数字人竞品,都需要较长的制作周期,才能创作效果较好的数字人模型。

智能化:跳悦数字人不仅外貌逼真,还可以实现音视频互动。而市场上大部分数字人竞品,都只有视频能力,缺少互动。

平民化:基于跳悦自研的AI推理框架,跳悦智能数字人可以在普通PC主机上独立运行,企业部署难度小,让数字人走进每个人的电脑。而市场上大部分数字人竞品,都是基于GPU云服务器推流实现,使用成本高,部署难度大。

技术优势:

跳悦智能核心算法已有6年的积累,是国内积累时间最久最成熟的数字人技术服务上。除了核心算法,跳悦智能遵循数据飞轮原则,不断巩固数据壁垒。

数据积累优势:目前已真实场景100Tb高质量视频数据;电商政务客服场景1000万句文本;1000+人物动作和服饰

模型算法优势:基于大模型的第三代数智人核心算法;源自核心团队6年技术积累;基于 RLHF原理在使用中提升效果;端到端自研模型,可实现人物躯体和微表情控制

算力规模成本优势:自建GPU数据中心控制成本;自研高可靠大规模推理软件架构;峰值支持1000块GPU同时在线

顶尖技术团队:创始人包英泽博士,清华电子工程本科,密西根/斯坦福计算机博士;成功创业者+AI创业项目百度收购;国际AI期刊审稿人,论文引用次数1000+;河北省省级技术领军人才;前VIPKID首席科学家(VP级)、百度主任架构师(T9)

顶级AI团队:达摩院、滴滴研究院算法负责人;中国移动研究院语音算法专家;VIPKid数字人算法高级工程师。 

想获取更多信息?

扫码添加「有AI小悦」

为您提供定制服务

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注