2023年虚拟人产业活动回顾 | 京东李光骏:虚拟主播赋能直播零售实现新增长

艾媒咨询|2023年中国虚拟人产业发展与商业趋势研究报告

iiMedia Research(艾媒咨询)数据显示,2022年中国虚拟人核心市场规模为120.8亿元,预计2025年将达到480.6亿元;2022年虚拟人带动周边市场规模为1866.1亿元,预计2025年为6402.7亿元。艾媒咨询分析师认为,虚拟人在内容和周边产品产出方面有着较强的可塑性,能根据

艾媒咨询|2023年中国虚拟人产业发展与商业趋势研究报告 精品决策

  3月31日,由全球新经济产业第三方数据挖掘和分析机构iiMedia Research(艾媒咨询)主办的2023年(第二届)中国虚拟人产业大会暨AIGC创新发展论坛上,京东科技智能服务与产品部-AI产品运营总监李光骏受邀出席大会,发表《AI虚拟主播打造零售品牌增长新动力》主题演讲。围绕中国新技术产业发展背景、技术新场景新模式,并结合虚拟主播发展现状及市场调研等方面进行分享,为品牌发展带来新观点、新视角和新机遇。

  本文为京东科技智能服务与产品部-AI产品运营总监李光骏在“2023年(第二届)中国虚拟人产业大会暨AIGC创新发展论坛”上的演讲实录,艾媒网整编发布。

  很荣幸今天有机会跟各位交流一下,京东这样一个老牌电商,如何借助AI技术,特别是去年最火的AIGC,我们在电商领域做了哪些事情。

  前面几位嘉宾分享很好,我接下来分享我们作为京东AI或者说京东的科技团队。在应用层面和原理实现上的一些见解、组合和实现机制。

  大家都知道京东,但是更多是了解京东的零售、物流。实际上京东科技也承担对外做技术上的输出。我们出来交流的机会不是很多,所以大家对京东科技实力没有那么了解,事实上京东科技是有很强技术研发实力的公司,自2017年以来累积投入900亿,申请专利4600多个。

  在一系列的顶会上,我们发了500多篇论文。在国际性AI人工智能大赛上,我们团队拿下15项世界冠军。最新一项荣誉,也是人工智能的文俊奖,我们团队无论是从个人也好,还是从产品角度来讲,都获得了很高的认可。

  京东科技团队在NLP和AIGC领域有着超过10年的经验,这些领域中存在许多技术难题。例如,我们开发了一种多轮对话与决策技术,使机器能够在复杂的场景下进行有效的对话和决策。这项技术能够让机器生成更贴近人类表达的语言,而不是让人向机器的语言接近。

  内容的生成有非常多的技术挑战,最后这个是ChatGTP出来所谓多模态的技术,不仅是文本、文字方式跟机器进行对话,还包括音频、视频更流畅跟机器互动。

  京东科技在技术领域有着十多年的沉淀,京东作为一家主流的电商平台,我们与数十万家客户保持着密切的互动关系,这使我们观察到了品牌商普遍存在的痛点。首先是用户使用的场景越来越碎片化。对于平台化和店铺的经营者来说,如何在消费者出现的更多场景中增加品牌的曝光率成为了一个重要的问题。

  其次大家说流量见顶了,流量越来越贵,如何将这些昂贵的流量转化为实际的销售业绩,此外,私域流量的建设和管理也是商家们关注的焦点。

  我们作为京东旗下研发团队,我们时刻关注着行业的发展趋势和需求。在直播行业从业人员缺口高达574万的情况下,从业者的水平参差不齐,许多从业者的直播表现并不理想。同时,打造一支专业的真人直播团队成本较高,而且请明星直播有存在塌房的风险。

  针对这些行业需求和痛点,我们凭借多年沉淀的行业一流AI能力,开始探索如何解决这些问题。

  这个是京东做的虚拟主播,实际上现在京东平台上,千万级的SKU理论上来讲,只要把SKU的链接拷贝给机器人,它能够自动化地生成直播话术,与粉丝进行互动。我们最新推出的产品,支持多平台和72小时开播,形象、声音都可以很方便地定制。

  对于品牌来说,使用我们的虚拟主播系统可以省去搭建完全真人直播间的设备、灯光、场地等费用,高度自动化的流程也免去了人工干预的繁琐。同时,该系统还可以获得公域流量,提升店铺的等级和权限,最终体现在GMV的提高上。从品牌宣传角度,更丰富的营销形态,也是更好地贴近年轻一代消费者,实现在宣传上的收益。

  接下来就是应用层面。实际上这里面,大家刚才看到的这些系统,对我们京东研七研发团队来说,我们也在打造一个底层架构的领域模型。这个模型不是通用的大模型,我们没有让系统去解决诸如做物理题或者写请假报告这类任务。但是,这套系统的底层技术单元与现在流行的ChatGTP很相似。当然在后续训练和具体调优上还有很大不同。

  京东研七团队打造的这套领域模型,之所以能够在AIGC新形式中实现不错的效果,是因为他们在学术界和产业界之间达成了一个更好的平衡。与通用的大模型相比,这套领域模型不需要上千亿参数量级的训练成本,但在特定的电商领域,只需要几十亿人参数量级的模型就能达到产业界可以接受的水平。此外,电商领域的知识图谱和商品知识的积累也使得这套模型在处理与商品相关的任务时更具优势。与谷歌的通用版模型相比,这套领域模型在电商场景下表现更优,具有更强的针对性和适用性。通过大量对比实验,我们发现垂直模型在电商领域的应用效果要明显优于通用模型。

  接下来,我们来看看多模态应用在平台上的展示。在平台上,机器人可以像真人一样通过图像识别技术来查看商品,例如识别出橘色连衣裙的颜色、泡泡袖和木耳边等元素。这些信息可以自动用于相关产品的生成。此外,我们的人工智能系统还可以自动提取大量商品标题和卖点描述。这些描述可以是短文案,也可以是长文本。目前,我们已经生成了30多亿字的文本,其中至少50%能够通过真人的审核,证明机器生成的这些要点提取是准确的。

  除了文本生成能力,我们的系统还具备从文本到声音的生成能力。通过机器学习技术,我们可以准确描述出产品的特色卖点,就像一个专业的推销员一样。同时,我们还可以播放一段金融催收的语音样本,让大家感受一下我们的语音生成技术。

  目前,我们的技术已经达到了以假乱真的程度,如果评分达到4.0以上,就可以认为生成的语音与真人很像。大家可以从屏幕上看到,如果评分达到4.5,如果不仔细听的话,已经难以分辨真伪。

  在直播间中,主播可以通过与粉丝进行大量实时的互动,分享行业知识和通用知识等。这些互动和分享最终形成了数据的闭环,为我们的模型提供了更多的训练数据和优化机会。

  这个是纯AI生成,包括发音、动作和表情等都是由AI驱动的。这是一个全新的主题,以前没有人做过类似的分享,如果不仔细看,很难看出这是由AI生成的。

  除了技术上的展示,我们还关注人货场数的运营和店铺的运营。我们沉淀了大量的直播方法论,这些技术和运营的综合应用为我们的实际店铺带来了显著的效果。

  大家可以看到一个酒类平台的成果。我们围绕利益点、话术、选品,结合大促节点进行营销节日的管控。最终取得了相当不错的成果,纯AI驱动的直播相当于真人直播GMV的1.98倍。

  除了AI技术的应用,我们还注重品牌IP的打造。有些品牌拥有3D或卡通模型,我们也可以根据这些模型快速打造出相应的数字人形象,并使其在直播间具备强大的带货和互动能力。

  最后简单总结一下,无论是从技术角度,还是全量自研的能力,里面涉及到所有的技术点都是我们团队自研的,这是非常强大的,国内很少有,只有大厂具备这样的能力,这样才能确保所谓端到端带货的效果。其次为什么京东能够做好,其实很多算法也好,模型也好,即便是开源的,没有大量的条件、数据和训练的话,也达不到这样的效果。所以,作为电商平台具备天然的数据优势,在此进一步展现。其他的话,无论从产品能力也好,以及运营、交付保障等,这些都是完全可以做到国内顶尖的水准。

责任编辑:柳紫荆

艾媒咨询|2023年中国虚拟人产业发展与商业趋势研究报告

iiMedia Research(艾媒咨询)数据显示,2022年中国虚拟人核心市场规模为120.8亿元,预计2025年将达到480.6亿元;2022年虚拟人带动周边市场规模为1866.1亿元,预计2025年为6402.7亿元。艾媒咨询分析师认为,虚拟人在内容和周边产品产出方面有着较强的可塑性,能根据

艾媒咨询|2023年中国虚拟人产业发展与商业趋势研究报告 精品决策