“虚拟数字人”展露现实价值
来源:人民日报海外版 2022-02-23 10:39:22
虚拟主播一天可录制500万字的有声书、手语数字人为听障人士解说冬奥赛事……随着AI等信息技术快速发展,一批虚拟数字人走红网络。中国传媒大学媒体融合与传播国家重点实验室媒体大数据中心日前发布的《中国虚拟数字人影响力指数报告》显示,近年人们对虚拟内容需求增加、消费级VR(虚拟现实)硬件快速发展,虚拟数字人发展进入快车道。
在多个行业崭露头角
去年6月,清华大学迎来中国首个原创虚拟学生“华智冰”。她不仅会4种舞姿,还可以根据关键字、关键词赋诗作画,甚至可以写一些短篇文章。2021年,万科总部最佳新人奖的获得者“崔筱盼”是一位虚拟员工。她的工作内容是快速监测各类事项的逾期情况,并推动工作及时办理。
随着AI技术的成熟,诸如虚拟员工、虚拟代言人、虚拟学生等虚拟数字人正愈发频繁地出现在公众视野,在社交、传媒、营销等领域创造现实价值。
目前大众对虚拟数字人的认知度如何?中国传媒大学等发布调查显示,对不同类型的虚拟数字人,大众对其外形、人设、技术能力、服务能力有着明显的期待差异:60%以上的用户最关注虚拟偶像的外形和作品,66%的用户关注虚拟主播的主持风格,但50%的用户认为虚拟员工最重要的是技术服务以及跨界合作能力。
“简单来说,虚拟数字人就是融合了计算机视觉、语音识别等AI技术生成的形象。”腾讯智能产品副总裁李学朝接受本报记者采访时说,虚拟数字人可借助语音与表情更好地沟通表达,从而带来全新的人机交互体验。
技术突破支撑发展
事实上,虚拟数字人并不是新鲜概念,最早可追溯至2007年。当时,以语音合成程序为基础开发的音源库“初音未来”,成为首个现象级虚拟偶像。在此后相当长时间内,虚拟数字人大多以动漫、游戏形象为主,集中应用于影视娱乐产业。
近年来,技术环境的改善让虚拟数字人发展迎来利好。虚拟数字人形象日趋逼真、交互更加顺畅,在越来越多领域发挥作用。
清华大学新闻与传播学院教授沈阳表示,机器学习、深度学习和语义理解等技术取得突破、3D成像传感器日益成熟、算力提高与通信速度加快,都为虚拟数字人的发展质量提供了技术保障。
与此同时,《新一代人工智能发展规划》等多项政策,也加速了虚拟数字人底层技术的发展。其中,《广播电视和网络视听“十四五”科技发展规划》明确提出,要推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教等节目生产,创新节目形态,提高制播效率和智能化水平。
业内人士表示,按功能划分,当下的虚拟数字人可细分为服务型与身份型两种。前者可在特定场景提供服务,替代诸多服务行业的社会角色,例如企业员工、主持人、管家等;后者更倾向于在文娱领域应用,例如虚拟偶像、虚拟主播等。
《中国虚拟数字人影响力指数报告》将当前国内应用最多、最具人气的虚拟数字人分为虚拟偶像、虚拟员工、虚拟主播三类。该报告指出,这三类是当前虚拟数字人商业化价值最高、企业及资本参与度最强的类型。随着应用场景的拓展,未来该分类会进一步拓展、细化。虚拟数字人将成为人机交互新界面,承载数字世界的沉浸式体验。虚拟员工将在消费品、金融、地产、物业、教育、文旅等服务行业发挥作用。
规模化落地仍待破局
据市场研究机构“量子位”发布的《虚拟数字人深度产业报告》显示,到2030年,中国虚拟数字人市场规模预计将达到2700亿元。到2030年,身份型虚拟数字人市场规模预计为1750亿元,服务型虚拟数字人则相对稳定,总规模也将超过950亿元。
虚拟数字人的走红折射出虚拟世界与现实世界走向融合的大趋势,但要真正实现规模化落地还有不小的差距。例如,虚拟主播可随时、随地、定制化播报新闻,体现了人工智能与媒体行业的深度融合,但在同质化竞争、自主技术能力上还面临挑战。
“华智冰”研发团队认为,当前,AI正在从感知智能走向认知智能,机器也要从识别语音进化到理解语音,这对虚拟数字人的人机交互体验和场景应用提出更高要求,带来更大挑战。
破局的关键在于深度的场景理解和有效的技术提升,不少科技企业已开始探索。以腾讯云小微数智人为例,基于金融、政务、文旅等不同行业需求,可提供多样化的解决方案,如审核面签、理财顾问等角色,每个数智人的侧重能力有所区分,能更好满足各类业务场景的服务需求。
“我们希望虚拟数字人不仅要有真人交互的情感温度,更要有强大的AI能力。”李学朝说,要保证最优服务性能,为各行各业输出完整的解决方案,不断渗透到智慧生活的各个场景。
此外,虚拟数字人缺乏行业规范,还可能引起假冒人物原型进行诈骗等违法犯罪活动。“虚拟数字人看上去与真人高度相似,跟你打视频、通电话,都可能无法分辨。”上海交通大学人工智能治理与法律研究中心秘书长何渊说,未来需要对深度合成的虚拟数字人专门立法。除了政府监管,行业各方还要有合作治理理念,提前防范相关法律伦理道德风险。