草根影响力新视野 黎松子  

谈起数字人,它其实最早起源于影视工业,早在本世纪初就在《阿凡达》中大放异彩。时隔13年借助数码技术的飞跃,《阿凡达2》贯穿全场的强大特效,更是将纳威人后裔与屠鲲共舞的栩栩如生展现的淋漓尽致。

演唱会、综艺、代言、走秀、直播,虚拟数字人全面攻陷,现如今就连我们熟知的头部直播带货李佳琦也正面临被数字人替代的风险。

从起先应用于增强观影效果,到近年来走进金融客服、传媒口播等,数字人应用场景的扩大越来越考验其逼真程度,要做到逼真,就要让数码人既拥有好看的皮囊,又具备有趣灵魂,现在很多数字虚拟人都做到了,而且还越来越酷呢!

Part1 好看的皮囊

AI赋能、三维重建算法以及生成AI技术,通过建模、渲染、动作捕捉和AI驱动技术能够让数码人的外貌更加精致,形象更加逼真,动作更加自然。换句话说就是皮囊更好看了

跨越恐怖谷效应后,会让人觉得数字人和真人无异,创建良好的心理连接。

骏眉秋眼、顾盼神飞,从800年前的南宋穿越而来,美少女虚拟人谷小雨出现在美丽的杭州城,并在2022宋韵文化节开幕式上惊艳亮相,粉丝们经不住感叹,谷小雨也太好看了吧!她是由浙江省委宣传部指导,浙江广电集团ZMG旗下的浙江卫视联合腾讯互娱CROS知己团队共同打造的宋韵文化推广人,同时还是浙江卫视虚拟主持人。

国潮复兴,我们太需要这样美美国风小姐姐了。

再看这家数字人,走的是个性风,福克斯电视台做的一档虚拟数字人歌唱大赛《ALTER EGO》节目,全球第一档虚拟人物歌手大赛。

“Alter Ego”来自拉丁语,意为“另一个自我”,通常被认为与一个人正常或原有的性格有鲜明的区别。本节目参赛者留在后台,通过操控自己的虚拟人物在舞台上进行表演来参加比赛。用“另一个我”来展现特色,他们的虚拟角色不仅在外形上比真人来得更夸张,而且在情感表达上也更加丰富。他们不仅可以流泪,还能向评委发射爱心和电眼光波。

更重要的是,他们每个人都不用用真实的面貌展示自己,有的人有舞台恐惧,有的人有容貌焦虑,这些都不成问题了,许多天才选手将会通过这种方式展现自己的才华,很多参赛选手都在节目中打开心扉。

人形 外侨 生物 电影院 史诗 亭 视频 在线 娱乐 屏幕 想像力 眼 美国 地球 海报 图片 空间 媒体 数字 图形 放松 男人 幻想 看 人 电影 电影 剧院 头像 艺术 科学 相机 看 流行 行动 字符 蓝色 促进 流 男性
图片取自:(示意图123rf)

Part2 有趣的灵魂

从外观上难辨真假之余,数字人面临的更大考验是交流起来能否有个有趣的灵魂。当下大火的AIGC能力虽然解决了底层内容创意生产的成本技术问题,但上升到数码人层面,AIGC尚无法实现灵魂最重要的一部分,一个人要有自己的特征,再就是要有emotion,要有情感,千篇一律的不能叫做灵魂,能够打动心灵的反而是资料无法体现的可能非常微小的情感。但这些在突飞勐进的技术算法能力之下,很多数码人已经做得很好了。

比如宋韵文化代言人,谷小雨,通过最雪铁龙的数码科技,小雨担任德寿宫遗址博物馆AI虚拟导览员,能够和大家对话互动,畅聊德寿宫的历史文化,传颂经典宋词,还能指引展厅内的路线导览等等。

小雨首先需要捕捉到游客的语音,通过深度学习、自然语言理解等技术,叠加腾讯游戏语音GVoice 和微信智聆语音两大技术团队提供的语音辨识技术,她便能听懂游客的意图并进行回复。即使是游客的超纲问题,她也能对答入流,因为她已经进行了超过400G开放资料和30亿参数量的超大语言模型训练。

这只是语言训练方面,还有表情和动作、个性与风格。小雨韵律自然、情感丰富的高表现力背后是一套从语音到面部、端到端的高表现力AI合成和驱动技术链路,她在对大量情感语音资料进行反复学习后,基于自主研发的超大规模中文语音预训练模型,能够针对各种音色、歌唱、语气词等不同类型的音讯自动匹配相应的面部表情和口型,小雨生动的语音

也就在面部自然流露了出来。

而在刚才提到的虚拟歌手大赛中的虚拟数字人则更复杂,因为他们要在真实的舞台环境中和真实的舞者、灯光、摄像互动,还会跟现场的观众互动,这需要更大的算力合成渲染。

选手们穿上动作捕捉服装,采集详细的动作信息,赋予到虚拟人身上

面部细节特征尤为重要 ,就像当初阿凡达电影里面一样,动作捕捉和面部识别技术相结合,让选手们重塑自我,并展示他们独特的表演风格。

注意看,选手们的“阿凡达”形象上,纹身是可以动的,还会流出真实的眼泪,添加了真实性和情感

Part3 虚拟数字人哪家强?

目前大陆内部评选出的业界最强虚拟数字人,是由中国信通院牵头,依托国际电信联盟ITU、中国通信标准化协会CCSA等国内外标准组织,联合国内外专家头部企业等制定的评选守则评定的,包括腾讯火山发动机、百度、科大讯飞、阿里云、华为等在内的18家企业参与测评。在信通院严格的评测筛选下,百度智能云曦灵获得唯一杰出级奖项。

从人像构建方面看,在曦灵上载一张照片,就能分钟级生成数码人。

还可以通过1,200个维度实时控制精细表情,让你的数码人毛发毕现。

在驱动方式与内容生成方面,曦灵在传统的动捕和面捕之外,还主打AI驱动和7种情绪切换控制,同时搭载smart语音大模型,使得语音辨识准确率达到98%,数字人口型合成准确率达到98.5%,让数码人的逼真程度进一步加深。

再来看关键的交互,真实感是最大的考验,一方面要看端到端耗时指标,曦灵打造的数字人,拥有自己的经验和认知,能在极短时间内听懂并回馈,并能回答得有趣有料,真正实现有趣的灵魂。

在传媒领域,百度智慧云曦灵为央视新闻打造的AI手语主播,在2022年冬奥会期间正式上岗,让更多听障人士享受科技带来的便利。

同年两会期间,百度智慧云为央视网打造的数字人小c形象自然表达流利,为观众带来虚实结合的全新直播体验。

在金融领域,百度智慧云联手浦发银行,打造的金融数码人落地,通过理财推荐、实时问答,24小时客服在线等场景应用,大幅提升了用户体验,推动浦发银行持续智慧化转型。

在文博领域,曦灵为中国文物交流中心,打造的首个文博虚拟宣推官文夭夭。

与国家大剧院携手共创首个虚拟员工——art鹅,服务入场观众,提供讲解导览等服务。

在直播领域,百度推出的数码人直播平台,不仅可实现数码人24小时纯AI直播,还为商家降低30%以上的直播成本。

未来10年,随著整个AI算法的进步,芯片的反复运算,整个制作效能还将得到更大的提升。未来可期的渲染和生成能力,不一定需要买芯片,通过云计算的加持,通过AI能力的进一步进化,数码人的制作技术将变得更加简单化、一体化和自动化。面向未来,真实世界和数码世界的边界将愈发模煳,数字人也正成为未来虚拟与现实世界的交互接口之一。

怎么样,心动了没有,赶快设计自己专属的数码虚拟人吧!