炫科技
元宇宙火爆 看华为云数字人的“方法论”

“数字人”正在迎来爆发时刻。

过去一年时间,几乎所有科技企业都推出了自身数字人形象或者创新技术,并且开始向娱乐、电视、内容产业加速普及。

Research And Markets研究预计,到2028年,全球虚拟数字人产业规模将达到5047.6亿美元(约32707.44亿元),是一个真正的“万亿级新赛道”。第三方统计数据显示,2020年国内虚拟数字人相关企业新增数量为36080家,2021年该数据达到66293家,同比增长80%。天眼查数据显示,我国现有“虚拟数字人”相关企业约30万家。

6月15日举行的华为伙伴暨开发者大会2022上,华为云CEO张平安发布了15大创新服务,覆盖了经验即服务、技术即服务和基础设施即服务三大领域。其中华为云数字内容生产线MetaStudio推出了“数字人”全新升级方案,引发了产业、开发者与媒体的广泛关注。这也是张平安即2021年9月华为全联接大会之后,第二次与华为云虚拟数字人“云笙”的公开对话与沟通展示。

华为云“数字人”不仅是华为长期以来在AI领域持续技术投入与引领创新的代表应用,也是体现华为云“技术即服务”优势、为开发者与合作伙伴提供更加高效便捷的AI开发能力,推动产业“数字人自由”普及与加速迈向“元宇宙”的重要布局。

数字人产业的理想与现实

数字人概念火热,元宇宙赛道拥挤,但所有人都无法忽视现实世界中存在的诸多瓶颈问题。

首先,是成本难题

去年10月被称为“现象级数字人”的柳夜熙凭借“捉妖”题材短视频爆红,一夜涨粉363万,但在之后却因为更新频率被粉丝频繁“催更”,其他数字人更是出现了出道后人气不断下滑的普遍现象。

据业界人士分析,采用传统方法制作CG级的视频成本非常高,往往一分钟的视频需要2-3个月的制作周期,稍有品质的写实数字人形象更是百万级投入门槛起步。曾经引起轰动的黄仁勋虚拟人可作为参考,根据英伟达官方博客,黄仁勋虚拟人在发布会上出镜的14秒视频,共有34位3D美术师和15位软件工程师协同参与,总计近千工时。这就造成了数字人要么面临“粗制滥造”,要么沦为“大厂游戏”的产业现状。

第二,场景“拟人化”的交互难题

数字人并非是一个人物建模、渲染与皮肤贴片这样简单,关键之一是可以给用户提供所在场景适合的“拟人化”交互。或者说,得让用户感觉其“不违和”、“不跳场”。从技术角度来看,需要自然语音处理与准确语义理解能力、音色拟人合成、知识图谱、动作捕捉与机械学习等众多AI技术共同聚合创新的结果。这实际上也是如今很多数字人都仅限于2D、动作僵硬、以及肢体和语音不协调,看起来“智商不够”和“肢体不调”的重要原因。

第三,必须深入结合场景与应用。

目前很多大厂推出的数字人还处于“亮肌肉”与“品牌营销”概念。而数字人真正走向普及,必须深入真实的用户使用场景、必须与具体行业应用深度结合,这些显然不是一家企业可以完成,需要大量行业企业与开发者共同推动实现,但显然目前整个行业缺乏足够吸引开发者兴趣、并且提供足够创新技术能力的解决方案。这也就决定了数字人无论是距离用户、开发者还是行业普及应用还都“太远”,

以至于有媒体评论称:数字人理想很丰满,但现实很骨感,产业应用更是处于“尴尬期”。

华为云数字人两大特点与三个能力

去年华为全联接2021上,华为云数字人“云笙”以一段 Rap+街舞展示了“工程师的数字人浪漫”。对于华为云而言,“云笙”更代表了华为云为行业伙伴与开发者提供完整数字人技术赋能与开发解决方案、共建智能世界云底座的理想与决心。

今年2022华为伙伴暨开发者大会上,“云笙”在形象、交互与能力上皆实现了全面升级,并作为“讲解员”详细介绍了华为云数字内容生产线 MetaStudio 全新发布的数字人服务,概括来讲有三个显著能力与两大优势特点:

让人人都可以用得起数字人。

与目前行业中数字人制作动辄几十或上百万费用、数个月的长周期制作相比,华为云数字内容生产线 MetaStudio推出的“数字人生成服务”可以为用户提供“照片直接上传、5 秒生成专属3D数字人”创新功能。通过AI读取面部关键特征可实现快捷3D建模,数字人面部还保留了真人标志性的特征,相似度很高,并且支持用户的个性化“捏脸”和美颜设置。

对于开发者而言,“数字人生成服务”可以满足用户的高效、相似与个性化的数字人生成体验,开发者可以更加专注于更多功能与场景的创新,比如游戏、电商或者社交应用服务,而不再将大量的开发资源投入到基础能力的低效重复建设,按照“云笙”的话来说,就是“零门槛分分钟”实现“数字人自由”。

即使是行业中如今对制作要求较高的“写实数字人服务”,MetaStudio通过光笼扫描 360 度真人照片,几何生成基础模型大约10分钟时间,通过AI 纹理补全算法对模型进行着色也仅需1个小时即可完成。同时拥有1000+高精度写实素材,可基于多维特征自动匹配头发、眼睛、眉毛等,最终加上人工精修,整个制作周期从业界 2-3个月缩短至7天以内。对于很多品牌企业打造品牌形象数字代言人,或者影视/游戏企业制作数字人CG需求,MetaStudio写实数字人服务同样可以拥有低成本、高效率、高品质的数字人生成能力。

让人人用得好数字人。

MetaStudio此次还发布了“数字人直播”与“数字人视频制作”两大创新服务。

如今很多数字人直播采用的还是2D卡通版本,其中最主要的原因是3D数字人需要单独购买几十万甚至上百万元的专业动作捕捉设备,同时还需要相关的场地搭建和技术运维人员,成本和门槛都相当高。而华为云MetaStudio提供的数字人直播服务基于强大的AI算法,只需单摄像头就可实时驱动3D数字人,并且结合了华为云强大的直播和实时音视频能力,让交互时延低于 100ms,由此数字人在直播带货、健身演示、影视剧创作中都具备广泛的应用场景。在华为伙伴暨开发者大会2022上,一位来自华为云的工作人员,也现场演示了与“云笙”的同频共舞,令业界和开发者印象深刻。

这种理念非常相似智能手机领域的计算影像,比如苹果和谷歌Pixel之前用单摄像头就可打败很多安卓品牌的多摄像头方案成像能力,其中AI算法领先和对场景的理解已经可以做到超越“堆硬件”方式,数字人领域也同样如此,可以有效降低开发者和用户对硬件的需求门槛,从而加速数字人面向大众用户的应用创新与普及节奏。如今这个方案已经在湖南多豆乐漫娱传媒完成落地。

另一个是MetaStudio此次发布的“数字人视频制作”服务,只需后台输入文字,即可通过 AI 驱动制作出数字人视频讲解,并且还可以不同场景需求设定不同情绪。这项能力可以帮助数字人更好地服务于客户、在线教育、新闻主播、社交、情感陪伴等众多场景,有利于开发者高效、低成本地打造全新应用形态,或者大幅提升现有应用的在线交互体验。

从“人人都可以用得起”到“用的好”,体现了华为云的一大理念:将简单留给伙伴与开发者,将复杂留给自己,并通过技术创新与生态开放的方式将复杂的问题变简单,共同为用户/客户打造更好的体验与服务。

华为云数字人的四大优势

在中国科技企业中,华为云是打造“数字人底座”的产业最优选之一,主要有四大层面的原因:

首先,是华为云对数字人的独特理念与清晰判断。

华为云CTO张宇昕在大会期间的媒体对话环节,阐述了华为云对元宇宙与数字人的战略判断。张宇昕认为,华为是一个以技术为本的科技公司,对概念炒作不感兴趣,而是希望通过关注技术本身,洞察概念背后的问题本质。

元宇宙肯定是大方向,其本质是数字世界与物理世界“融合”,起码需要三点技术支撑:数字内容的生产、围绕内容做数字世界的应用,以及跨界融合互动(包括数字内容与物理实体、数字内容之间、数字对象之间的互动),这些都需要有一个强大的互动框架来实现数字内容之间的协同。华为云数字内容生产线 MetaStudio应运而生,并且在本次大会期间推出了全新的数字人服务,就是为了满足数字内容生产、协同、融合与应用的广泛需求。

张宇昕表示,华为云推出数字人目的主要有两个:帮助数字人做得更好,通过数字人的一系列服务帮助数字生产变得简单。这两个目标将会解决数字人目前很多尴尬问题与叫好不叫做的产业现状,帮助合作伙伴和客户面向千行百业大力发展数字人的创新与普及应用。

第二,是重视行业落地。

就如张宇昕所说,华为云推动数字人的目标并非“炫技”,而是通过AI技术与方案赋能合作伙伴,真正撬动行业的数字人普及。这种踏实的理念和动作,也为华为云数字人的落地创造了更加高效的行业落地通道。比如湖南卫视的《你好星期六》综艺节目中,节目主持人“小漾”就是基于华为云MetaStudio生产出来的数字人,也被观众称之为“何炅老师的最佳新人搭档”、“接梗都流利自然”。

华为云在长沙马栏山音视频创新中心已经构建了摄影棚,通过 72 台世界领先级高精度拍摄系统,能够对目标人物每个角度的色彩及深度光场信息进行采集,直接将真人动作视频扫描成 mash 化的几何模型,无需驱动即可应用到后期视频制作当中。同时还具备三大特点:1)模型重建、编码,视频合成等全部上云,按需租用,极大减少了本地自建工作站的成本;2)模型传输过程中,通过华为 ReMesh Tracking 专利压缩算法,带宽成本节省 50%;3)通过 AI 材质估计与重光照处理,虚实融合更加自然,重构了传统影视虚拟制作过程。

第三,华为拥有全球科技企业中少有的“全栈全场景AI解决方案”。

数字人本身就是如今众多AI技术的“合集”,同时又有充足的能力与潜力服务于千行百业的AI场景创新。华为AI在技术上有三大特点:持续的强劲投入、AI全栈解决方案,原生关键技术能力。

AI即是应用科学,也与基础性技术研发密切相关。而真正实现AI无所不及,AI解决方案必定是原生全场景的。华为多年来一直强调对基础科技研究的高度重视,任正非曾对此指出:华为要敢于“向上捅破天、向下扎下根”。华为过去十年研发投入8450亿元,其中2021年就高达1427亿元,占全年收入的22.4%,仅基础研究上投入一年就超过200亿元。在AI领域,华为轮值董事长徐直军早在2018年就曾透露过一个数据:当年AI研发投入达15亿美元(约百亿人民币),研发团队超过5000人。伴随近两年华为AI大规模应用与全栈技术持续突破,相关投入注定也会呈现强劲增长,这在全球AI企业中也处于绝对头部位置。

最后,华为云推动的AI开放策略。

“智能世界的云底座”是华为云的明确定位与成长战略,也是如今华为云坚持推动“一切皆服务”的重要原因。“服务商”理念,让华为云可以专注于通过技术开放赋能行业伙伴与开发者,共同打造更好的方案与应用服务好客户/用户,从而创造全新价值与商业生态模式。在这个过程中,华为云也可以通过确立清晰的边界,更快更好地获得合作伙伴的广泛支持,从而更加高效顺利地达成“构建万物互联的智能世界”的企业愿景。

今年华为伙伴暨开发者大会2022上,张平安发布了华为云新的伙伴政策,并宣布启动华为开发者大赛。其中新伙伴体系包括 GoCloud 和 GrowCloud 2 个合作框架,前者在于培育与发展伙伴能力,为客户创造更多价值,后者目标帮助合作伙伴扩大客户覆盖,实现商业共赢。在媒体专访环节,张平安对此表示:华为过去都是以销售为主导,但云服务应该是生态与服务为主导,这与华为过去的体系不同,也是云服务的一大差异化特点。云不是卖设备,而是长期服务,因此华为云业务形态正在走出全新的体系与模式探索。

公开数据显示,目前华为云伙伴数量已超过 38000家,开发者数量超过302万,伙伴在华为云市场上架的应用数量已达 7400 多个。更加广泛的开发者,与适配度更高的模式创新,有利于华为云AI从技术领先走向生态引领,也有利于华为云数字人可以更加高效地完成千行百业的落地,实现与合作伙伴、商业客户的共同生态创新与产业应用。

由此来看,华为云数字人从技术特点、“一切皆服务”理念、共赢生态打造,以及千行百业落地方式等多个维度,都与华为云的理念、能力与目标一脉相承。对于华为云而言,数字人即是华为AI技术能力合集,也如张平安所言:其目标是为客户提供全流程、场景化的数字人开发和应用支持,使能数字人进入千行百业。

《壹观察》评论

“数字人”其实并非是一个新鲜事物。

早在1958年,音乐制作人罗斯·巴格达萨里安(Ross Bagdasarian)用动画和调音技术,制作了由三个拟人化的花栗鼠组成的虚拟乐队——艾尔文与花栗鼠(Alvin and the Chipmunks),第二年,这个虚拟乐队的专辑就获得了格莱美最佳儿童唱片、最佳喜剧表演和最佳工程唱片三项大奖。

80年代动画片《超时空要塞》的女主角,在向入侵的外星军团发起总攻时,明美作为人类的头号歌姬在太空唱响的那周《可曾记得爱》,至今仍被很多动漫迷视为“不可超越的经典”。

2013年上映的人文与科幻经典电影《Her》,讲述了作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了电脑操作系统中一个叫做“萨曼莎”的“姑娘”。她风趣幽默、善解人意,为孤独的男主提供了十分治愈的情感陪伴。这个温暖的超现实科技画面,震撼了全球观众,也让科技行业看到了数字人的广阔创新空间与美好未来。

如今“数字人”再次成为各行业跨界投入的热点方向,主要的原因有三个:元宇宙概念兴起、技术开始进入成熟门槛,以及用户的广泛需求与期待。万物智联之下,当所有终端与设备全部联网,数据与服务都跑在云端,那么“数字人”就会成为用户穿越在数字世界与物理世界之间的最好的交互体验。对于千行百业而言一方面“数字人”可以面向大众用户提供更好的“拟人化”服务,而不是过去Logo化的冰冷品牌印象;另一方面则可以更好地面对数字化与智能化产业升级需求,帮助操作人员更加高效与低门槛的完成任务操作。Gartner预测称,到2026年,全球30%的企业机构将拥有用于数字人和元宇宙的产品与服务。

这也是华为云积极部署数字人的重要原因,因为其一方面要支撑终端业务面向大众用户与商业市场的智慧全场景变革需求,另一方面也同样要面对千行百业的数字化升级与创新落地方案。而华为云MetaStudio此次推动的全新数字人服务,就是华为云打造“最佳数字人创新生态平台”的开始。

星星之火,可以燎原。华为云与开发者和合作伙伴的数字人创新之旅,也会成为照亮智能世界、引导数字科技创新的璀璨之光。