聽(tīng)說(shuō)過(guò)洛天依和《甩蔥舞》嗎?伴隨虛擬偶像的出圈,虛擬人產(chǎn)業(yè)已經(jīng)成為資本下注的新目標(biāo)。
公開(kāi)數(shù)據(jù)顯示,截至今年9月,國(guó)內(nèi)虛擬數(shù)字人賽道投融資金額已超過(guò)去年,達(dá)到24.9億元。2021年虛擬數(shù)字人相關(guān)企業(yè)投融資金額約為19.71億元,而在2015年這一統(tǒng)計(jì)數(shù)字僅為0.33億元,6年間復(fù)合增長(zhǎng)率達(dá)到97.71%。
各大科技巨頭也不約而同選擇在虛擬人領(lǐng)域“秀肌肉”:國(guó)外的Meta、微軟,國(guó)內(nèi)的騰訊、阿里、百度、快手、網(wǎng)易,均投入重金布局。
(資料圖片僅供參考)
除了虛擬偶像之外,虛擬人目前已在多個(gè)場(chǎng)景有落地應(yīng)用。“虛擬人的價(jià)值不僅僅是‘不塌房’的虛擬偶像?!表槥橘Y本副總裁馮錚告訴澎湃新聞?dòng)浾??!疤摂M人最大的應(yīng)用場(chǎng)景是虛擬身份和交互界面:前者是虛擬世界中的個(gè)人形象;后者相當(dāng)于虛擬世界中的機(jī)器人,由AI驅(qū)動(dòng),和人類交互。”
元宇宙市場(chǎng)像初創(chuàng)期的門(mén)戶網(wǎng)站
用學(xué)術(shù)的解釋來(lái)看虛擬人,指的是通過(guò)CG、動(dòng)作捕捉、VR等技術(shù),以圖片、視頻、直播等形式存在于非物理世界,具有擬人化特征的虛擬形象,也可稱為數(shù)字人。
Unity中國(guó)平臺(tái)技術(shù)總監(jiān)楊棟告訴澎湃新聞?dòng)浾撸摂M人技術(shù)發(fā)展已有較長(zhǎng)時(shí)間。之所以在今年備受關(guān)注,一是由于柳夜熙、洛天依等娛樂(lè)化虛擬人形象的出圈,二是“元宇宙”概念的興起。定制個(gè)人虛擬形象需求的不斷擴(kuò)大,讓虛擬人產(chǎn)業(yè)逐漸走入大眾視野。
“虛擬人最初走紅是在2017年,隨后經(jīng)歷了一段時(shí)間的摸索期,在這兩年逐漸走向商業(yè)化?!瘪T錚告訴澎湃新聞?dòng)浾摺!霸钪娓拍钫w虛無(wú)飄渺,其中大家接觸最多和最了解的就是虛擬數(shù)字人,無(wú)論是虛擬偶像還是虛擬主播,相對(duì)更形象和具體一些,因此受到資本的廣泛關(guān)注?!?
根據(jù)艾媒咨詢預(yù)測(cè),虛擬人帶動(dòng)的國(guó)內(nèi)產(chǎn)業(yè)市場(chǎng)規(guī)模將在2025年達(dá)到6402.7億元。
虛擬人究竟是怎么造出來(lái)的?網(wǎng)易伏羲虛擬交互技術(shù)負(fù)責(zé)人齋藤飛向記者透露,制作一個(gè)虛擬人,需要考慮場(chǎng)景、受眾、承載虛擬人的硬件平臺(tái)以及成本投入的上下限,這些限制條件綜合決定虛擬人的畫(huà)風(fēng)、美術(shù)品質(zhì)標(biāo)準(zhǔn),并且圈定人設(shè)的基本范圍,在此基礎(chǔ)上再進(jìn)一步確定角色名字、基本設(shè)定、主視覺(jué)的設(shè)計(jì)。
齋藤飛提到,虛擬人制造目前仍是一個(gè)復(fù)雜的技術(shù)體系,需要包括美術(shù)(建模師、綁定師、動(dòng)畫(huà)師)、開(kāi)發(fā)(客戶端開(kāi)發(fā)、技術(shù)美術(shù)、視效開(kāi)發(fā))、算法(語(yǔ)音生成、動(dòng)畫(huà)驅(qū)動(dòng))等跨學(xué)科、跨領(lǐng)域、跨職能協(xié)同。當(dāng)不同領(lǐng)域圍繞同一目標(biāo)共同前進(jìn)時(shí),如何高效統(tǒng)籌管理也是一項(xiàng)巨大挑戰(zhàn)。
目前,虛擬人分為多個(gè)種類,最為大眾熟知的是娛樂(lè)型虛擬人,其中包括柳夜熙、AYAYI、洛天依等虛擬偶像,她們活躍在社交媒體平臺(tái),偶爾會(huì)帶帶貨。 第二類是服務(wù)型數(shù)字人虛擬員工,此外還有一些虛擬數(shù)字人作為客服存在。 第三類則是ID型數(shù)字人,代表虛擬世界中的某個(gè)特定化身,例如虛擬新聞主播等。
“預(yù)計(jì)虛擬人的商業(yè)價(jià)值最大化要等5至10年?!瘪T錚表示,需要人人都有下一代硬件設(shè)備,才能像移動(dòng)互聯(lián)網(wǎng)那樣大規(guī)模地影響和改變世界,爆發(fā)出產(chǎn)業(yè)的最大價(jià)值。
在他看來(lái),其實(shí)目前虛擬人賽道的企業(yè)競(jìng)爭(zhēng)并不激烈。“可能企業(yè)普遍對(duì)于短期內(nèi)掙錢(qián)的領(lǐng)域更感興趣,而虛擬人目前的商業(yè)回報(bào)不明顯,更多是長(zhǎng)線布局?!?
作為投資方,馮錚坦言,自己對(duì)初創(chuàng)企業(yè)的技術(shù)能力和短期內(nèi)切入口最為關(guān)注?!艾F(xiàn)在的元宇宙很像1998、1999年時(shí),當(dāng)時(shí)四大門(mén)戶(網(wǎng)站)、阿里巴巴剛剛創(chuàng)立。今天虛擬世界也有一批有愿景的創(chuàng)業(yè)者開(kāi)始去嘗試,而且也吸引到了一批早期用戶。在業(yè)態(tài)迭代的過(guò)程中,產(chǎn)品會(huì)隨著認(rèn)知、技術(shù)、用戶甚至硬件的變化不斷進(jìn)化,這些都考驗(yàn)企業(yè)的核心技術(shù)能力?!?
大廠“跑馬圈地”,誰(shuí)能脫穎而出
值得注意的是,虛擬人已成為各大科技巨頭共同押注的賽道。
文娛產(chǎn)業(yè)分析師張書(shū)樂(lè)認(rèn)為,虛擬人某種意義上是互聯(lián)網(wǎng)大廠展示肌肉的集中呈現(xiàn)物,即內(nèi)容創(chuàng)造、人工智能、動(dòng)作捕捉和各種與之相關(guān)的技術(shù)的融匯。
在騰訊智能產(chǎn)品副總裁李學(xué)朝看來(lái),騰訊通過(guò)整合ASR(語(yǔ)音識(shí)別技術(shù))、NLP(自然語(yǔ)言處理)、語(yǔ)音交互、自然語(yǔ)言理解、圖像識(shí)別、TTS(語(yǔ)音自動(dòng)合成)、知識(shí)圖譜等AI能力,連接騰訊內(nèi)容和服務(wù)生態(tài),面向使用場(chǎng)景打磨平臺(tái)能力,助力客戶打造出有智能、有形象、可交互的數(shù)字分身。
“數(shù)字人是互聯(lián)網(wǎng)3.0的重要入口,既是技術(shù)對(duì)效率的解放,也將推動(dòng)線上和線下更全面地一體化,進(jìn)入全真互聯(lián)?!崩顚W(xué)朝認(rèn)為。
“網(wǎng)易伏羲事業(yè)部在2018年就成立虛擬人團(tuán)隊(duì),當(dāng)時(shí)的團(tuán)隊(duì)成員是國(guó)內(nèi)最早的虛擬人制造師之一?!本W(wǎng)易伏羲AI虛擬人首席專家大丁向記者透露。
如今,虛擬人制造師已經(jīng)成為炙手可熱的工作,不僅涉及AI從業(yè)者,也包括工程平臺(tái)、技術(shù)美術(shù),產(chǎn)品經(jīng)理,項(xiàng)目管理、商務(wù)等崗位。
百度自2019年正式進(jìn)軍數(shù)字人領(lǐng)域,并主打高度定制化的超寫(xiě)實(shí)機(jī)器人。百度數(shù)字人與機(jī)器人業(yè)務(wù)負(fù)責(zé)人李士巖告訴記者,虛擬人是技術(shù)驅(qū)動(dòng)型的市場(chǎng),一旦某個(gè)技術(shù)突破,市場(chǎng)就會(huì)迅速展開(kāi)?!皬氖袌?chǎng)規(guī)模來(lái)看,預(yù)計(jì)2030年達(dá)到2700億,在整個(gè)產(chǎn)值來(lái)看,2022年發(fā)生在市場(chǎng)上的產(chǎn)值是大幾十億左右,且預(yù)計(jì)每年會(huì)有超過(guò)50%的速度遞增?!?
在他看來(lái),虛擬人是web3.0以及元宇宙時(shí)代的主要內(nèi)容,也是主要的交互載體。“我們非??粗靥摂M人未來(lái)應(yīng)用場(chǎng)景,以及為企業(yè)在營(yíng)銷(xiāo)和生產(chǎn)上帶來(lái)的價(jià)值,將來(lái)虛擬人會(huì)是每個(gè)人在元宇宙中的載體和分身,百度會(huì)堅(jiān)定投入,無(wú)論是人力上或者資金的投入方面,每年都是百分之幾十的速度增長(zhǎng)。”
快手也宣布了自己在虛擬人方面的進(jìn)展。快手Y-tech AI技術(shù)中心負(fù)責(zé)人萬(wàn)鵬飛告訴澎湃新聞?dòng)浾?,“目前快手已?jīng)能夠提供從建模到最終的內(nèi)容制作的一站式服務(wù),在全鏈路上都有深厚的積累。”他透露,數(shù)字人和XR是快手發(fā)展路徑上的重要方向。
10月12日,Meta發(fā)布最新數(shù)字人成果:用手機(jī)掃描即可生成超寫(xiě)實(shí)數(shù)字化身,根據(jù)扎克伯格在發(fā)布會(huì)視頻中的介紹,Meta的最新掃描技術(shù)允許在任何正常光源下進(jìn)行自主掃描,這是突破數(shù)字人掃描中空間局限的一次大膽嘗試。此外,Meta的科研人員透露,他們?nèi)詫⒅铝τ诳s短處理時(shí)間,以進(jìn)一步提升掃描效率。
制作成本高昂,實(shí)時(shí)交互是難題
楊棟透露,虛擬人的制作成本非常高,從前期的動(dòng)作、表情捕捉,到后面的數(shù)據(jù)處理、渲染,時(shí)間成本、人力成本都非常高昂。
“要想降低成本,首先要摸索出一條標(biāo)準(zhǔn)化的制作流程,并且在每一步流程里,提供相應(yīng)地專業(yè)化、標(biāo)準(zhǔn)化工具或解決方案,從而帶動(dòng)整個(gè)行業(yè)加速發(fā)展?!?
在他看來(lái),虛擬人真正的難點(diǎn)應(yīng)該是在實(shí)時(shí)交互上,現(xiàn)在偏寫(xiě)實(shí)或者3D的虛擬人的展現(xiàn)方式其實(shí)更多的是視頻類型,如果需要做到實(shí)時(shí)交互,則不僅要依靠畫(huà)面,還需要語(yǔ)音、智能系統(tǒng)、硬件設(shè)備、網(wǎng)絡(luò)甚至算力的系統(tǒng)配合。產(chǎn)業(yè)的發(fā)展還需要時(shí)間,但是需求和市場(chǎng)都已經(jīng)存在。
萬(wàn)鵬飛同樣提到了實(shí)時(shí)交互的重要性和難點(diǎn)?!坝脩粜枰铜h(huán)境交互的能力,以及和其他人交互的能力?!彼J(rèn)為,虛擬世界構(gòu)建的核心仍然是社交關(guān)系,而這種關(guān)系需要身份系統(tǒng)、環(huán)境系統(tǒng)、經(jīng)濟(jì)系統(tǒng)等共同構(gòu)建。這在技術(shù)上仍然是一個(gè)不小的挑戰(zhàn)。
不過(guò),雖然得到業(yè)界和資本圈的普遍看好,虛擬人目前的發(fā)展仍在早期階段。張書(shū)樂(lè)向記者分析,目前虛擬人內(nèi)容輸出依然需要人工完成,即依靠聲音庫(kù)生成而非人工智能角度的虛擬數(shù)字人(如洛天依)演繹的大量?jī)?nèi)容創(chuàng)作者來(lái)進(jìn)行歌曲創(chuàng)作、動(dòng)作捕捉,而這并不比配合現(xiàn)實(shí)藝人的演藝簡(jiǎn)單。
另外,人工智能向的虛擬數(shù)字人,盡管可以進(jìn)行有效問(wèn)答,亦可針對(duì)特定內(nèi)容(如高考作文)進(jìn)行創(chuàng)作,但涉及到認(rèn)知盲點(diǎn)就不再有效。例如在駕駛過(guò)程中,成為車(chē)載導(dǎo)航的虛擬數(shù)字人進(jìn)行人機(jī)交互的展示意義和智能音箱并無(wú)二致,形象呈現(xiàn)也無(wú)實(shí)際意義。
“僅僅看到營(yíng)銷(xiāo)成本降低,卻無(wú)視虛擬數(shù)字人的研發(fā)、維護(hù)和升級(jí)成本,都是將虛擬人看作是一種低成本營(yíng)銷(xiāo)和蹭熱點(diǎn)手段的偏見(jiàn)?!睆垥?shū)樂(lè)表示。
網(wǎng)易伏羲產(chǎn)品經(jīng)理閣語(yǔ)透露,未來(lái)技術(shù)團(tuán)隊(duì)的發(fā)展方向主要分為兩類:一是致力于打造更生動(dòng)自然的虛擬人,讓其表現(xiàn)趨近于真人;二是如何去實(shí)現(xiàn)虛擬人生產(chǎn)和AI能力應(yīng)用的一個(gè)規(guī)?;?,實(shí)現(xiàn)將虛擬人技術(shù)高效的應(yīng)用在各個(gè)場(chǎng)景中。
關(guān)鍵詞:
責(zé)任編輯:Rex_01