AI數(shù)字人介紹:AI數(shù)字人的存在,離不開技術(shù)支撐,并且如今各大廠商都參與進(jìn)去,甚至如今銀行業(yè)紛紛開始“造人”,用于自身的數(shù)字化轉(zhuǎn)型。但每個AI數(shù)字人的出發(fā)點(diǎn)不同,其扮演的角色也不盡相同。其實(shí),AI數(shù)字人產(chǎn)業(yè)看似火爆,其背后的產(chǎn)業(yè)鏈還是主要由:技術(shù)方案(基礎(chǔ)層、平臺層)和內(nèi)容應(yīng)用(應(yīng)用層、運(yùn)營層)兩方面構(gòu)成。而從上下游環(huán)節(jié)來看,AI數(shù)字人上游主要是為虛擬人制作提供基礎(chǔ)軟硬件設(shè)施的服務(wù)商。比如能提供建模、動作捕捉和渲染等相關(guān)技術(shù)的產(chǎn)商。而中游則是為AI數(shù)字人提供軟硬件系統(tǒng)、生產(chǎn)技術(shù)服務(wù)平臺和AI能力平臺的廠商。下游則是針對于AI數(shù)字人進(jìn)行運(yùn)營和變現(xiàn)的廠商。高級的虛擬數(shù)字人現(xiàn)在基本上包含虛擬形象+語音交互+自然語言理解+深度學(xué)習(xí)等技術(shù)的實(shí)現(xiàn)。元宇宙虛擬數(shù)字人訂制
在中國,數(shù)字人行業(yè)的政策正在快速制定和發(fā)展。2023年,中國及31個省市已經(jīng)發(fā)布了關(guān)于數(shù)字人行業(yè)的政策匯總和解讀,其中特別強(qiáng)調(diào)了虛擬現(xiàn)實(shí)是政策重點(diǎn)支持的技術(shù)領(lǐng)域。此外,北京市經(jīng)信局在2022年8月發(fā)布了國內(nèi)數(shù)字人產(chǎn)業(yè)專項(xiàng)支持政策——《北京市促進(jìn)數(shù)字人產(chǎn)業(yè)創(chuàng)新發(fā)展行動計(jì)劃(2022-2025年)》,目標(biāo)是到2025年,北京市數(shù)字人產(chǎn)業(yè)規(guī)模突破500億元。
在國家層面,"十四五"期間。該規(guī)劃明確了數(shù)字中國建設(shè)的整體框架,即按照“兩大基礎(chǔ)”進(jìn)行布局,包括夯實(shí)數(shù)字基礎(chǔ)設(shè)施和數(shù)據(jù)資源體系,以及推進(jìn)數(shù)字技術(shù)與經(jīng)濟(jì)、、文化、社會、生態(tài)等領(lǐng)域的深度融合。同時,相關(guān)政策也主要集中在虛擬現(xiàn)實(shí)、人工智能、數(shù)字經(jīng)濟(jì)建設(shè)等相關(guān)領(lǐng)域。
總的來說,中國的數(shù)字人行業(yè)政策正在多方位布局和深化,旨在推動數(shù)字經(jīng)濟(jì)的發(fā)展,提升國家的信息化水平,以及促進(jìn)人工智能和虛擬現(xiàn)實(shí)等新技術(shù)的應(yīng)用和創(chuàng)新。 服務(wù)型虛擬數(shù)字人費(fèi)用虛擬數(shù)字人是通過計(jì)算機(jī)圖形學(xué)技術(shù)進(jìn)行虛擬制作的類人形象,沒有現(xiàn)實(shí)世界中的身體。
當(dāng)前,AI數(shù)字人正在以更具體的職業(yè)身份進(jìn)入各行各業(yè),并配備越來越清晰的工作職責(zé)和工作計(jì)劃。將來,在產(chǎn)品供應(yīng)商和開發(fā)人員共同構(gòu)建產(chǎn)業(yè)生態(tài)系統(tǒng)的過程中,AI數(shù)字人技術(shù)將更好地融入其他語音交互技術(shù)和軟件功能,為消費(fèi)者提供更好的體驗(yàn)。作為多模態(tài)人機(jī)交互領(lǐng)域的重要成果之一,"AI數(shù)字人"依靠前端語音處理,語音喚醒,語音識別,對話理解和管理,語音合成,計(jì)算機(jī)視覺和圖形學(xué)等技術(shù)支持。在對話理解的基礎(chǔ)上,語音交互通過對話管理生成對應(yīng)的答復(fù)話語和內(nèi)容服務(wù),并結(jié)合語音合成技術(shù)"TTS"來產(chǎn)生廣播音頻;AI數(shù)字人多模式互動需要在此基礎(chǔ)上進(jìn)一步了解播放文本中包含的信息。
AI數(shù)字人形式多變分類,五個模塊組成通用框架。AI數(shù)字人指存在于非物理世界中,由計(jì)算機(jī)手段創(chuàng)建和使用,并具有多種人類特征(例如外觀特性,人類表演能力,交互功能等)的綜合產(chǎn)物。AI數(shù)字人可以根據(jù)人格象征和圖形維度劃分,也可以按照角色圖形維度進(jìn)行分類。角色形象,語音生成模塊,動畫生成模塊,音視頻合成顯示模塊和交互模塊構(gòu)成AI數(shù)字人通用系統(tǒng)框架。AI數(shù)字人在提高傳統(tǒng)產(chǎn)業(yè)工作效率方面具有巨大優(yōu)勢,也呈現(xiàn)出巨大的市場空間。如果能夠?qū)崿F(xiàn)數(shù)字人的大規(guī)模應(yīng)用,那么對于許多行業(yè)和公司來說將面臨重大變化未來。虛擬數(shù)字人擁有人的行為,具有用語言、面部表情和肢體動作表達(dá)的能力。
AI數(shù)字人有何優(yōu)勢?AI數(shù)字人是基于人類的數(shù)字存在,它沒有晝夜之分,不受時間和地理位置限制,可以出現(xiàn)在任何需要它的場景中出現(xiàn),比如企業(yè)的品牌推介會、產(chǎn)品發(fā)布會、展廳、客服接待等等場合,提供24小時在線服務(wù)。雖是虛擬的,但AI數(shù)字人的存在性、社會性和影響力不輸于現(xiàn)實(shí)的人,其人設(shè)可塑性強(qiáng)、行為可控且自帶科技感加持,更容易運(yùn)維和掌控,不會擔(dān)心藝人塌方、解約等造成的負(fù)面影響及經(jīng)濟(jì)損失。隨著AI技術(shù)和沉浸式技術(shù)的加持,具有良好形象的AI數(shù)字人可以更加智能、人性化地與人互動、交流,感受人的情緒、語言和行動,在虛擬陪伴、心理療養(yǎng)等領(lǐng)域發(fā)揮價值。AI數(shù)字人的應(yīng)用落地給經(jīng)濟(jì)發(fā)展帶來重大發(fā)展機(jī)遇,企業(yè)也可以擁有專屬的虛擬數(shù)字IP,搶注元宇宙市場。虛擬數(shù)字人的影像通常是呈現(xiàn)出某種人類的活動。服務(wù)型虛擬數(shù)字人流程
虛擬數(shù)字人具有人類身體的外觀形體結(jié)構(gòu),表現(xiàn)出來的行為模式是與人類相仿的。元宇宙虛擬數(shù)字人訂制
AI數(shù)字人的關(guān)鍵觀點(diǎn):1.AI數(shù)字人的三大特征是虛擬化、NLP\CV\語音等多種技術(shù)共同成熟、高度擬人化。在技術(shù)層面上分為靈活的真人驅(qū)動型和基于深度學(xué)習(xí)的計(jì)算驅(qū)動型。2、AI數(shù)字人的應(yīng)用可分為服務(wù)型AI數(shù)字人和身份型AI數(shù)字人。替代真人服務(wù)中的虛擬主播和虛擬IP中的虛擬偶像是目前的市場熱點(diǎn)。3、AI數(shù)字人產(chǎn)業(yè)鏈。各廠商規(guī)劃在未來對關(guān)鍵技術(shù)進(jìn)行外包。4、國內(nèi)外在細(xì)分市場上的競爭差異較大,具體包含技術(shù)層面、商業(yè)模式、細(xì)分市場及發(fā)展路線。5、行業(yè)門檻及瓶頸主要來源于三方面:上限偏高的技術(shù)及美術(shù)門檻;客戶積累帶來的業(yè)務(wù)認(rèn)知;在各細(xì)分市場亟待實(shí)現(xiàn)的標(biāo)準(zhǔn)化復(fù)制。元宇宙虛擬數(shù)字人訂制