雖然元宇宙概念因大模型的火熱而短暫熄火,但元宇宙內的“門面人物”虛擬數(shù)字人作為人工智能技術產物,得益于算力提升,迎來低成本、規(guī)模化落地的可能。
4月25日,騰訊云智能“數(shù)智人媒體溝通會”上,騰訊云智能小樣本數(shù)智人生產平臺首次對外發(fā)布,平臺具有訓練樣本小、生產效率高、自動化生產等特性,可以輕松實現(xiàn)“自助式”數(shù)智人生產制作。
(資料圖)
采訪中,騰訊優(yōu)圖實驗室研究總監(jiān)汪鋮杰對第一財經記者表示,以前行業(yè)做的數(shù)智人效果未必好,有的一看就知道特別假;現(xiàn)在的數(shù)智人看一眼,還要猜測它們到底是真還是假。
技術發(fā)展帶動數(shù)智人產業(yè)落地
伴隨人工智能技術的發(fā)展,國內偶像綜藝、品牌代言人、熱門網紅等行業(yè)相繼出現(xiàn)由數(shù)字人扮演的角色,同時數(shù)量不斷增加。各家大廠也陸續(xù)發(fā)布了自己的數(shù)字人、虛擬人、數(shù)智人產品。
不論名字如何形容,其本質都是通過計算機圖形學技術(Computer Graphic,CG)創(chuàng)造出與人類形象接近的數(shù)字化形象,并賦予其特定的人物身份設定,在視覺上拉近和人的心理距離,為人類帶來更加真實的情感互動。據相關機構預測,到2030年,我國數(shù)字人整體市場規(guī)模將達到2700億元。
騰訊則直接推出數(shù)智人的生產平臺。騰訊方面介紹稱,騰訊云智能小樣本數(shù)智人生產平臺依托騰訊自研AI能力和技術經驗,需要3分鐘真人口播視頻、100句語音素材,平臺便可通過音頻、文本多模態(tài)數(shù)據輸入,實時建模并生成高清人像,在24小時內制作出與真人近似的“數(shù)智人”。
另外,成本方面,該生產平臺已將成本降低到千元級別,制作周期縮短至小時級,大幅降低數(shù)字人使用門檻。但是,3D超寫實、高精定制等高技術要求的數(shù)智人仍要求高成本,以及具體針對客戶需求進行定制。
騰訊云智能數(shù)智人產品總經理陳磊表示,小樣本數(shù)智人支持半身、全身形象展示,手勢動作會根據內容靈活調整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場景。
相較于2D真人精品數(shù)字人,陳磊認為小樣本數(shù)智人無需專業(yè)影棚錄制素材,成本更低;相較于照片生成、僅能呈現(xiàn)面部形態(tài)的數(shù)字人,小樣本數(shù)智人可根據文本設計手勢,唇動、口型、表情復現(xiàn)真人風格。
東方證券研報分析認為,虛擬數(shù)字人的驅動可分為由真人扮演(業(yè)內稱為“中之人”)驅動和 AI 驅動。過去 AI 驅動數(shù)字人的痛點在于成本較高、交互效果不佳,因此由真人扮演驅動更為常見,此類路線背后的商業(yè)模式內核是偶像娛樂工業(yè)、虛擬主播帶貨等,如字節(jié)跳動旗下游戲品牌朝夕光年和樂華娛樂共同打造的虛擬偶像女團A-SOUL。
另外,隨著近期AI 領域的技術突破、文本、圖像等領域的大模型應用的快速落地,AI 驅動的數(shù)字人的制作門檻和成本有望降低,例如外貌合成、動作合成等環(huán)節(jié)均可借助 AI 技術;數(shù)字人的對話能力有望得到質的提升,擁有更加接近真人的對話能力。可以推測,AI 與數(shù)字人的結合,將使數(shù)字人的應用場景及范圍明顯擴大,例如通過語音合成、表情合成以及深度學習等技術,打造的虛擬客服、服務助手等已在實際生活、工作場景中進入大規(guī)模應用。
行業(yè)尚未形成穩(wěn)定競爭格局
4月下旬,浙江省人民政府印發(fā)《關于進一步擴大消費促進高質量發(fā)展若干舉措的通知》,其中提出:搶抓電子商務直播快速發(fā)展機遇,發(fā)展數(shù)字人虛擬主播、元宇宙新消費場景等新業(yè)態(tài)新模式。發(fā)展“跨境電子商務+直播”模式,打造跨境保稅倉直播總部基地,舉辦保稅倉實景直播帶貨等活動。
東方證券研報分析稱,短視頻、直播電商是數(shù)字人應用的核心場景之一。數(shù)字人目前的主要應用場景包括營銷代言、電商帶貨、客服等。其中,數(shù)字人進行電商直播帶貨的優(yōu)勢在于降低人工成本、不間斷直播、可控性強。
人工成本是直播/短視頻電商中的重要成本構成(且人力成本的增加是未來趨勢),虛擬人可代替真人在電商直播或者視頻拍攝中出鏡從而降低人工成本的支出。另外,時長是直播電商產能的重要衡量指標,數(shù)字人可以和真人主播配合,例如真人主播在黃金時段直播,而虛擬人主播則在流量低谷時替代真人主播,實現(xiàn) 7×24 小時全天直播,可實現(xiàn)最大限度的客戶觸達。以及數(shù)字人形象和人設相對穩(wěn)定,出錯概率低,相對可控。
陳磊在采訪中透露,目前已有好幾個合作伙伴接入騰訊數(shù)智人,也上線了各大平臺。另外,電商直播只是落地場景中一個小場景,作為個人數(shù)智分身,各行各業(yè)都有,只要是時間寶貴的行業(yè)都有這個需求。
天眼查數(shù)據顯示,我國現(xiàn)有“虛擬人”“數(shù)字人”的相關企業(yè)66.2萬余家。其中,超九成的虛擬人企業(yè)成立于5年之內,成立于1年內的相關企業(yè)占比41.9%。尤其是目前低技術門檻的數(shù)智人批量生產,極易造成同質化競爭局面。對此,汪鋮杰對第一財經記者表示,在一些舊的生產模式往新的生產模式走的過程,大家都會找到自己的定位。
另外,陳磊對第一財經表示,騰訊的數(shù)智人產品從2018年開始找各個行業(yè)與場景尋找落地價值,解決客戶實際問題痛點,所做的事情更多是產生實際價值這個點。通過小樣本,從整體的發(fā)展階段來看,讓成本有足夠的降低,讓小樣本數(shù)智人將企業(yè)歷史沉淀算力,包括管線化能力在內的訓練一站式,變成自助式工具化手段,賦能給行業(yè)的合作伙伴,幫助他們拓展場景,成就垂直場景的價值。
另外,客戶企業(yè)選擇也有自身的要求與標準。頭豹研究院分析稱,企業(yè)在選擇虛擬數(shù)字人廠商時主要會考量幾個因素:廠商的技術實力、報價預算、虛擬數(shù)字人后期運維服務,以及廠商和企業(yè)之間既定的互信合作關系,例如在銀行業(yè),人工智能服務涉及商業(yè)數(shù)據或客戶隱私,企業(yè)傾向于交由熟悉的外包公司,而不是頭部技術廠商來完成。
除此之外,頭豹研究院分析表示,業(yè)內頭部廠商在人像驅動、智能對話和語音交互等技術領域并無較大差距,差異化主要集中在兩大方面:首先是知識圖譜方面,虛擬偶像、虛擬帶貨主播、虛擬銀行客服、虛擬財務員工和虛擬醫(yī)生等不同場景下應用的知識圖譜各不相同,同一場景下不同業(yè)務涉及的知識庫也存在差異,以金融業(yè)為例,要求虛擬數(shù)字人廠商沉淀豐富的業(yè)務場景能力,針對金融企業(yè)的營銷、風控、客服等場景均具備成熟的產品方案能力;其次是廠商和企業(yè)之間先行的互信合作關系,如客戶向信賴的廠商提出需求,確定虛擬數(shù)字人的形象、功能、任務框架和知識圖譜,由廠商進行后續(xù)的開發(fā)。
因此整體來看,國內虛擬人行業(yè)尚未形成穩(wěn)定的競爭格局,市面也尚未出現(xiàn)成熟高端的應用產品,行業(yè)仍需持續(xù)投入底層技術研發(fā),并在垂直行業(yè)爭奪市場份額。
關于我們| 聯(lián)系方式| 版權聲明| 供稿服務| 友情鏈接
咕嚕網 m.jzyjjz.com 版權所有,未經書面授權禁止使用
Copyright©2008-2020 By All Rights Reserved 皖ICP備2022009963號-10
聯(lián)系我們: 39 60 29 14 2@qq.com