7月30日,vivo首次對外披露與AIGC算法相關(guān)的研發(fā)成果:包括建立了重慶3D動捕實驗室,同時發(fā)布了多并發(fā)AI感知的自研影像芯片V3,并宣布將在下一代產(chǎn)品中,應用新一代的新研發(fā)AI技術(shù)。
界面新聞記者了解到,在其3D動捕實驗室中,vivo搭建了影視級光場系統(tǒng),該系統(tǒng)可以重建出“毛孔級”人體3D模型,支撐vivo各類人像3D感知算法的研發(fā)、迭代工作。重點儲備以人臉、人體和手勢為核心人像3D感知算法能力。
該實驗室位于vivo重慶智能制造中心。該中心也是vivo全球智能制造的關(guān)鍵一環(huán),于2014年布局、九游會J92017年完工并正式投產(chǎn)。
根據(jù)介紹,vivo在該實驗室內(nèi)先收集人體3D數(shù)據(jù)和人體反照率數(shù)據(jù),在AI進行算法學習,在此之后,這些算法將應用在目前硬件難以解決的一些收集影像問題上:其中包括發(fā)絲級摳圖優(yōu)化人像拍攝的背景虛化效果;開發(fā)基于背景風格的人像自適應打光算法;基于臉部深度、紋理信息的表情編輯、發(fā)型編輯、年齡編輯等功能;基于人體3D數(shù)據(jù)、深度信息開發(fā)的AI換裝、AR炫舞等等。
“3D影像和AIGC,這兩個是vivo未來探索的核心方向,目前有100多號人,都是偏博士的”,vivo影像副總裁于猛在接受采訪時說。
隨著AI的普及,手機公司陸續(xù)都在加速技術(shù)投入。除了vivo之外,榮耀在7月提出了端側(cè)AI大模型的概念,而在8月,據(jù)傳華為也將在鴻蒙4中搭載時下火熱的AI大模型技術(shù)。
手機應用中,影像已經(jīng)成為這項技術(shù)領域最佳試驗領域。在海外,Midjourney以及OpenAI都在繪畫、圖片等應用上取得了突破性進展。而在國內(nèi),最近一款名為“妙鴨相機”的AI拍照小程序,憑借簡單的使用方法、低廉的價格(9.9元)和高品質(zhì)的生成效果,迅速吸引了海量用戶。
vivo影像產(chǎn)品高級總監(jiān)李卓認為,手機影像技術(shù)目前是三個領域同時走路:光學、算力、算法。但相比而言,光學因為是模擬的,到了一定瓶頸之后突破起來難度非常大,可能需要材料學和基礎物理的突破才行,但一旦突破則會帶來全新的世界。九游會J9因此,算力和算法在當前這個階段,進步和突破是非常明顯。
根據(jù)現(xiàn)場演示,依賴AI技術(shù),手機里實現(xiàn)對人臉面部表情、人體姿態(tài)動作以及手勢交互感知的精準捕捉和驅(qū)動;還能用手機拍出虛擬與實景結(jié)合更為自然和諧的照片,甚至可以做到以假亂真;紋理重建與光照估計算法等技術(shù),讓用戶基于自身喜好對光照、年齡、發(fā)型、表情等內(nèi)容進行重新編輯等等。
“未來以算法為龍頭,也并不是它自己往前跑,未來算法要去給傳統(tǒng)的光學賦能,這是它里面的邏輯關(guān)系”,于猛說。