關(guān)于中國(guó)科技的發(fā)展,我最近聽(tīng)到一個(gè)觀點(diǎn),那就是在這兩年,中國(guó)科技的發(fā)展在從以前的追趕式開(kāi)始進(jìn)步到原創(chuàng)并跑階段。
以前是西方有的,我們也要有,西方封鎖我,那么我們一定要把西方封鎖的技術(shù)搞出來(lái),帶有一種頭懸梁錐刺股,破釜沉舟式的“悲壯”意味,比如我們?cè)谥袊?guó)工業(yè)發(fā)展的不少領(lǐng)域,都聽(tīng)到過(guò)“爭(zhēng)氣機(jī)”的說(shuō)法,
一般都是我們沒(méi)有這項(xiàng)技術(shù),然后我們?nèi)ベI(mǎi)人家不賣(mài),或者故意出高價(jià),還諷刺我們永遠(yuǎn)做不出來(lái),最終我們奮發(fā)圖強(qiáng),一舉做出了這項(xiàng)技術(shù)。
在以前我們想的也是更多是先填補(bǔ)技術(shù)國(guó)內(nèi)空白,先把這個(gè)東西做出來(lái),但現(xiàn)在情況不一樣了,中國(guó)科技已經(jīng)開(kāi)始有原創(chuàng)領(lǐng)先科技爆發(fā)的態(tài)勢(shì)。
正如DeepSeek創(chuàng)始人梁文鋒說(shuō)“中國(guó)AI不可能永遠(yuǎn)處在跟隨的位置。我們經(jīng)常說(shuō)中國(guó)AI和美國(guó)有一兩年差距,但真實(shí)的gap是原創(chuàng)和模仿之差。如果這個(gè)不改變,中國(guó)永遠(yuǎn)只能是追隨者,所以有些探索也是逃不掉的?!?
過(guò)去的幾個(gè)月,從DeepSeek到宇樹(shù)科技國(guó)產(chǎn)機(jī)器狗等國(guó)產(chǎn)新技術(shù)不斷的涌現(xiàn),而且都是世界級(jí)的創(chuàng)新成果。
前幾天我看美國(guó)財(cái)政部長(zhǎng)當(dāng)?shù)貢r(shí)間4月2日接受采訪的視頻,他說(shuō)美國(guó)科技七巨頭(英偉達(dá),亞馬遜,谷歌,特斯拉,蘋(píng)果,微軟,Meta)的股價(jià)大跌是因?yàn)閐eepseek的發(fā)布,而不是美國(guó)政府的貿(mào)易保護(hù)主義。
其實(shí)對(duì)應(yīng)美國(guó)的科技七巨頭的話,我們也可以列出國(guó)內(nèi)的科技七巨頭,我腦子里最先冒出來(lái)的是華為,大疆,DeepSeek三個(gè),
另外就是不管怎么列舉,國(guó)產(chǎn)科技七巨頭也肯定都在AI方面有不少研究和投入。
到2025年的今天, AI已經(jīng)是確定性的趨勢(shì),日常生活中已經(jīng)有大量想不到的AI應(yīng)用。
我看到一個(gè)有意思的事就是燒烤店數(shù)簽子算錢(qián),不需要服務(wù)員一根根的去數(shù)了還容易數(shù)錯(cuò),直接拿手機(jī)拍照就能自動(dòng)識(shí)別有多少根簽子。
在過(guò)去的一年,你有沒(méi)有在不知不覺(jué)中發(fā)現(xiàn)在短視頻平臺(tái),在AI大模型APP里面,讓圖片里人物動(dòng)起來(lái)跳個(gè)舞之類(lèi)的特效已經(jīng)越來(lái)越多了?這其實(shí)也是AI技術(shù)在你不知不覺(jué)中進(jìn)步,在之前就沒(méi)有這個(gè)功能。
現(xiàn)在各種大模型APP里面有很多可以對(duì)話的智能體,還可以克隆你的聲音,很有意思。
再比如汽車(chē)的自動(dòng)駕駛,華為發(fā)布的尊界都已經(jīng)是按照L3來(lái)設(shè)計(jì)了,安全性又上了一個(gè)臺(tái)階,就看國(guó)家法律法規(guī)什么時(shí)候跟進(jìn)L3了。
其實(shí)盡管不要過(guò)分依賴智駕一直是個(gè)社交媒體上面的熱門(mén)話題,但是常識(shí)告訴我們,過(guò)去的幾年智駕其實(shí)拯救了不少生命,尤其是在智駕車(chē)型普及很高的中國(guó),這個(gè)數(shù)量我相信是全球最高的。
舉個(gè)例子,下圖是《終結(jié)者4》電影里面攜帶武器,可實(shí)現(xiàn)無(wú)人駕駛和自主攻擊摩托車(chē),這個(gè)電影是2009年上映的,當(dāng)時(shí)覺(jué)得這一幕很科幻,
但是我們現(xiàn)在再看的話,已經(jīng)從思想上并不覺(jué)得這是科幻片了,而是覺(jué)得這已經(jīng)是在當(dāng)前的技術(shù)上可以實(shí)現(xiàn)的東西。
因此我們更進(jìn)一步,正因?yàn)锳I關(guān)系到我們生活的方方面面,所以AI技術(shù)的進(jìn)步與否就直接關(guān)系到一個(gè)公司乃至一個(gè)國(guó)家財(cái)富的多少,上面美國(guó)財(cái)政部長(zhǎng)說(shuō)DeepSeek直接影響了美國(guó)科技七巨頭的股價(jià)就是例子,那可是實(shí)打?qū)嵉腻X(qián)啊。
由于AI技術(shù)如此重要,因此我們自然也會(huì)關(guān)心國(guó)產(chǎn)AI技術(shù)的進(jìn)步,那就是一個(gè)AI應(yīng)用(大模型),一個(gè)AI軟硬件基礎(chǔ)設(shè)施。
2024年年底和2025年初deepseek陸續(xù)發(fā)布了V3和R1,火爆了全球,代表的是成本的下降,可以說(shuō)在deepseek之前,人類(lèi)的算力需求增長(zhǎng)和成本是可怕的規(guī)模,以致于市場(chǎng)給了類(lèi)似英偉達(dá)極高的預(yù)期,英偉達(dá)的市值在2025年1月7日這天創(chuàng)下了3.75萬(wàn)億美元的歷史巔峰。
舉個(gè)例子,在其他因素不變的情況下,參數(shù)量多少和算力需求是成正比的,Deepseek 發(fā)布的V3和R1滿血版都是671B的參數(shù),也就是6710億個(gè)參數(shù),而上一代版本,2024年5月發(fā)布的V2的參數(shù)量就只有2360億,總體還是增長(zhǎng)的,而Deepseek更為復(fù)雜的下一代參數(shù)量還會(huì)更大,
再比如deepseek 開(kāi)源大模型展現(xiàn)出來(lái)的良好性能,將會(huì)刺激千行百業(yè)進(jìn)行部署基于deepseek的推理應(yīng)用,刺激對(duì)算力的需求。
所以Deepseek的出現(xiàn)使得AI算力需求增長(zhǎng)進(jìn)入更為良性的軌道,更低的成本將大大推動(dòng)AI的普及,總算力需求仍然是增長(zhǎng)的。
當(dāng)年九十年代的大哥大一部就得上萬(wàn)元人民幣,后來(lái)隨著成本降低,單臺(tái)價(jià)格下降了90%以上,普通人也逐漸買(mǎi)得起了,市場(chǎng)的總規(guī)模并沒(méi)有縮減,是不斷增長(zhǎng)的。
再說(shuō)AI基礎(chǔ)設(shè)施部分,這部分我不得不說(shuō),華為扛起了中國(guó)AI基礎(chǔ)設(shè)施技術(shù)發(fā)展的重任。
強(qiáng)大的AI社會(huì)需要強(qiáng)大的AI基礎(chǔ)設(shè)施,在美國(guó)這個(gè)基礎(chǔ)設(shè)施供應(yīng)商是英偉達(dá)和亞馬遜云,英偉達(dá)提供底層硬件,亞馬遜以云的形式提供算力服務(wù)。
在中國(guó)的話,最大的能對(duì)標(biāo)英偉達(dá)的廠家就是華為了,同時(shí)華為云也是中國(guó)最大的云服務(wù)供應(yīng)商之一,為政府和千行百業(yè)提供算力服務(wù)。
但芯片工藝制程的限制,還是影響了中國(guó)AI硬件的單卡算力進(jìn)步,所以論單卡算力,華為的昇騰目前比不上英偉達(dá)。
也正是因?yàn)槿绱?,所以美?guó)從2022年底開(kāi)始逐漸禁售了英偉達(dá)的H100/H800/A100/A800等高端算力芯片。
一方面是在半導(dǎo)體設(shè)備研發(fā)制造方面有所動(dòng)作,今年3月底在上海召開(kāi)的 SEMICON China 2025半導(dǎo)體展會(huì)上公開(kāi)亮相的某半導(dǎo)體生產(chǎn)設(shè)備公司,其各種以“山”命名的設(shè)備,加上含有“凱旋歸來(lái)”意味的名字,讓廣大網(wǎng)友一下子就猜出了其血統(tǒng)。
華為云在4月10日發(fā)布了CloudMatrix 384超節(jié)點(diǎn)技術(shù),成功實(shí)現(xiàn)超節(jié)點(diǎn)技術(shù)商用,在當(dāng)下先進(jìn)工藝制程尚未突破的情況下,這也是華為持續(xù)追趕英偉達(dá)的關(guān)鍵。
因?yàn)殡S著企業(yè)對(duì)AI應(yīng)用需求的規(guī)模越來(lái)越大,那么需要的算力就會(huì)增加,企業(yè)會(huì)走向千卡甚至萬(wàn)卡數(shù)據(jù)中心算力集群,
而這個(gè)集群內(nèi)各個(gè)節(jié)點(diǎn)的通信就成為發(fā)揮性能的瓶頸,這就好比一支龐大的軍隊(duì),如果各個(gè)單位之間不能及時(shí)有效的通信,那么戰(zhàn)斗力就會(huì)大打折扣。
想象一下,如果算力集群中一張算力卡已經(jīng)完成了計(jì)算任務(wù),但是數(shù)據(jù)卻不能快速地流動(dòng)到其他算力卡進(jìn)行計(jì)算,導(dǎo)致大量算力卡在閑置和等待,這就讓集群性能不能充分發(fā)揮。
當(dāng)前業(yè)界一臺(tái)算力服務(wù)器通常是8張算力卡,這一臺(tái)服務(wù)器就稱(chēng)為一個(gè)節(jié)點(diǎn),在一臺(tái)服務(wù)器以內(nèi)的8張卡之間的通信速度是非??斓?,
而相比之下服務(wù)器與服務(wù)器之間的通信速度則慢的多,其速度相差甚至能夠達(dá)到10倍以上,也就是說(shuō)一張算力卡和同一個(gè)服務(wù)器里的另一張算力卡,以及和另一個(gè)服務(wù)器的算力卡通信速度是天壤之別。
和同一個(gè)服務(wù)器節(jié)點(diǎn)里面的內(nèi)存通信,速度要比和跨服務(wù)器的內(nèi)存通信要快的多。
所以如果能用高速通信技術(shù)把更多張算力卡,內(nèi)存融合在一起,成為一個(gè)超節(jié)點(diǎn),超節(jié)點(diǎn)內(nèi)的算力卡,內(nèi)存都可以實(shí)現(xiàn)高速互聯(lián)和通信,這就能大大的提高算力集群的性能。
英偉達(dá)已經(jīng)率先在2024年3月發(fā)布了NVL72超節(jié)點(diǎn),可以把72張訓(xùn)練卡組成一個(gè)超節(jié)點(diǎn)。
而華為云在4月10日發(fā)布的CloudMatrix 384超節(jié)點(diǎn)技術(shù)則更進(jìn)一步,可以實(shí)現(xiàn)384張昇騰算力卡成為一個(gè)超節(jié)點(diǎn),這不僅是中國(guó)最大的商用超節(jié)點(diǎn),而且超節(jié)點(diǎn)規(guī)模比英偉達(dá)的NVL72更大,算力更強(qiáng),性能比NVL72更優(yōu)。
或者換句話說(shuō),它是目前已商用的超節(jié)點(diǎn)中,單體規(guī)模全球最大,有效算力全球最高。
超節(jié)點(diǎn)充分發(fā)揮了華為在通信領(lǐng)域的技術(shù)積累和優(yōu)勢(shì),使其能在國(guó)內(nèi)率先突破和領(lǐng)先,畢竟華為是全球領(lǐng)先的通信廠家。
其一隨著算力的增長(zhǎng),國(guó)內(nèi)需求千卡集群,萬(wàn)卡集群的數(shù)量越來(lái)越多,而大規(guī)模集群必然會(huì)涉及到高速通信互聯(lián),以及網(wǎng)絡(luò)負(fù)載算法等通信相關(guān)的技術(shù),在這些技術(shù)方面中國(guó)目前是沒(méi)有限制的,尤其對(duì)華為而言這還是強(qiáng)項(xiàng),超節(jié)點(diǎn)會(huì)符合國(guó)內(nèi)算力需求增長(zhǎng)的需要。
其二單卡算力主要和芯片工藝制程相關(guān),因此在生產(chǎn)設(shè)備突破后會(huì)迎來(lái)一個(gè)躍升,但這個(gè)突破的時(shí)間會(huì)在未來(lái)幾年,到時(shí)候單卡算力的提升會(huì)比現(xiàn)在更快。
對(duì)于國(guó)內(nèi)千行百業(yè)的企業(yè)而言,除了少數(shù)具備極強(qiáng)IT技術(shù)和運(yùn)維能力的頭部客戶,大部分企業(yè)都會(huì)選擇類(lèi)似華為昇騰云服務(wù)這樣的云廠家,而非選擇自建數(shù)據(jù)中心。
1:超節(jié)點(diǎn)在提升性能的同時(shí),也有更大的算力規(guī)模,自建的話一次性投入成本高,而在使用云服務(wù)時(shí),你既可以選擇租用一個(gè)超節(jié)點(diǎn),也可以選擇只租用超節(jié)點(diǎn)的一部分,相比自己購(gòu)買(mǎi)更為靈活。
2:超節(jié)點(diǎn)更為復(fù)雜的技術(shù)架構(gòu)也意味著對(duì)運(yùn)維團(tuán)隊(duì)的技術(shù)能力要求更高,需要解決的各種故障和運(yùn)維問(wèn)題更復(fù)雜,
對(duì)于一般企業(yè)而言,顯然沒(méi)有必要維持一個(gè)高成本的運(yùn)維專(zhuān)家團(tuán)隊(duì),還是直接把底層軟硬件的運(yùn)維和穩(wěn)定性直接交給云服務(wù)廠家比較簡(jiǎn)單。
例如華為的昇騰云服務(wù)可以實(shí)現(xiàn)萬(wàn)億參數(shù)模型長(zhǎng)達(dá)40天的長(zhǎng)穩(wěn)訓(xùn)練,遠(yuǎn)優(yōu)于業(yè)界平均無(wú)中斷2.8天的水平,故障實(shí)現(xiàn)從業(yè)界平均的60分鐘恢復(fù)縮短到10分鐘內(nèi)恢復(fù),不需要從頭重新訓(xùn)練。
例如華為云在全國(guó)就有3+N+X云數(shù)據(jù)中心,其中這個(gè)三是指內(nèi)蒙烏蘭察布,貴州貴安,安徽蕪湖三個(gè)最大的數(shù)據(jù)中心,部署了幾萬(wàn)張昇騰卡的算力, 需要超節(jié)點(diǎn)服務(wù)時(shí)可以分鐘級(jí)開(kāi)通昇騰云服務(wù),
而華為云其余N+X數(shù)據(jù)中心也是遍布全國(guó),在服務(wù)時(shí)延和數(shù)據(jù)傳輸成本上都可以就近,從而得到低成本的良好體驗(yàn)。
這是我的一個(gè)判斷,因?yàn)閺?018年以來(lái)的七年,在美國(guó)在半導(dǎo)體領(lǐng)域的強(qiáng)力狙擊下,中國(guó)半導(dǎo)體產(chǎn)業(yè)不得不開(kāi)始補(bǔ)短板,強(qiáng)基礎(chǔ)的艱難過(guò)程,因此國(guó)產(chǎn)硬件性能的進(jìn)步也放緩了。
而在七年后的今天,基礎(chǔ)實(shí)力已經(jīng)大大增強(qiáng),國(guó)產(chǎn)半導(dǎo)體生產(chǎn)設(shè)備,材料技術(shù)已經(jīng)不可同日而語(yǔ),可以說(shuō)有一種已經(jīng)九游會(huì)真人游戲股份有限公司在突破前夜的感覺(jué)。
以華為云為代表的國(guó)產(chǎn)超節(jié)點(diǎn)技術(shù)今年的率先商用,其他國(guó)內(nèi)廠家預(yù)計(jì)也遲早會(huì)跟進(jìn),因此可以預(yù)期的是國(guó)產(chǎn)AI硬件的技術(shù)進(jìn)步將會(huì)加速。
你需要多少算力云服務(wù)廠家就給你多少,你不需要去關(guān)心底層的硬件資源,這也省去了若自建可能會(huì)導(dǎo)致硬件資源因?yàn)檫^(guò)時(shí)而閑置的煩惱。
在國(guó)內(nèi)人工智能需求猛增的情況下確保了AI軟硬件基礎(chǔ)設(shè)施的交付,使得國(guó)內(nèi)的算力需求方可以快速的獲得華為云提供的算力服務(wù),避免了國(guó)內(nèi)的算力短缺,我們今天在國(guó)內(nèi)能夠大量的享受和使用各種AI應(yīng)用帶來(lái)的好處,華為是做了很大貢獻(xiàn)的;
另一個(gè)重要成果就是在實(shí)現(xiàn)了國(guó)內(nèi)AI基礎(chǔ)設(shè)施技術(shù)的持續(xù)進(jìn)步,今年華為云超節(jié)點(diǎn)技術(shù)的商用就讓國(guó)內(nèi)的算力基礎(chǔ)設(shè)施服務(wù)進(jìn)入了更高性能的時(shí)代。
而展望未來(lái),我可以比較確定的說(shuō),超節(jié)點(diǎn)之后的下一次國(guó)產(chǎn)AI基礎(chǔ)設(shè)施技術(shù)的進(jìn)步,也會(huì)是來(lái)自華為。