国产激情综合五月久久_国产丝袜无码一区二区视频_双乳奶水饱满少妇小说_韩国三级《诱人的乳》_《熟妇荡欲》欧美电影_有码+日韩+在线观看_地铁羞耻挤入h_久久久WWW免费人成精品_国产香蕉97碰碰久久人人

首頁(yè) > 資訊 > 數(shù)字化

DeepSeek狂潮下,九張圖表詳解智算市場(chǎng)走向

2025/02/19 14:37      數(shù)智前線(xiàn)


  DeepSeek熱潮將在預(yù)訓(xùn)練、后訓(xùn)練(二次訓(xùn)練)和推理三大細(xì)分市場(chǎng)都帶來(lái)巨大改變。

  文|周享玥

  編|趙艷秋

  DeepSeek狂潮下,2025年的智算市場(chǎng)正在發(fā)生巨變。

  業(yè)界觀察,不同于DeepSeek剛出來(lái)時(shí),一些人士對(duì)于“其算法優(yōu)化可能導(dǎo)致智算市場(chǎng)需求下降”的猜測(cè),在經(jīng)歷了連續(xù)幾周的發(fā)酵后,市場(chǎng)上的算力需求正呈現(xiàn)短期內(nèi)的快速爆發(fā)趨勢(shì)。

  “最近兩個(gè)禮拜,來(lái)找我們咨詢(xún)購(gòu)買(mǎi)能夠完整運(yùn)行671B DeepSeek R1模型的AI服務(wù)器的客戶(hù)數(shù)正在直線(xiàn)上升。”2月13日,在IDC與浪潮信息聯(lián)合發(fā)布《2025年中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》(簡(jiǎn)稱(chēng)《報(bào)告》)的現(xiàn)場(chǎng),浪潮信息高級(jí)副總裁劉軍告訴數(shù)智前線(xiàn)。

  在這次《報(bào)告》中,市場(chǎng)分析機(jī)構(gòu)IDC和智算Infra大廠浪潮信息一起,對(duì)DeepSeek給智算市場(chǎng)帶來(lái)的變化、當(dāng)下最新的智算市場(chǎng)格局進(jìn)行了深入解讀,并分享了今年智算市場(chǎng)發(fā)展的一些重要趨勢(shì)。

  01

  DeepSeek狂潮下,2025年智算市場(chǎng)如何變?

  DeepSeek是條鯰魚(yú),正在將市場(chǎng)重新調(diào)動(dòng)起來(lái)。

  C端用戶(hù)熱情高漲,即便是老人、小孩兒,知道DeepSeek的也不在少數(shù),B端和G端的應(yīng)用探索大幅提速,每天都有新一波企業(yè)和機(jī)構(gòu)官宣接入DeepSeek。

  算力需求在短期內(nèi)激增。春節(jié)后第一周,國(guó)內(nèi)外芯片廠商都在緊鑼密鼓加緊適配工作,據(jù)行業(yè)人士預(yù)測(cè),推理端的適配將會(huì)優(yōu)先完成,訓(xùn)練端的工作則將持續(xù)一段時(shí)間。服務(wù)器廠商們也在最近接到不少咨詢(xún)和采購(gòu)訂單。

  而從中長(zhǎng)期來(lái)看,多位行業(yè)人士均告訴數(shù)智前線(xiàn),這波DeepSeek熱潮將有望在預(yù)訓(xùn)練、后訓(xùn)練(二次訓(xùn)練)和推理三大細(xì)分市場(chǎng)都帶來(lái)巨大改變,帶動(dòng)智算市場(chǎng)的進(jìn)一步發(fā)展。

  在預(yù)訓(xùn)練端,去年市場(chǎng)上一度彌漫著一股悲觀情緒,Scaling Law(規(guī)模法則)被懷疑即將失效,一些大模型企業(yè)也逐漸放棄預(yù)訓(xùn)練。但隨著DeepSeek的故事范本生效,這種趨勢(shì)即將扭轉(zhuǎn),一些玩家可能有信心重返戰(zhàn)場(chǎng)。

  “如果DeepSeek通過(guò)算法優(yōu)化,用一萬(wàn)張卡搞出了別人十萬(wàn)張卡的模型,就會(huì)有人想,我用十萬(wàn)張卡,用DeepSeek的這種工程模式和技術(shù)架構(gòu)會(huì)訓(xùn)練出什么。”IDC中國(guó)副總裁周震剛說(shuō),這對(duì)全球所有大模型玩家,都是一種激勵(lì)。

  2月13日,OpenAI首席執(zhí)行官薩姆·奧爾特曼在社交平臺(tái)X上公布,OpenAI將在未來(lái)幾個(gè)月內(nèi)推出名為GPT-5的模型,該模型將整合OpenAI的大量技術(shù)。幾天后的2月18日,馬斯克正式發(fā)布了Grok 3大模型。

  而在后訓(xùn)練端,DeepSeek帶來(lái)的效率提升,正在讓這個(gè)市場(chǎng)被加強(qiáng)�!秷�(bào)告》顯示,目前Scaling Law正在從預(yù)訓(xùn)練擴(kuò)展到后訓(xùn)練和推理階段,基于強(qiáng)化學(xué)習(xí)、思維鏈等算法創(chuàng)新在后訓(xùn)練和推理階段更多的算力投入,可以進(jìn)一步大幅提升大模型的深度思考能力。

  “Hugging Face上,最近每天都有基于DeepSeek去做微調(diào)、蒸餾出來(lái)的各種新版本出來(lái)。”周震剛舉例說(shuō),這將對(duì)整個(gè)智算市場(chǎng)產(chǎn)生巨大推動(dòng)。

  推理端,則被業(yè)界認(rèn)為是一個(gè)極具潛力的市場(chǎng)。“DeepSeek相當(dāng)于瓦特時(shí)刻。瓦特把蒸汽機(jī)改良之后,實(shí)現(xiàn)了一個(gè)穩(wěn)定的動(dòng)力輸出,蒸汽機(jī)得以進(jìn)入各個(gè)行業(yè)。”一位行業(yè)人士說(shuō),“大模型就是蒸汽機(jī),被改良后,可以進(jìn)入各行各業(yè)。”

  “DeepSeek點(diǎn)燃了企業(yè)客戶(hù)對(duì)于大模型在企業(yè)內(nèi)部做業(yè)務(wù)部署和業(yè)務(wù)結(jié)合的熱情,客戶(hù)大量嘗鮮,經(jīng)歷自我試用PoC階段后,就會(huì)思考如何在業(yè)務(wù)場(chǎng)景中實(shí)現(xiàn)更加批量的部署和應(yīng)用。”劉軍告訴數(shù)智前線(xiàn),他們預(yù)計(jì),后面一輪的推理算力采購(gòu)需求,會(huì)比這一輪的采購(gòu)量來(lái)得更大,持續(xù)時(shí)間更久。

  《報(bào)告》中也對(duì)此做了總結(jié)——基于杰文斯悖論的現(xiàn)象表明,DeepSeek帶來(lái)的算法效率的提升并未抑制算力需求,反而因更多的用戶(hù)和場(chǎng)景的加入,推動(dòng)大模型普及與應(yīng)用落地,重構(gòu)產(chǎn)業(yè)創(chuàng)新范式,帶動(dòng)數(shù)據(jù)中心、邊緣及端側(cè)算力建設(shè)。

  數(shù)據(jù)顯示,2024年中國(guó)人工智能算力市場(chǎng)規(guī)模達(dá)190億美元,2025年將達(dá)到259億美元,同比增長(zhǎng)36.2%,2028年還將進(jìn)一步增加至552億美元。

  智算服務(wù)市場(chǎng)也將高速增長(zhǎng)。2024年,中國(guó)智算服務(wù)市場(chǎng)整體規(guī)模已達(dá)50億美元,到2028年將增至266.91美元,2023-2028年五年年復(fù)合增長(zhǎng)率為57.3%

  其中,智算集成服務(wù)市場(chǎng)(即私有化部署市場(chǎng))及GenAI IaaS市場(chǎng)是未來(lái)重要的兩個(gè)增量市場(chǎng),五年年復(fù)合增長(zhǎng)率分別達(dá)到73%和79.8%,預(yù)計(jì)至2028年智算集成服務(wù)市場(chǎng)規(guī)模占比可達(dá)47%,GenAI IaaS市場(chǎng)規(guī)模占比達(dá)48%。

  02

  從追求量,到追求一個(gè)更高效的系統(tǒng)

  《報(bào)告》中另外一個(gè)值得業(yè)界關(guān)注的關(guān)鍵點(diǎn)是,要想解決大模型落地過(guò)程中高性能算力供不應(yīng)求及算力利用率低等問(wèn)題,不止要“擴(kuò)容”,還得“提效”。

  擴(kuò)容很好理解,即提升算力供給能力。在這一點(diǎn)上,去年,業(yè)界已經(jīng)興起過(guò)一波智算熱潮,各地智算中心建設(shè)熱情高漲,涌現(xiàn)出了不少智算大單。據(jù)數(shù)智前線(xiàn)不完全統(tǒng)計(jì),2024年的公開(kāi)招投標(biāo)市場(chǎng),涌現(xiàn)出了超460個(gè)智算中心相關(guān)項(xiàng)目,其中,億元以上大單至少有62個(gè)。

  而從整體市場(chǎng)來(lái)看,《報(bào)告》預(yù)計(jì),2023至2028年,中國(guó)智能算力規(guī)模和通用算力規(guī)模的五年年復(fù)合增長(zhǎng)率將分別達(dá)46.2%和18.8%,較上一版本預(yù)期值33.9%和16.6%有顯著提升。

  而“提效”方面,除了降低算力成本,也是為了降低能耗,這對(duì)于大模型能否落地、能否跑通商業(yè)閉環(huán),至關(guān)重要。

  《報(bào)告》中提出了“提效”的四大關(guān)鍵舉措。

  第一,以用定建,以應(yīng)用為導(dǎo)向,進(jìn)行AI基礎(chǔ)設(shè)施建設(shè)規(guī)劃,避免資源浪費(fèi)。這不僅適用于企業(yè)私有化部署自己的人工智能基礎(chǔ)設(shè)施,也十分契合于當(dāng)下的智算中心建設(shè)。

  此前,不少智算中心都存在利用率不高的問(wèn)題,從去年開(kāi)始,一些智算中心在規(guī)劃初期,已經(jīng)主要考慮各地的產(chǎn)業(yè)結(jié)構(gòu),以應(yīng)用為導(dǎo)向來(lái)進(jìn)行資源規(guī)劃。比如不同的地方,可能有制造、動(dòng)漫、機(jī)器人、無(wú)人智駕、低空經(jīng)濟(jì)等不同產(chǎn)業(yè),它們對(duì)智算規(guī)模的需求不盡相同,不同芯片之間的配比也有可能不同。

  最近幾周,全國(guó)各地的多個(gè)智算中心都在官宣DeepSeek的部署上線(xiàn),如河南空港智算中心、無(wú)錫太湖億芯智算、南京智算中心等。DeepSeek帶動(dòng)的應(yīng)用潮,有可能給智算中心帶來(lái)新機(jī)會(huì)。

  “但這也需要做出不小努力,不是簡(jiǎn)單說(shuō)跑個(gè)DeepSeek的API上去就可以了。”劉軍告訴數(shù)智前線(xiàn),行業(yè)企業(yè)要將AI變成生產(chǎn)力,一定要和它自己的行業(yè)和業(yè)務(wù)數(shù)據(jù)去結(jié)合,而這個(gè)過(guò)程中,需要大量的工具和服務(wù)來(lái)進(jìn)行針對(duì)性的優(yōu)化,“比如人家用了一下發(fā)現(xiàn)吐一個(gè)字要兩秒鐘,就很難接受。”

  第二,提升模算效率,降低算力開(kāi)銷(xiāo)。在這一點(diǎn)上,DeepSeek做了一個(gè)很好的示范。其通過(guò)創(chuàng)新性融合FP8、MLA(多頭潛在注意力)和MoE(混合專(zhuān)家)架構(gòu),大幅提升了性能和效率。

  其中的一些思路,也是業(yè)界此前在大模型的發(fā)展中遇到困難后,所共同去探索的方向。

  “去年開(kāi)始,大家發(fā)現(xiàn),基于Dense架構(gòu)的模型,再往前去演化到要訓(xùn)練一個(gè)超過(guò)五千億、一萬(wàn)億參數(shù)模型時(shí),所需的算力、時(shí)間、數(shù)據(jù)量,都是當(dāng)前技術(shù)條件下實(shí)現(xiàn)不了的。“劉軍回憶,他們做過(guò)一個(gè)評(píng)估,這種情況下,需要20萬(wàn)張卡訓(xùn)練一年,才能把一個(gè)萬(wàn)億的Dense模型高質(zhì)量訓(xùn)練出來(lái)。

  為此,從去年開(kāi)始,業(yè)界就已經(jīng)不約而同轉(zhuǎn)向探索以MoE的方式,通過(guò)更高效算力投資的方式來(lái)實(shí)現(xiàn)更高質(zhì)量的模型。比如DeepSeek從V2開(kāi)始就采用的MoE架構(gòu),海外的Mistral此前也曾發(fā)布MoE架構(gòu)模型。

  去年5月,浪潮信息發(fā)布的源2.0-M32,同樣采用了MoE的思路,通過(guò)提出和采用“基于注意力機(jī)制的門(mén)控網(wǎng)絡(luò)”技術(shù),構(gòu)建包含32個(gè)專(zhuān)家的混合專(zhuān)家模型,大幅提升模型算力效率,單Token下訓(xùn)練和推理所需的算力資源僅為L(zhǎng)lama-70B的1/19。

  “業(yè)界此前已經(jīng)在做類(lèi)似工作,但DeepSeek給了我們更加明確的信號(hào)。”劉軍說(shuō),”下一階段,大家會(huì)從原來(lái)單純追求量的增長(zhǎng),買(mǎi)了多少卡,變成追求如何變成一個(gè)更高效的系統(tǒng)。”

  第三,優(yōu)化算力基礎(chǔ)設(shè)施架構(gòu)。如采用先進(jìn)的計(jì)算架構(gòu),提升單計(jì)算節(jié)點(diǎn)性能,提高計(jì)算效率。優(yōu)化內(nèi)存層次結(jié)構(gòu),減少數(shù)據(jù)傳輸延遲,增強(qiáng)數(shù)據(jù)處理速度。利用智能調(diào)度算法合理分配計(jì)算任務(wù),優(yōu)化集群管理方面,確保資源高效利用。

  第四,增強(qiáng)數(shù)據(jù)支持,減少無(wú)效計(jì)算。比如可以通過(guò)建立高質(zhì)量的數(shù)據(jù)集,并構(gòu)建統(tǒng)一的數(shù)據(jù)存儲(chǔ)和訪問(wèn)接口,簡(jiǎn)化數(shù)據(jù)流動(dòng)與共享,為AI模型訓(xùn)練提供強(qiáng)有力的支持。

  《報(bào)告》也顯示,未來(lái)18個(gè)月內(nèi),為了將大模型引入生產(chǎn),除了硬件的升級(jí)會(huì)是企業(yè)的首要投資目標(biāo)外,軟件和服務(wù)方面的支出也會(huì)是企業(yè)生成式AI項(xiàng)目的主要支出方向。

  “2024年開(kāi)始,用戶(hù)在軟件方面的投資增長(zhǎng)越來(lái)越快,隨著DeepSeek帶來(lái)的應(yīng)用嘗鮮潮的持續(xù)奔騰,相應(yīng)的軟件和服務(wù)、定制化解決方案的開(kāi)發(fā)會(huì)越來(lái)越多。”IDC中國(guó)副總裁周震剛說(shuō)。

  在這種背景下,客戶(hù)需要更全�;闹С帧a槍�(duì)這些需求,浪潮信息目前已提供全鏈條、全�;娜斯ぶ悄芗夹g(shù)服務(wù),從AI server計(jì)算的硬件、“源”大模型、AI station算力調(diào)度平臺(tái)到EPAI大模型落地工具。

  03

  推理市場(chǎng)爆發(fā),2028年推理工作負(fù)載占比將達(dá)73%

  《報(bào)告》中還提出一個(gè)重要的趨勢(shì),推理算力有望迎來(lái)大爆發(fā),2025年推理的工作負(fù)載占比將達(dá)到67%。“當(dāng)前我們接到的所有購(gòu)買(mǎi)需求,幾乎都是推理的。”浪潮信息高級(jí)副總裁劉軍告訴數(shù)智前線(xiàn)。

  目前42%的中國(guó)企業(yè)已開(kāi)始進(jìn)行大模型的初步測(cè)試和重點(diǎn)概念驗(yàn)證,17%的企業(yè)已將技術(shù)引入生產(chǎn)階段,并應(yīng)用于實(shí)際業(yè)務(wù)中。

  與之相對(duì)應(yīng)的是,2024年,國(guó)內(nèi)推理與訓(xùn)練的工作負(fù)載占比已分別達(dá)到65%和35%�!秷�(bào)告》預(yù)計(jì),到2028年,推理工作負(fù)載占比還將進(jìn)一步達(dá)到73%,遠(yuǎn)超訓(xùn)練算力27%的占比。

  面對(duì)這一趨勢(shì),公有云市場(chǎng)的各云計(jì)算大廠和運(yùn)營(yíng)商們都已摩拳擦掌,火速宣布支持DeepSeek模型調(diào)用或部署,并卷起價(jià)格戰(zhàn),爭(zhēng)奪市場(chǎng)。

  而在私有云或者說(shuō)私有化部署方面,業(yè)界觀察,這一市場(chǎng)預(yù)計(jì)將成為推動(dòng)推理算力增長(zhǎng)的一股重要力量。“企業(yè)將要建設(shè)自己的小型智算中心,部署1~10臺(tái)服務(wù)器(百卡之內(nèi)),或10來(lái)20臺(tái)服務(wù)器(百卡規(guī)模)。”一位智算領(lǐng)域人士表示。

  劉軍也告訴數(shù)智前線(xiàn),1~20臺(tái)的區(qū)間,會(huì)是企業(yè)客戶(hù)未來(lái)一段時(shí)間采購(gòu)私有化算力比較適合的規(guī)模。

  “但這應(yīng)該會(huì)經(jīng)歷一個(gè)過(guò)程,大家不會(huì)特別盲目,一上來(lái)就不顧一切,上好多機(jī)器。”劉軍說(shuō),在早期,企業(yè)應(yīng)該會(huì)先購(gòu)買(mǎi)一定數(shù)量的AI服務(wù)器回去構(gòu)建環(huán)境,去針對(duì)自己的業(yè)務(wù)開(kāi)展PoC,驗(yàn)證對(duì)自己的業(yè)務(wù)很有幫助后,才會(huì)上一個(gè)比較大的量。

  IDC副總裁周震剛則預(yù)測(cè),在這種背景下,開(kāi)源+一體機(jī)的模式,“很可能是未來(lái)一段時(shí)間內(nèi)一個(gè)非常爆發(fā)性的需求。”

  “過(guò)去幾年這種需求相對(duì)較少,因?yàn)橐惑w機(jī)做推理還可以,做訓(xùn)練可能沒(méi)有那么大的算力,而推理又可以直接通過(guò)service解決,也不一定本地部署這么一個(gè)推理機(jī)。但DeepSeek出來(lái)后,市場(chǎng)上對(duì)一體機(jī)的需求在大幅度上升。最近有很多企業(yè)都在跟我們溝通,希望了解一下這個(gè)市場(chǎng)規(guī)模是什么樣的。”周震剛告訴數(shù)智前線(xiàn)。

  浪潮信息2月11日剛推出的元腦R1推理服務(wù)器,也在最近受到不少企業(yè)關(guān)注。據(jù)悉,該產(chǎn)品通過(guò)系統(tǒng)創(chuàng)新和軟硬協(xié)同優(yōu)化,單機(jī)即可部署運(yùn)行DeepSeek R1 671B模型。

  “為什么要強(qiáng)調(diào)單機(jī)就能把它跑下來(lái)?因?yàn)楝F(xiàn)在有好多方案是比較麻煩的,模型尺寸大了后,如果你不得不用四臺(tái)機(jī)器才能裝下這樣一個(gè)模型,對(duì)客戶(hù)去適用這個(gè)環(huán)境就是一個(gè)很大的門(mén)檻,而如果你一臺(tái)機(jī)器,回去開(kāi)機(jī)把模型裝上,馬上就能用上Chatbox、CherryStudio,就會(huì)極大方便大家去嘗試滿(mǎn)血版671B的模型。”劉軍說(shuō)。

  無(wú)獨(dú)有偶,天翼云、聯(lián)想百應(yīng)等也都在最近推出了基于DeepSeek等技術(shù)的一體機(jī)。一場(chǎng)關(guān)于推理算力的競(jìng)爭(zhēng)已經(jīng)開(kāi)始。

  “真正到了推理場(chǎng)景,大家關(guān)心的是我的用戶(hù)體驗(yàn)好不好,在保證用戶(hù)體驗(yàn)的情況下,每元錢(qián)能有多少Token。”劉軍告訴數(shù)智前線(xiàn),體驗(yàn)和性?xún)r(jià)比將決定算力廠商在推理市場(chǎng)中的生存能力。

  在他看來(lái),推理目前要重點(diǎn)解決兩方面的問(wèn)題,一個(gè)是怎么用更少的機(jī)器把模型裝進(jìn)去、跑起來(lái),另一個(gè)則是產(chǎn)生Token的速度是不是夠快。

  “我們很多工作都在圍繞這兩個(gè)方面來(lái)開(kāi)展。”劉軍舉例說(shuō),比如他們會(huì)通過(guò)PD分離的策略,將推理的兩個(gè)重要階段——預(yù)填充(Prefill)和 解碼(Decode)解耦部署,通過(guò)構(gòu)建分離式算力資源池,縮短計(jì)算時(shí)間,降低計(jì)算成本,提高資源利用率。

  不管是推理端,還是訓(xùn)練端,智算市場(chǎng)作為大模型落地的重要支撐,在未來(lái)幾年內(nèi)將保持高速增長(zhǎng)。在應(yīng)用爆發(fā)的臨界點(diǎn)到來(lái)之前,保有熱情,但不盲目激進(jìn),仍是最適合當(dāng)下的一個(gè)行為準(zhǔn)則。

  榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報(bào)生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門(mén)新聞