国产午夜精品免费一区二区三区,人妻尝试又大又粗久久,人人爽天天碰天天躁夜夜躁,夜夜添狠狠添高潮出水

PCBA資訊

AI“大躍進(jìn)”時(shí)代，芯片還夠嗎？

2023-05-04 17:23:54 徐繼 34

pcba

在ChatGPT帶來(lái)的AI熱潮中，繼百度之后，360、華為、騰訊、阿里甚至是科大訊飛、商湯、創(chuàng)維等企業(yè)均表示將推出自己的大語(yǔ)言模型。

盡管ChatGPT及一眾主流大模型背后的芯片主力仍是GPU，但嚴(yán)峻的挑戰(zhàn)已經(jīng)擺到眼前：生成式AI所需計(jì)算量不斷增加，而算力增長(zhǎng)空間卻即將觸頂。

4月5日，OpenAI暫停ChatGPT Plus的注冊(cè)，隨后又重新恢復(fù)，其中原因是算力需求量超載。此前，ChatGPT還因訪問(wèn)量過(guò)大而大規(guī)模封號(hào)，并禁止使用亞洲節(jié)點(diǎn)登錄，主要還是算力不足造成的。

盡管OpenAI踩下“剎車(chē)”，但大洋彼岸的A股算力概念股依舊掀起巨浪，一時(shí)間炙手可熱。業(yè)內(nèi)稱(chēng)，如今AI的“iPhone時(shí)刻”已經(jīng)來(lái)臨，作為人工智能時(shí)代的底層基座，誰(shuí)掌握了算力資源，誰(shuí)就擁有了引領(lǐng)數(shù)字經(jīng)濟(jì)發(fā)展的“終極武器”。在這個(gè)歷史性的變革時(shí)刻，中國(guó)不能缺席。

01、AI模型開(kāi)啟算力軍備競(jìng)賽

作為人工智能三大核心要素（數(shù)據(jù)、算法、算力）之一，算力被譽(yù)為人工智能“發(fā)動(dòng)機(jī)”。在AI風(fēng)暴的催化下，浪潮中的AI大算力芯片公司面臨著摩爾定律瀕臨極限之外的技術(shù)挑戰(zhàn)：以更低的系統(tǒng)成本、更少的能源消耗，支撐起龐大且持續(xù)增加的參數(shù)量所帶動(dòng)的高算力需求。

根據(jù)OpenAI測(cè)算，自2012年以來(lái)全球頭部AI模型訓(xùn)練算力需求每3-4個(gè)月翻一番，每年頭部訓(xùn)練模型所需算力增幅高達(dá)10倍。AI深度學(xué)習(xí)正在逼近現(xiàn)有芯片的算力極限，也對(duì)芯片設(shè)計(jì)廠商提出了更高要求。

在技術(shù)架構(gòu)層面，AI芯片可分為GPU（圖形處理器）、ASIC（專(zhuān)業(yè)集成電路）、FPGA（現(xiàn)場(chǎng)可編程門(mén)陣列）和類(lèi)腦芯片。隨著現(xiàn)象級(jí)AI產(chǎn)品ChatGPT的走紅，以大型語(yǔ)言模型為代表的前沿AI技術(shù)走向聚光燈之下，這類(lèi)模型所需的數(shù)據(jù)量、計(jì)算量龐大，成本高昂。

例如，目前采購(gòu)一片英偉達(dá)頂級(jí)GPU成本為8萬(wàn)元，GPU服務(wù)器成本超過(guò)40萬(wàn)元。對(duì)于ChatGPT而言，支撐其算力基礎(chǔ)設(shè)施至少需要上萬(wàn)顆英偉達(dá)GPU A100，一次模型訓(xùn)練成本超過(guò)1200萬(wàn)美元。

根據(jù)浙商證券研報(bào)，ChatGPT背后的算力支撐主要來(lái)自GPU或CPU+FPGA。由于具備并行計(jì)算能力，可兼容訓(xùn)練和推理，GPU目前被廣泛應(yīng)用。

除了GPU以外，CPU+FPGA的方案也能夠滿(mǎn)足AI龐大的算力需求。FPGA全稱(chēng)為現(xiàn)場(chǎng)可編程門(mén)陣列，是一種可以重構(gòu)電路的芯片。作為可編程芯片，F(xiàn)PGA芯片可以針對(duì)特定功能進(jìn)行擴(kuò)展。通過(guò)與CPU結(jié)合，F(xiàn)PGA能夠?qū)崿F(xiàn)深度學(xué)習(xí)功能，兩者共同應(yīng)用于深度學(xué)習(xí)模型。

近期，英特爾透露，計(jì)劃將在今年推出15款新FPGA，這將刷新英特爾該品類(lèi)的年度推新紀(jì)錄。其實(shí)在3月初，英特爾就發(fā)布了Agilex7 FPGA F-Tile，并配備FPGA收發(fā)器，其每個(gè)通道的帶寬都較上一代提升了一倍，在給產(chǎn)品提供更高的數(shù)據(jù)流量的同時(shí)也降低了功耗。

目前，F(xiàn)PGA領(lǐng)域的本土化程度較低。中國(guó)市場(chǎng)主要由賽靈思Xilinx（現(xiàn)已被AMD收購(gòu)）和英特爾兩大廠商主導(dǎo)，占據(jù)了超過(guò)70%的市場(chǎng)份額。國(guó)內(nèi)廠商安路科技、紫光國(guó)微、復(fù)旦微電等總份額約為15%。

寒武紀(jì)作為科創(chuàng)板AI芯片第一股，是全球少數(shù)全面掌握AI芯片技術(shù)的企業(yè)之一。其產(chǎn)品矩陣涉及云端產(chǎn)品、邊緣產(chǎn)品和IP授權(quán)及軟件，前兩者對(duì)標(biāo)英偉達(dá)、AMD，IP授權(quán)則對(duì)應(yīng)英國(guó)的ARM。云端芯片就是目前大語(yǔ)言模型最為需要的動(dòng)能來(lái)源，在該領(lǐng)域，英偉達(dá)A100、H100系列占據(jù)金字塔頂尖位置。

作為追趕者，寒武紀(jì)推出了思元系列，思元290、思元370等已經(jīng)進(jìn)入浪潮、聯(lián)想、阿里云等多家頭部客戶(hù)。去年3月，寒武紀(jì)正式發(fā)布新款訓(xùn)練加速卡“MLU370-X8”，其搭載了思元370，主要面向AI訓(xùn)練任務(wù)。

02、差距懸殊彎道難以超車(chē)

作為當(dāng)前唯一可以實(shí)際處理ChatGPT的GPU供應(yīng)商，英偉達(dá)是當(dāng)之無(wú)愧的“AI算力王者”。

6年前，黃仁勛親自向OpenAI交付了第一臺(tái)搭載A100芯片的超級(jí)計(jì)算機(jī)，幫助后者創(chuàng)造ChatGPT，并成為AI時(shí)代的引領(lǐng)者。

在2023年3月22日召開(kāi)的GTC大會(huì)上，黃仁勛又展示了速度比現(xiàn)有技術(shù)快10倍的英偉達(dá)HGX A100，可將大語(yǔ)言模型的處理成本降低一個(gè)數(shù)量級(jí)。

目前，英偉達(dá)市值飆升到6678億美元（約合4.6萬(wàn)億人民幣），幾乎是傳統(tǒng)芯片巨頭英特爾市值的五倍，成為全球最大市值的芯片企業(yè)。英偉達(dá)在PC的GPU市場(chǎng)上占據(jù)了近70%的份額，在獨(dú)顯市場(chǎng)的份額更是高達(dá)70%-80%。

據(jù)TrendForce分析，運(yùn)行1800億參數(shù)的GPT-3.5大型模型需要2萬(wàn)顆GPU芯片，大模型商業(yè)化的GPT則需要超過(guò)3萬(wàn)顆。

然而，根據(jù)相關(guān)報(bào)道，國(guó)內(nèi)目前擁有超1萬(wàn)顆GPU的企業(yè)不超過(guò)5家，擁有1萬(wàn)顆英偉達(dá)A100芯片的可能最多只有一家，絕大部分中國(guó)公司都只能采購(gòu)英偉達(dá)的中低端性能產(chǎn)品。

即使國(guó)內(nèi)頭部公司，從算力上跟美國(guó)的英偉達(dá)等公司相比，差距也非常明顯。

就GPU細(xì)分賽道而言，國(guó)內(nèi)自研GPU的領(lǐng)軍企業(yè)主要包括景嘉微、壁仞科技、芯動(dòng)科技等。其中，其中，景嘉微是成立最早的一家，自2006年開(kāi)始研發(fā)擁有自主知識(shí)產(chǎn)權(quán)的GPU產(chǎn)品，現(xiàn)在已經(jīng)推出了一系列產(chǎn)品線，且均采用國(guó)內(nèi)成熟制程工藝和自主架構(gòu)。

景嘉微的主打產(chǎn)品是JH920獨(dú)立顯卡。根據(jù)行業(yè)專(zhuān)家的評(píng)測(cè)，從性能參數(shù)上來(lái)看，JH920的性能與英偉達(dá)2016年發(fā)布的GTX 1050相當(dāng)，雖然兩者僅相差6年，但由于GTX 1050是英偉達(dá)10系列顯卡中的入門(mén)級(jí)產(chǎn)品，無(wú)法代表當(dāng)時(shí)的整體水平。

要想找到與GTX 1050性能相當(dāng)?shù)挠ミ_(dá)產(chǎn)品，需要回溯到2010年推出的GTX 580，這意味著景嘉微JH920基本上達(dá)到了英偉達(dá)12年前的水平。

所以整體而言國(guó)產(chǎn)GPU的現(xiàn)狀并不算樂(lè)觀，雖然在特殊領(lǐng)域能夠自給自足，但在中高端領(lǐng)域依舊捉襟見(jiàn)肘。

與此同時(shí)，中美地緣關(guān)系的博弈氣息日漸濃厚，這給高度依賴(lài)先進(jìn)制程的AI芯片創(chuàng)業(yè)公司提出了技術(shù)之外的新難題。

去年，在美國(guó)總統(tǒng)拜登正式簽署芯片法案（《CHIPS and Science Act》）一個(gè)月之后，美國(guó)政府對(duì)華實(shí)施了高端GPU芯片的出口禁令。同時(shí)，國(guó)內(nèi)GPU設(shè)計(jì)商壁仞科技的GPU芯片BR100在臺(tái)積電的試產(chǎn)也被迫叫停并主動(dòng)修改設(shè)計(jì)，以滿(mǎn)足出口禁令的要求。

A100和H100被禁止后，中國(guó)企業(yè)只能奢望其替代品A800和H800。2022年11月7日，英偉達(dá)向中國(guó)的供應(yīng)商提供其重新封裝的A800芯片。據(jù)稱(chēng)，國(guó)內(nèi)幾家頭部互聯(lián)網(wǎng)企業(yè)都向英偉達(dá)下了1.5萬(wàn)左右的A800和H800訂單。但即使是最佳替代品A800，也只是A100的“閹割版”，其傳輸速度和運(yùn)算性能較A100下降了50%。

被美國(guó)等國(guó)聯(lián)合封堵的我們，或許在較長(zhǎng)時(shí)間內(nèi)都無(wú)法制造出比肩英偉達(dá)等國(guó)際頂級(jí)公司的高水準(zhǔn)AI芯片。面對(duì)一個(gè)新的時(shí)代，我們又該如何破局？

03、換道行駛，續(xù)命摩爾定律

一直以來(lái)，頭部廠商通過(guò)不斷提升制程工藝和擴(kuò)大芯片面積推出算力更高的芯片產(chǎn)品。雖然GPU、CPU＋FPGA等芯片已經(jīng)對(duì)現(xiàn)有模型構(gòu)成底層算力支撐，在應(yīng)對(duì)生成式AI及大模型對(duì)算力基礎(chǔ)設(shè)施提出的新要求，都多少顯得有些捉襟見(jiàn)肘。

伴隨著摩爾定律逼近物理極限，制程升級(jí)和芯片面積擴(kuò)大帶來(lái)的收益邊際遞減，架構(gòu)創(chuàng)新或成為提升芯片算力另辟蹊徑的選擇。

Chiplet及先進(jìn)封裝方案能夠彌補(bǔ)先進(jìn)制程落后的劣勢(shì)，通過(guò)將來(lái)自不同生產(chǎn)廠商、不同制程工藝的芯片組件“混搭”，降低實(shí)現(xiàn)目標(biāo)性能所需的成本。研究數(shù)據(jù)顯示，當(dāng)5nm芯片的面積達(dá)到200㎜2以上，采用5Chiplet方案成本將低于單顆SoC，并將大幅降低因面積增加帶來(lái)的良率損失。

除了成本和良率端的優(yōu)勢(shì)，Chiplet技術(shù)帶來(lái)高速的Die to Die互連，使多顆計(jì)算芯粒得以集成在一顆芯片中，實(shí)現(xiàn)算力的大幅提升。

臺(tái)積電是Chiplet工藝的領(lǐng)軍者，目前其技術(shù)平臺(tái)下有CoWoS、InFO、SoIC三種封裝工藝。其中，早在2016年英偉達(dá)Tesla P100 AI數(shù)據(jù)中心GPU就已經(jīng)應(yīng)用CoWoS工藝，AMD的最新GPU、CPU也廣泛采用了該工藝。此外，三星、Intel等龍頭廠商亦推出了各自用于Chiplet的封裝技術(shù)，如三星I-Cube（2.5D封裝），X-Cube（3D封裝），英特爾EMIB（2.5D封裝），英特爾Foveros（3D封裝）。

不止在國(guó)際，近幾年Chiplet在中國(guó)大陸也非常火爆，特別是美國(guó)開(kāi)始打壓中國(guó)半導(dǎo)體業(yè)以來(lái)。Chiplet既能減少先進(jìn)制程用量，同時(shí)又能帶來(lái)先進(jìn)制程的好處，這為國(guó)內(nèi)芯片企業(yè)提供“換道行駛”的機(jī)會(huì)。

目前國(guó)內(nèi)封測(cè)巨頭相關(guān)技術(shù)積累已初顯成效。例如長(zhǎng)電科技的XDFOI Chiplet高密度多維異構(gòu)集成系列工藝已進(jìn)入穩(wěn)定量產(chǎn)階段；通富微電與AMD密切合作，已大規(guī)模生產(chǎn)7nm Chiplet產(chǎn)品；華天科技的Chiplet系列工藝也實(shí)現(xiàn)量產(chǎn)。

Chiplet設(shè)計(jì)主要用于大型CPU和GPU等處理器。雖然當(dāng)下國(guó)產(chǎn)CPU特別是大芯片與國(guó)際大廠存在明顯差距，但華為海思、寒武紀(jì)科技等少數(shù)企業(yè)正重點(diǎn)研發(fā)并采用7nm及更先進(jìn)制程的服務(wù)器芯片和AI芯片。

在GPU方面，英偉達(dá)等國(guó)際GPU龍頭企業(yè)已經(jīng)構(gòu)建了牢固的專(zhuān)利墻。無(wú)論是老牌企業(yè)如景嘉微和海光，還是新興創(chuàng)業(yè)公司，如芯動(dòng)科技、壁仞科技、摩爾線程、沐曦集成電路、天數(shù)智芯等，大多還處于發(fā)展初期，且所設(shè)計(jì)的芯片規(guī)模有限，采用Chiplet設(shè)計(jì)的還不多。

不過(guò)，一些GPU企業(yè)，特別是創(chuàng)業(yè)公司，雖然短期內(nèi)難以在大芯片領(lǐng)域形成規(guī)模，但長(zhǎng)期發(fā)展前景仍值得期待。例如，近幾年天數(shù)智芯在云端GPGPU方面異軍突起，其推出的7nm制程云端訓(xùn)練和推理GPGPU，能夠?yàn)樵贫薃I訓(xùn)練和HPC通用計(jì)算提供高算力和高能效比。類(lèi)似這樣的芯片成為中國(guó)本土Chiplet技術(shù)發(fā)展的希望。

近期，中國(guó)成立了自己的Chiplet聯(lián)盟，由多家芯片設(shè)計(jì)、IP、以及封裝、測(cè)試和組裝服務(wù)公司組成，并推出相應(yīng)的互連接口標(biāo)準(zhǔn)ACC 1.0。這一聯(lián)盟的成立，頗有與由AMD、Arm、英特爾、臺(tái)積電等主導(dǎo)的UCIe聯(lián)盟分庭抗禮的意味，也反映出中國(guó)相關(guān)企事業(yè)單位要從底層做起，發(fā)展本土Chiplet的愿望。

通過(guò)標(biāo)準(zhǔn)的設(shè)立，可以將自己生產(chǎn)的芯片變成Chiplet企業(yè)使用的“標(biāo)準(zhǔn)產(chǎn)品”，被不斷地集成到各種終端應(yīng)用中，從而為芯片行業(yè)開(kāi)辟出一片新天地。

04、結(jié)尾

算力的每一次提升，都掀起技術(shù)與產(chǎn)業(yè)變革的浪潮：CPU帶領(lǐng)人類(lèi)進(jìn)入PC時(shí)代，移動(dòng)芯片掀起移動(dòng)互聯(lián)網(wǎng)浪潮，而AI芯片打破了AI產(chǎn)業(yè)此前長(zhǎng)達(dá)數(shù)十年的算力瓶頸。如今，“人工智能的iPhone時(shí)刻”已經(jīng)來(lái)臨，走向下一個(gè)時(shí)代的路，或許早已擺在我們眼前。

正如阿里巴巴集團(tuán)董事會(huì)主席張勇所言，面向AI時(shí)代，所有產(chǎn)品都值得用大模型重新升級(jí)。過(guò)去一年消費(fèi)電子的低迷使得一些GPU公司的產(chǎn)品找不到應(yīng)用場(chǎng)景。但隨著ChatGPT出現(xiàn)，相關(guān)芯片的應(yīng)用場(chǎng)景開(kāi)始增加，并發(fā)展成AI基礎(chǔ)研究和產(chǎn)業(yè)化落地的一大趨勢(shì)。

AI往前發(fā)展，超高算力需求毋庸置疑AI大算力芯片技術(shù)提供了一種可行的解決方案。未來(lái)幾年，中美兩國(guó)將成為大模型的主要誕生地，并不計(jì)成本地帶動(dòng)對(duì)算力芯片的需求。不管是彎道超車(chē)還是換道行駛，在這場(chǎng)AI的征途中，中國(guó)算力企業(yè)萬(wàn)象競(jìng)逐的畫(huà)卷才剛剛展開(kāi)。

EMS電子制造

關(guān)于我們

專(zhuān)業(yè)制造

PCBA電子產(chǎn)品加工

PCB電路板

PCB基礎(chǔ)知識(shí)

微信公眾號(hào)