計算論壇 | 從芯片異構,到系統層的CPU平臺異構
發(fā)布:創(chuàng )始人時(shí)間:2023-02-10 10:22:36
遇賢微電子CTO陳爭勝在由高效能服務(wù)器和存儲技術(shù)國家重點(diǎn)實(shí)驗室和開(kāi)放計算中社區聯(lián)合主辦的 “異構計算研究與實(shí)踐”第七期開(kāi)放計算技術(shù)沙龍上,進(jìn)行了芯片異構計算的技術(shù)分享。以“打破邊界,從芯片異構到系統異構”為主題,對多層次的異構方案和實(shí)踐,以及未來(lái)的機會(huì )做了深入解析。
聯(lián)合承辦方高效能服務(wù)器和存儲技術(shù)國重實(shí)驗室副主任公維鋒在開(kāi)場(chǎng)致辭中表示,異構計算已經(jīng)成為推動(dòng)IT硬件重構的重要力量,能夠將不同架構的硬件單元整合到一起進(jìn)行并行計算,用專(zhuān)用的硬件去做最適合的事,來(lái)達到性能和成本的優(yōu)化,從而能夠化解算力瓶頸,助力算力增長(cháng)。高效能服務(wù)器和存儲技術(shù)國家重點(diǎn)實(shí)驗室首席研究員葉毓睿主持和開(kāi)場(chǎng)分享了最近的一些思考和觀(guān)點(diǎn)。他表示,我們面臨著(zhù)算力多元化,需求猛增,多元算力、異構計算、邊緣計算、散熱技術(shù)和一起皆是計算的硬件重構方向等趨勢和相關(guān)技術(shù)的研究和實(shí)踐,成為近些年來(lái)的熱點(diǎn)。
遇賢微電子CTO陳爭勝的分享內容有三部分,第一部分是從行業(yè)專(zhuān)家的經(jīng)驗和整個(gè)產(chǎn)業(yè)變遷歷史來(lái)看服務(wù)器 CPU發(fā)展趨勢與商業(yè)切入機會(huì )。

第二部分是以遇賢微電子正在設計的芯片為例來(lái)介紹在芯片設計過(guò)程中的多層級異構的研究與設計實(shí)踐。
第三部分是關(guān)于異構帶來(lái)的挑戰和機會(huì ),以及 CPU公司和系統公司應該如何來(lái)協(xié)同面對這些挑戰,抓住這些機會(huì )。
進(jìn)入到智能時(shí)代后工藝紅利與架構紅利等一些低垂的果實(shí)都已經(jīng)被摘完,計算進(jìn)入到多樣性計算的階段?;仡櫿麄€(gè)演變的過(guò)程,從Power\SPARC等向x86轉變是非常清晰的,但這個(gè)過(guò)程并不是自然發(fā)生的,而是很多業(yè)界的同仁,基于技術(shù)的優(yōu)勢與商業(yè)的利益去推動(dòng)完成轉變。遇賢微電子創(chuàng )始人羅勇博士當年從超算實(shí)驗室到英特爾工作,極大地推動(dòng)x86架構在服務(wù)器領(lǐng)域的迅速發(fā)展和高速的市場(chǎng)占用。
Arm架構無(wú)論是在端側還是在最近非常熱門(mén)的數據中心側,其發(fā)展與生態(tài)的建立也是經(jīng)歷了很長(cháng)的時(shí)間與很多人的努力。遇賢聯(lián)合創(chuàng )始人姬信偉總裁在Linaro工作期間,凝聚國內眾多廠(chǎng)家,推動(dòng)了Arm架構在服務(wù)器領(lǐng)域的應用。
現在除了 Arm、x86,還有RISC-V,未來(lái)會(huì )進(jìn)入一個(gè)更加多樣化的計算時(shí)代。遇賢微電子的研發(fā)主要圍繞Arm架構,同時(shí)也協(xié)助RISC-V的發(fā)展。計算行業(yè)的發(fā)展背后是由摩爾定律和登納德定律所描述的技術(shù)演進(jìn)規律。登納德定律已經(jīng)失效,摩爾定律還在延續。遇賢微電子首款高性能160核CPU 集成的晶體管數量將超過(guò)800億,未來(lái)的產(chǎn)品也會(huì )按照摩爾定律描述的集成度提升速度演進(jìn)。

CPU最大的一個(gè)障礙是生態(tài),生態(tài)有軟件生態(tài)和硬件生態(tài),軟件生態(tài)本質(zhì)上來(lái)說(shuō)是關(guān)于一個(gè)軟件供應鏈的問(wèn)題。除了生態(tài)外,還有很多“墻”需要去打破,需要非常多的技術(shù)手段,有些措施會(huì )導致另外一個(gè)“墻”變得更嚴重,比如說(shuō)不恰當地采用異構架構降低功耗,可能反而會(huì )帶來(lái)生態(tài)的問(wèn)題。要設計好一款高性能 CPU芯片,一個(gè)能夠大規模量產(chǎn),實(shí)現商業(yè)價(jià)值的芯片,必須非常巧妙的去應對多重技術(shù)難題。
針對技術(shù)與產(chǎn)品上這些困難和演進(jìn)趨勢,遇賢有大量的異構研究與實(shí)踐。第一種異構就是集成一些加速引擎模塊,這是最傳統的異構設計,如遇賢CPU集成了200Gbps吞吐處理能力的數據加速引擎,支持各種國際密碼算法、中國國家商用密碼算法的處理。

也可以根據應用場(chǎng)景的需求和芯片的系統架構,集成一些視頻、AI加速功能。另外一個(gè)是CPU核的異構,同一個(gè)芯片上集成不同大小的處理器核。大小核的技術(shù),在數據中心或者企業(yè)級應用中有沒(méi)有價(jià)值,需要根據應用場(chǎng)景,根據客戶(hù)的應用訴求做更具體的分析。

第二個(gè)層次就是封裝類(lèi)的異構,通過(guò)一致的接口實(shí)現不同Die封裝到同一個(gè)芯片。這個(gè)待定的接口是非常關(guān)鍵的。對于CPU及XPU的多Die互聯(lián),遇賢微電子定義了清晰的接口,支持多芯片的擴展,可以和合作伙伴一起,為客戶(hù)提供定制化服務(wù)。該接口基于開(kāi)放的AMBA協(xié)議構建多die之間的存儲一致性系統,支持采用低成本的MCM先進(jìn)封裝技術(shù)。
下一個(gè)層級就是系統級。整個(gè)系統層級除 CPU以外那還有 memory,各種加速卡,NVMe存儲設備,網(wǎng)絡(luò )接口設備等。系統層面上具有大量通過(guò)異構設計進(jìn)行差異化和性能提升的機會(huì )。

遇賢微電子CPU支持CXL2.0協(xié)議,支持系統擴展CXL Memory,也支持通過(guò)CXL協(xié)議擴展GPGPU等芯片,通過(guò)共享內存的編程方式構建一個(gè)“內存一致”的異構系統。
異構會(huì )帶來(lái)很大的收益,但也會(huì )帶來(lái)行業(yè)碎片化的挑戰。對于系統廠(chǎng)商來(lái)說(shuō),原來(lái)只有很少單板類(lèi)型,但隨著(zhù)多樣性計算、異構計算的引入,單板的數量、系統的配置種類(lèi)就會(huì )變得非常多。如何從技術(shù)應對,一個(gè)直接的思路就是引入若干抽象層級,比如對芯片封裝、PINMAP等物理形態(tài)做一些抽象后,遇賢CPU第一代和第二代之間支持單板層面的兼容。
在單一架構的情況下,整個(gè)計算生態(tài)和整個(gè)產(chǎn)業(yè)的價(jià)值被少數上游芯片公司所把持和壟斷。隨著(zhù)以多樣性 cpu計算平臺為核心,以及各種xPU卡的生態(tài)完善,以CPU原廠(chǎng)和系統廠(chǎng)商一起主導的異構計算生態(tài)會(huì )是一個(gè)極佳的重構產(chǎn)業(yè)價(jià)值鏈的機會(huì )。

隨著(zhù)數字經(jīng)濟的迅猛發(fā)展,云計算、AI、5G等領(lǐng)域對計算量需求激增,同時(shí)數據信息安全進(jìn)入到發(fā)展深水區,傳統的體系架構已面臨多方面性能瓶頸和發(fā)展挑戰,異構計算作為突破點(diǎn)和新抓手,將深刻影響智算中心、數據中心、邊緣計算等系統架構。遇賢以CPU為中心,依托多年技術(shù)體系化發(fā)展的積累,將持續在異構計算中芯片、系統、軟件等多層次貢獻技術(shù)價(jià)值,與生態(tài)公司,共同發(fā)展。