為(wèi)AI加速而生的全新(xīn)至強如何讓數據中(zhōng)心玩轉人工(gōng)智能(néng)時代？

2023-12-25 生成海報

分(fēn)享到：

1956年，在達特莫斯大學(xué)的那次學(xué)會上，AI這個概念第一次被提出，标志(zhì)着人工(gōng)智能(néng)的正式誕生。在曆經近70年的發展之後，AI也終于迎來了屬于它的高光時刻。随着算力和數據的爆發，人工(gōng)智能(néng)在過去幾年裏産(chǎn)生了質(zhì)變，并成為(wèi)了第四次工(gōng)業革命中(zhōng)的重要基石。特别是去年生成式AI的火熱，讓無數行業都看到了其在提升客戶運營、銷售與營銷，以及軟件工(gōng)程方法等方面蘊含的無限可(kě)能(néng)。

從實際的AI應用(yòng)分(fēn)類來看，可(kě)以分(fēn)為(wèi)兩大類，一類是基于GPU的重負載訓練應用(yòng)，另一類則是輕負載的應用(yòng)。由于後者普遍需要低延遲和高能(néng)效，因此GPU也就不再是“唯一解”。特别是對部分(fēn)雲廠商(shāng)而言，通過使用(yòng)服務(wù)器CPU混合精(jīng)度實現的推理(lǐ)吞吐量往往能(néng)讓他(tā)們帶來更高的靈活性和極具(jù)優勢的TCO。

而這類服務(wù)器CPU也幾乎都有(yǒu)一個共同的名(míng)字：英特爾至強可(kě)擴展處理(lǐ)器。

繼年初發布第四代至強可(kě)擴展處理(lǐ)器之後，英特爾在12月15日再次為(wèi)數據中(zhōng)心領域獻上了一份大禮：代号Emerald Rapids的第五代英特爾至強可(kě)擴展處理(lǐ)器。相較上一代産(chǎn)品，第五代英特爾至強可(kě)擴展處理(lǐ)器可(kě)在相同熱設計功耗（TDP）範圍内提供更高的算力和更快的内存。同時，該處理(lǐ)器與上一代産(chǎn)品的軟件和平台兼容，使客戶能(néng)夠升級并大幅增加基礎設施的使用(yòng)壽命，同時降低成本和碳排放。

為(wèi)AI加速而生的全新(xīn)至強如何讓數據中(zhōng)心玩轉人工(gōng)智能(néng)時代？(圖1)

從配置上看，第五代至強可(kě)擴展處理(lǐ)器的核心數量增加到了64個，擁有(yǒu)更高的單核性能(néng)和内存帶寬，三級緩存容量達到了320MB，是上一代的近三倍，此外，第五代至強可(kě)擴展處理(lǐ)器具(jù)備8條DDR5通道，支持高達5600MT/s的傳輸速率，并且采用(yòng)英特爾超級通道互聯（UPI）2.0以增加跨插槽内帶寬，可(kě)提供高達20GT/s的傳輸速度。

當然，第五代至強可(kě)擴展處理(lǐ)器的最大驚喜還是在AI性能(néng)方面的提升。與上一代相比，第五代至強可(kě)擴展處理(lǐ)器在相同功耗下的平均性能(néng)提升了21%，在AI推理(lǐ)和訓練性能(néng)的提升則達到了42%和29%。此外，由于第五代英特爾至強可(kě)擴展處理(lǐ)器的每個内核均具(jù)備AI加速功能(néng)，無需添加額外獨立加速器，即可(kě)處理(lǐ)要求嚴苛的端到端AI工(gōng)作(zuò)負載，其中(zhōng)包括可(kě)将參數量多(duō)達200億的大語言模型的推理(lǐ)性能(néng)提高42%，延遲低于100毫秒(miǎo)。

為(wèi)AI加速而生的全新(xīn)至強如何讓數據中(zhōng)心玩轉人工(gōng)智能(néng)時代？(圖2)

“至強可(kě)擴展處理(lǐ)器擁有(yǒu)業界領先的AI性能(néng)，自第一代至強處理(lǐ)器開始，我們就一直注重加速AI工(gōng)作(zuò)負載，為(wèi)此我們推出了AVX-512指令集，從第四代至強可(kě)擴展處理(lǐ)器開始則内置了英特爾AMX（英特爾高級矩陣）加速器，緻力于為(wèi)至強可(kě)擴展處理(lǐ)器帶來更優的AI性能(néng)，現在的至強在處理(lǐ)多(duō)數企業的AI負載時表現都十分(fēn)優異。”英特爾數據中(zhōng)心與人工(gōng)智能(néng)集團副總裁兼中(zhōng)國(guó)區(qū)總經理(lǐ)陳葆立表示。

為(wèi)AI加速而生的全新(xīn)至強如何讓數據中(zhōng)心玩轉人工(gōng)智能(néng)時代？(圖3)

基于英特爾多(duō)年來積累的成熟的軟件生态和廣泛的生态合作(zuò)夥伴，許多(duō)客戶已經在第一時間對第五代至強可(kě)擴展處理(lǐ)器進行了部署，并帶來了極大的效益提升。例如京東雲、百度雲、阿裏雲以及火山(shān)引擎等等。

國(guó)内知名(míng)的雲服務(wù)大廠百度雲圍繞大規模推理(lǐ)和機密計算與英特爾展開了深度合作(zuò)，具(jù)體(tǐ)來說，百度采用(yòng)了4台内含第五代至強的服務(wù)器，并通過100G高速網絡聯合在一起對700億參數的Llama2開源大模型進行推理(lǐ)，相比單台服務(wù)器，性能(néng)提升了2.85倍，處理(lǐ)大模型的時間則可(kě)以控制在87毫秒(miǎo)以内。

為(wèi)AI加速而生的全新(xīn)至強如何讓數據中(zhōng)心玩轉人工(gōng)智能(néng)時代？(圖4)

機密計算方面，第四代至強可(kě)擴展處理(lǐ)器搭載的SGX（英特爾軟件防護擴展）在第五代至強可(kě)擴展處理(lǐ)器上被進一步拓展為(wèi)英特爾TDX（英特爾可(kě)信域拓展）技(jì )術，用(yòng)于提供虛拟機（VM）層面的隔離和保密性，從而增強隐私性和對數據的管理(lǐ)。在基于英特爾TDX的機密虛拟機中(zhōng)，客戶機操作(zuò)系統和虛拟機應用(yòng)被隔離開來，不會被雲端主機、虛拟機管理(lǐ)程序和平台的其他(tā)虛拟機訪問。在TDX技(jì )術的加持下，百度雲可(kě)以為(wèi)合作(zuò)用(yòng)戶提供更大的可(kě)信空間，在操作(zuò)系統層面就擁有(yǒu)安(ān)全隔離，可(kě)以為(wèi)用(yòng)戶提供更為(wèi)安(ān)全的保障。

阿裏雲也在本次發布會上披露了實測的數據，基于第五代至強可(kě)擴展處理(lǐ)器及内置的英特爾AMX加速器和英特爾TDX技(jì )術，阿裏雲打造了千問大模型及數據保護的創新(xīn)實踐，第八代實例在多(duō)媒體(tǐ)、數據庫、數據壓縮和加解密以及AI推理(lǐ)的多(duō)個場景中(zhōng)均獲得了性能(néng)提升。

為(wèi)AI加速而生的全新(xīn)至強如何讓數據中(zhōng)心玩轉人工(gōng)智能(néng)時代？(圖5)

堅持以“全棧自研，軟硬一體(tǐ)”打造自身差異化競争力的火山(shān)引擎也在第五代至強可(kě)擴展處理(lǐ)器的賦能(néng)之下實現了算力提升，根據火山(shān)引擎的數據，其第三代實例在人工(gōng)智能(néng)、視頻處理(lǐ)、Java應用(yòng)，科(kē)學(xué)計算等主流應用(yòng)上都得到了顯著的增益，最高可(kě)達43%。

“在最新(xīn)的實例上，我們計劃推出多(duō)種基于英特爾硬件原生加速的能(néng)力，以NGX為(wèi)例，使用(yòng)QAT進行數據壓縮和證書驗證的操作(zuò)吞吐量最高可(kě)提升5倍，在RocksDB使用(yòng)IAA進行數據壓縮讀寫的吞吐最高可(kě)以提升1.9倍。基于上述的性能(néng)表現，在火山(shān)引擎上的字節業務(wù)，比如基于容器的各種微服務(wù)、視頻處理(lǐ)、火山(shān)引擎的PaaS服務(wù)，包括大數據平台和機器學(xué)習平台，都已經規劃了基于我們最新(xīn)第三代實例的算力升級，我們預期基于第五代至強處理(lǐ)器的實例上線(xiàn)以後，将會給我們内外部客戶的各種業務(wù)帶來顯著的性能(néng)提升。”火山(shān)引擎IAAS産(chǎn)品負責人李越淵表示。

今年是生成式AI的爆發之年，不過和大多(duō)數新(xīn)興技(jì )術一樣，目前多(duō)數企業對生成式AI的應用(yòng)仍然處于探索階段，在未來從理(lǐ)論走向實踐的過程中(zhōng)，英特爾也會持續加大加深和開發者的交流，通過OpenVINO等工(gōng)具(jù)套件降低開發者部署的難度，使得雲廠商(shāng)和用(yòng)戶能(néng)夠以較低的門檻将第五代至強可(kě)擴展處理(lǐ)器、Gaudi2、Xeon Max等産(chǎn)品部署到自己的實際業務(wù)中(zhōng)去。

而在産(chǎn)品更新(xīn)方面，随着不斷變化的AI需求，英特爾也會針對不同的工(gōng)作(zuò)負載推出更加具(jù)有(yǒu)針對性的至強産(chǎn)品，包括具(jù)備更高的能(néng)效，針對高密度和橫向擴展工(gōng)作(zuò)負載進行了優化的能(néng)效核處理(lǐ)器Sierra Forest，以及具(jù)備更高的性能(néng)、内核密度、内存和I/O創新(xīn)，同時具(jù)有(yǒu)更高的能(néng)耗，針對計算密集型和AI工(gōng)作(zuò)負載進行優化的性能(néng)核産(chǎn)品Granite Rapids，為(wèi)萬物(wù)智能(néng)、萬物(wù)互聯的智能(néng)世界打好堅實的算力基礎。

免責聲明：普東科(kē)技(jì )遵守行業規則，本站所轉載的稿件都标注作(zuò)者和來源。轉載稿件或作(zuò)者投稿可(kě)能(néng)會經編輯修改或者補充. 如有(yǒu)異議可(kě)投訴至： infopd@bjpudong.com.cn

上一篇：AI大模型進入“群模時代” 商(shāng)業化曙光初現
下一篇：别慌！AI還無法替代人類 MIT研究：人類要比AI便宜得多(duō)

新(xīn)聞資訊

為(wèi)AI加速而生的全新(xīn)至強 如何讓數據中(zhōng)心玩轉人工(gōng)智能(néng)時代？

為(wèi)AI加速而生的全新(xīn)至強如何讓數據中(zhōng)心玩轉人工(gōng)智能(néng)時代？