1956年,在達特莫斯大學(xué)的那次學(xué)會上,AI這個概念第一次被提出,标志(zhì)着人工(gōng)智能(néng)的正式誕生。在曆經近70年的發展之後,AI也終于迎來了屬于它的高光時刻。随着算力和數據的爆發,人工(gōng)智能(néng)在過去幾年裏産(chǎn)生了質(zhì)變,并成為(wèi)了第四次工(gōng)業革命中(zhōng)的重要基石。特别是去年生成式AI的火熱,讓無數行業都看到了其在提升客戶運營、銷售與營銷,以及軟件工(gōng)程方法等方面蘊含的無限可(kě)能(néng)。
從實際的AI應用(yòng)分(fēn)類來看,可(kě)以分(fēn)為(wèi)兩大類,一類是基于GPU的重負載訓練應用(yòng),另一類則是輕負載的應用(yòng)。由于後者普遍需要低延遲和高能(néng)效,因此GPU也就不再是“唯一解”。特别是對部分(fēn)雲廠商(shāng)而言,通過使用(yòng)服務(wù)器CPU混合精(jīng)度實現的推理(lǐ)吞吐量往往能(néng)讓他(tā)們帶來更高的靈活性和極具(jù)優勢的TCO。
而這類服務(wù)器CPU也幾乎都有(yǒu)一個共同的名(míng)字:英特爾至強可(kě)擴展處理(lǐ)器。
繼年初發布第四代至強可(kě)擴展處理(lǐ)器之後,英特爾在12月15日再次為(wèi)數據中(zhōng)心領域獻上了一份大禮:代号Emerald Rapids的第五代英特爾至強可(kě)擴展處理(lǐ)器。相較上一代産(chǎn)品,第五代英特爾至強可(kě)擴展處理(lǐ)器可(kě)在相同熱設計功耗(TDP)範圍内提供更高的算力和更快的内存。同時,該處理(lǐ)器與上一代産(chǎn)品的軟件和平台兼容,使客戶能(néng)夠升級并大幅增加基礎設施的使用(yòng)壽命,同時降低成本和碳排放。
從配置上看,第五代至強可(kě)擴展處理(lǐ)器的核心數量增加到了64個,擁有(yǒu)更高的單核性能(néng)和内存帶寬,三級緩存容量達到了320MB,是上一代的近三倍,此外,第五代至強可(kě)擴展處理(lǐ)器具(jù)備8條DDR5通道,支持高達5600MT/s的傳輸速率,并且采用(yòng)英特爾超級通道互聯(UPI)2.0以增加跨插槽内帶寬,可(kě)提供高達20GT/s的傳輸速度。
當然,第五代至強可(kě)擴展處理(lǐ)器的最大驚喜還是在AI性能(néng)方面的提升。與上一代相比,第五代至強可(kě)擴展處理(lǐ)器在相同功耗下的平均性能(néng)提升了21%,在AI推理(lǐ)和訓練性能(néng)的提升則達到了42%和29%。此外,由于第五代英特爾至強可(kě)擴展處理(lǐ)器的每個内核均具(jù)備AI加速功能(néng),無需添加額外獨立加速器,即可(kě)處理(lǐ)要求嚴苛的端到端AI工(gōng)作(zuò)負載,其中(zhōng)包括可(kě)将參數量多(duō)達200億的大語言模型的推理(lǐ)性能(néng)提高42%,延遲低于100毫秒(miǎo)。
“至強可(kě)擴展處理(lǐ)器擁有(yǒu)業界領先的AI性能(néng),自第一代至強處理(lǐ)器開始,我們就一直注重加速AI工(gōng)作(zuò)負載,為(wèi)此我們推出了AVX-512指令集,從第四代至強可(kě)擴展處理(lǐ)器開始則内置了英特爾AMX(英特爾高級矩陣)加速器,緻力于為(wèi)至強可(kě)擴展處理(lǐ)器帶來更優的AI性能(néng),現在的至強在處理(lǐ)多(duō)數企業的AI負載時表現都十分(fēn)優異。”英特爾數據中(zhōng)心與人工(gōng)智能(néng)集團副總裁兼中(zhōng)國(guó)區(qū)總經理(lǐ)陳葆立表示。
基于英特爾多(duō)年來積累的成熟的軟件生态和廣泛的生态合作(zuò)夥伴,許多(duō)客戶已經在第一時間對第五代至強可(kě)擴展處理(lǐ)器進行了部署,并帶來了極大的效益提升。例如京東雲、百度雲、阿裏雲以及火山(shān)引擎等等。
國(guó)内知名(míng)的雲服務(wù)大廠百度雲圍繞大規模推理(lǐ)和機密計算與英特爾展開了深度合作(zuò),具(jù)體(tǐ)來說,百度采用(yòng)了4台内含第五代至強的服務(wù)器,并通過100G高速網絡聯合在一起對700億參數的Llama2開源大模型進行推理(lǐ),相比單台服務(wù)器,性能(néng)提升了2.85倍,處理(lǐ)大模型的時間則可(kě)以控制在87毫秒(miǎo)以内。
機密計算方面,第四代至強可(kě)擴展處理(lǐ)器搭載的SGX(英特爾軟件防護擴展)在第五代至強可(kě)擴展處理(lǐ)器上被進一步拓展為(wèi)英特爾TDX(英特爾可(kě)信域拓展)技(jì )術,用(yòng)于提供虛拟機(VM)層面的隔離和保密性,從而增強隐私性和對數據的管理(lǐ)。在基于英特爾TDX的機密虛拟機中(zhōng),客戶機操作(zuò)系統和虛拟機應用(yòng)被隔離開來,不會被雲端主機、虛拟機管理(lǐ)程序和平台的其他(tā)虛拟機訪問。在TDX技(jì )術的加持下,百度雲可(kě)以為(wèi)合作(zuò)用(yòng)戶提供更大的可(kě)信空間,在操作(zuò)系統層面就擁有(yǒu)安(ān)全隔離,可(kě)以為(wèi)用(yòng)戶提供更為(wèi)安(ān)全的保障。
阿裏雲也在本次發布會上披露了實測的數據,基于第五代至強可(kě)擴展處理(lǐ)器及内置的英特爾AMX加速器和英特爾TDX技(jì )術,阿裏雲打造了千問大模型及數據保護的創新(xīn)實踐,第八代實例在多(duō)媒體(tǐ)、數據庫、數據壓縮和加解密以及AI推理(lǐ)的多(duō)個場景中(zhōng)均獲得了性能(néng)提升。
堅持以“全棧自研,軟硬一體(tǐ)”打造自身差異化競争力的火山(shān)引擎也在第五代至強可(kě)擴展處理(lǐ)器的賦能(néng)之下實現了算力提升,根據火山(shān)引擎的數據,其第三代實例在人工(gōng)智能(néng)、視頻處理(lǐ)、Java應用(yòng),科(kē)學(xué)計算等主流應用(yòng)上都得到了顯著的增益,最高可(kě)達43%。
“在最新(xīn)的實例上,我們計劃推出多(duō)種基于英特爾硬件原生加速的能(néng)力,以NGX為(wèi)例,使用(yòng)QAT進行數據壓縮和證書驗證的操作(zuò)吞吐量最高可(kě)提升5倍,在RocksDB使用(yòng)IAA進行數據壓縮讀寫的吞吐最高可(kě)以提升1.9倍。基于上述的性能(néng)表現,在火山(shān)引擎上的字節業務(wù),比如基于容器的各種微服務(wù)、視頻處理(lǐ)、火山(shān)引擎的PaaS服務(wù),包括大數據平台和機器學(xué)習平台,都已經規劃了基于我們最新(xīn)第三代實例的算力升級,我們預期基于第五代至強處理(lǐ)器的實例上線(xiàn)以後,将會給我們内外部客戶的各種業務(wù)帶來顯著的性能(néng)提升。”火山(shān)引擎IAAS産(chǎn)品負責人李越淵表示。
今年是生成式AI的爆發之年,不過和大多(duō)數新(xīn)興技(jì )術一樣,目前多(duō)數企業對生成式AI的應用(yòng)仍然處于探索階段,在未來從理(lǐ)論走向實踐的過程中(zhōng),英特爾也會持續加大加深和開發者的交流,通過OpenVINO等工(gōng)具(jù)套件降低開發者部署的難度,使得雲廠商(shāng)和用(yòng)戶能(néng)夠以較低的門檻将第五代至強可(kě)擴展處理(lǐ)器、Gaudi2、Xeon Max等産(chǎn)品部署到自己的實際業務(wù)中(zhōng)去。
而在産(chǎn)品更新(xīn)方面,随着不斷變化的AI需求,英特爾也會針對不同的工(gōng)作(zuò)負載推出更加具(jù)有(yǒu)針對性的至強産(chǎn)品,包括具(jù)備更高的能(néng)效,針對高密度和橫向擴展工(gōng)作(zuò)負載進行了優化的能(néng)效核處理(lǐ)器Sierra Forest,以及具(jù)備更高的性能(néng)、内核密度、内存和I/O創新(xīn),同時具(jù)有(yǒu)更高的能(néng)耗,針對計算密集型和AI工(gōng)作(zuò)負載進行優化的性能(néng)核産(chǎn)品Granite Rapids,為(wèi)萬物(wù)智能(néng)、萬物(wù)互聯的智能(néng)世界打好堅實的算力基礎。
免責聲明:普東科(kē)技(jì )遵守行業規則,本站所轉載的稿件都标注作(zuò)者和來源。 轉載稿件或作(zuò)者投稿可(kě)能(néng)會經編輯修改或者補充. 如有(yǒu)異議可(kě)投訴至: infopd@bjpudong.com.cn