9月5日消息,近日,第五代英特爾至強
處理器,以優秀的表現通過了中國電子技術標準化研究院組織的人工智能服務器系統性能測試(AISBench)。
借此,英特爾也成為首批通過AISBench大語言模型(LLM)推理性能測試的企業。
在AISBench 2.0測試工具的評估下,第五代英特爾至強處理器在ChatGLM V2-6B(60億參數)和Llama2-13B(130億參數)兩個模型上均展現了卓越的性能,能夠滿足輕量級大語言模型的實時推理要求。
測試結果顯示,在60億參數的ChatGLM V2模型通用推理中,當輸入輸出序列為256時,處理器可達每秒2493 token的性能;當輸入輸出序列為2048時,性能為每秒926 token。
在130億參數的Llama2模型通用推理中,當輸入輸出為256時,性能為每秒513 token;當輸入輸出序列為2048時,性能為每秒132 token。
AISBench 2.0的測試結果,驗證了英特爾至強在運行輕量級大語言模型時展現出的優異推理性能。
也使得客戶可以通過基于至強的服務器,構建一個通用AI系統進行數據預處理、模型推理和部署,從而獲得兼具AI性能、效率、準確性和可擴展性的組合。
同時還彰顯了英特爾至強可以為企業提供“開箱即用”的功能,即可以在通用系統上部署一部分AI工作負載,從而為客戶帶來更佳的總體擁有成本(TCO)優勢。
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:[email protected]。