“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

时间:2024-09-25 19:00:32分类:CPU浏览:9

AI时代的基石是什么?这是硬件和计算能力。

AI时代的发展靠什么?通过合作和应用。

英特尔的AI战略特点鲜明,一直坚持基于开放、可扩展的软硬件平台,打造全面覆盖云、边、端的解决方案,CPU通用处理器、GPU加速计算卡、AI加速器、NPU神经处理器等联合组成庞大的XPU阵营,可全面满足深度学习、机器学习、训练推理、生成式AI的多重需求。近日,阿里云隆重召开云栖大会。芯片行业的龙头英特尔也参加了这次会议,并做了两件大事:

一是首次公开预览了下一代至强6性能核心处理器的亮点,展示了其强大的实力;

其次,与阿里云联合预发布了基于该处理器的阿里云ECS第九代企业级计算实例,展示了其全面且出色的能力。

“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

【至强6处理器预览:兵分两路 各有所长】在CPU处理器方面,至强6在Intel历史上具有“划时代”的意义。这并不是因为它更名了,也不仅仅是首次引入全新的Intel 3.0工艺技术。分为两种方式,双手配合,满足用户和行业的多元化需求:

一是基于性能核的Granite Rapids,承袭了至强的一贯传统,面向计算密集型应用、高强度AI负载等场景,满足其对高算力、高性能的需求。二是基于能效核的Sierra Forest,特别针对高密度计算、可扩展负载等场景做优化,能效更加突出。同时,两者共享硬件平台和通用软件堆栈,不仅大大简化了硬件设计和开发,还简化了硬件平台和系统固件软件的部署和管理。

Xeon 6能效核心已发布首批产品Xeon 6700E系列,最高144核心144线程。性能核心即将推出,最高128核心256线程。它们均支持DDR5内存、PCIe 5.0通道、UP链路以及具有AI加速器等先进技术的数据中心。

“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

Xeon 6性能核心针对AI工作负载进行了全面的针对性设计,例如最多12个内存通道,对比四代至强带宽提升最高达2.8倍,同时引入了新的MCR DIMM内存形态,带宽再次增加30-40,从而可以从容运行对内存敏感的超大规模LLM模型。。通过oneAPI跨平台标准编程模型,AI推理训练工作负载性能可提升2-3倍。

例如内置AMX、QAT、AVX-512等加速器,结合AVX-512技术,可以更好地满足计算密集型AI和科学融合负载的性能,提升高达2.9倍。

多达128个内核例如,144核至强6780E相比64核第五代至强铂金8592+性能提升高达18%,但热设计功耗从350W降低至330W。

同时,至强6能效核心的功耗随负载强度基本线性增加,尤其是而对于功耗、能效有特别要求的应用场景,至强6能效核则是完美之选,简单地说就是性能更好、功耗更低。。这意味着什么?

过去需要200个机架的算力性能现在只需66,节省超过2/3的空间,4年生命周期内可节省8万兆瓦能耗,相当于减少二氧化碳。排放量3.4万吨。

“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

简而言之,当负载率在40-60的时候,能够节省多达280W的功耗,综合能效提升了2.4倍。英特尔通过“两条腿走路”的至强6性能核、能效核产品路线图,再次彰显了它对于AI的坚定承诺和深入布局:当然,很多人在谈论AI时,往往首先想到的是GPU加速器。虽然它的性能强大,但随之而来的是无法控制的极高功耗和极高的价格,这让普通企业很难用得起,缺乏足够的通用性和灵活性,而这正是CPU处理器的强项,也是Intel所坚守的。推广。

“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

围绕CPU处理器这一通用平台,打造结合开放、统一的软硬件平台,并针对不同应用场景和需求优化设计,满足千行百业的广泛需求。与此同时,英特尔不仅仅紧抓CPU处理器。 XPU战略的愿景是打造一个多硬件、集成、开放、灵活的硬件计算平台,加上丰富、灵活的软件开发平台。以及广泛深入的行业合作,为各行各业提供强大丰富的解决方案,让AI真正无处不在。

“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

至强6改变了以往的传统处理器设计理念,在AI的浪潮下快速转身,分为性能核、能效核,各取所长,针对性地满足不同AI应用负载与场景,更加凸显了CPU的灵活性。【阿里云第九代企业级计算实例:数据中心迈进一大步】回顾历史,阿里云联合Intel在国内率先部署浸没式液冷技术,打造盘九高性能存储服务器,并推出先进RAS、硬件动态内存刷新控制等先进软件创新共同推动建立CXL、UCle、UAlink等开放互联标准,共同推动Alinux和OpenAnolis社区的发展。

“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

阿里云ECS第七代实例与Intel联合开发,全球首个发布基于SGX的安全增强型实例。

第八代实例充分利用Intel AMX矩阵加速引擎、QAT技术等,发布业界领先的TDX机密虚拟机。

说到行业影响力,英特尔一直堪称执牛耳者,与阿里云也有着持久、深厚的友谊,尤其是在服务器技术、计算产品、云产品上持续深度合作,为客户提供安全、稳定、高性能、弹性的云上算力服务。“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

由于至强6性能核心处理器尚未正式发布,所以具体规格公布的并不多。我们只知道它有12个内存通道、内存频率6400MT/s、三级缓存提升50%等等。

不过官方给出了一系列性能指标,堪称性能全面飞跃,比如本次预发布的第九代企业级计算实例,又率先引入了至强6性能核处理器,算力性能、能效比、扩展连接性以及安全、稳定性等各方面都再上新台阶,性价比也大幅提升多达30,可满足企业用户多层次、多场景的AI业务需求。。另外,IO性能也实现了很大的飞跃,包括对比上代实例数据库性能提升17,Web应用性能提升20,Java应用性能提升15。等。

至强6性能核心内置的AI加速器也非常强大。例如,AMX高级矩阵扩展加速引擎支持INT8、BF16、FP16等多种数据类型和矩阵运算加速,ResNet50性能提升2倍,Bert性能提升1.7倍。

再比如,QAT支持原生硬件加解密,减轻了CPU的负担,网页加解密性能提升4-6倍。

“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

在本次云栖大会上,英特尔还分享了与阿里云合作的多个基于至强平台的AI实践案例。

例如连接数提升200,云盘密度提升100,整机IOPS随机能力提升20“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量

可以说,就像当初的互联网革命一样,人工智能将再次从根本上颠覆几乎每一个与科技相关的行业:教育、医疗、金融、零售、政企、能源、汽车、制造、电信……

预计到2026年,超过80%的企业将使用生成式人工智能,50%的边缘部署将涉及人工智能,全球生成式人工智能相关支出将超过3000亿美元。

预计到2040年,生成式人工智能将为全球经济贡献4.4万亿美元的价值。

视频领域的画质修复、一键生成、视频搜索等,药物研发等生命科学领域的多个面向不同场景的AI大模型,等等。“AI两手抓 两手都要硬”:英特尔为新一代数据中心注入AI力量