英特尔Lunar Lake架构变化巨大!AI性能可达前代4倍

时间:2024-06-05 16:00:03分类:CPU浏览:8

英特尔正式公布了Lunar Lake客户端处理器的架构细节。如果用一句话来概括的话,那就是——发生了翻天覆地的变化,包括模块化结构、封装工艺、全新性能核与能效核、线程调度、GPU、NPU以及连接等等。

这一系列的改变也带来了性能、能效、功能的全面提升。

根据英特尔公布的信息,Lunar Lake整体功耗较上一代降低40%;核显游戏和图形性能提升1.5倍;全新NPUAI性能可达上一代的4倍,平台AI算力高达120TOPS。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

接下来,我将为大家详细介绍英特尔Lunar Lake的非凡特性,旨在进一步发展AI PC。

全新的模块化设计以及封装级内存

Lunar Lake延续了Meteor Lake的分离式模块设计,但后者的“计算模块、SoC模块、图形模块、IO模块”四大模块简化为——计算模块(Computetile)和平台控制器模块(PlatformController)。瓦)两部分(边角处也有填充模块,但不具备电路和功能,只是为了保证结构的整体强度),采用3D Foveros封装工艺。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

另一个重要的变化是Intel首次将内存集成到封装中,称为“Memory on package(MOP)”。 2颗芯片的内存容量高达32GB,支持LPDDR5x,每颗芯片高达8.5GT/s(8500MHz)。支持4个16bit通道。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

封装到SoC中缩短了内存布线,降低了40%的物理功耗,并节省了250平方毫米的主板面积。对于内部空间紧凑的轻薄笔记本来说,留下了更多的设计空间。

不过,这也意味着搭载Lunar Lake的笔记本无法进行扩展和升级。购买时建议内存要求较大的用户“一步到位”,毕竟无论是影像创作、本地化AI或者多任务处理,对于内存的需求正快速提升。

再来看Lunar Lake的两大全新模块。

计算模块:混合架构最多4个性能核心和4个能效核心,还包括GPU核心显示、NPU、媒体引擎、显示引擎、IPU图像处理单元、NOC、MSC(内存侧缓存)。 MSC最大容量为8MB,独立于二级、三级缓存。主要用于IO引擎的缓存协调,可以减少对系统内存的依赖,改善延迟和带宽。

与上一代相比,计算模块的另一个重要变化是采用了新的低功耗岛来集中管理所有节能模块,以提高能源效率。

平台控制模块:包括PCIe 5.0/4.0控制器、Thunderbolt 4控制器、USB控制器、Wi-Fi和蓝牙控制器、安全引擎等。

Lunar Lake提供多达4个PCIe 5.0和4个PCIe 4.0总线通道;支持Wi-Fi 7(5G Gig),最高速度5.8Gbps,支持蓝牙5.4;这次没有雷电5,支持的雷电4带宽为40Gbps。最多三个连接,并支持全新闪电共享技术,实现不同PC之间的快速共享、传输和控制。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

计算模块和平台控制模块通过可扩展的第二代交叉总线和D2D接口互连。此外,Lunar Lake还集成了4个电源控制器,以实现增强遥测和动态电压调整。

同时,为了优化能效,Lunar Lake的电源管理架构也进行了改变,独立PMIC、增强型Intel线程控制器、内存侧缓存和改进的处理器核心共同实现了功耗节省。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

至于Lunar Lake所采用的制程技术,英特尔尚未公布。

Lion Cove性能核——P核

Lunar Lake的性能核心代号Lion Cove,采用全新微架构,相比上一代大幅提升IPC,增强可扩展性;它优化了单线程每瓦性能和单位面积性能。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

Lion Cove的每个核心拥有48KB的L1数据缓存、192KB的L1指令缓存、高达2.5MB的L2缓存,并且所有核心共享高达12MB的L3缓存。

另外,该性能核拥有18个执行端口,预测宽度提升8倍;支持更精准的频率控制,间隔缩小到16.67MHz,更灵活把控能效。

根据Intel公布的数据,Lunar Lake的性能核心IPC相比Meteor Lake平均提升约14%,并且Lunar Lake在更低功耗下的性能优势更加明显。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

Skymont能效核——E核

Lunar Lake的新能效核心代号为Skymont。英特尔表示,希望能效核心能够覆盖更多日常计算能力需求。因此,Lunar Lake的能效核心Skymont设计与Raptor Lake性能核心相匹配,保持了能效核心的节能优势。

基于此,Skymont可以支持更多的应用场景,提高多线程性能和可扩展性,并拥有2倍的矢量和AI吞吐量,更好地支持VNNI功能。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

Skymont能效核心拥有26个调度端口、更深的队列以提高并行处理能力以及更广泛的分配和回滚。

Lunar Lake能效核心每个核心拥有32KB一级数据缓存,所有核心共享4MB二级缓存(二级缓存带宽翻倍),没有三级缓存。

性能方面,Intel表示四个能效核心组成一个集群。与Meteor Lake相比,相同性能的功耗仅为三分之一。相同功耗下性能提升可达2.9倍,最高性能达到后者的4倍。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

因此,新架构的性能核心和能效核心为英特尔新一代x86处理器带来更强的性能和更高的能效。

其中,性能核心的峰值性能比能效核心高出50%,第二能效核心的每瓦性能优势为20%到80%。因此,Lunar Lake可以实现复杂多样场景的灵活调度并保证电池寿命。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

持续增强的英特尔硬件线程调度器

Intel的硬件线程调度器在Lunar Lake中也得到了改进,带来了动态调度策略、增强的算法和更细粒度的控制,让OEM有更大的定制空间。同时,结合操作系统隔离区、增强电源管理等设计,也能保证能源效率。英特尔表示,在Teams应用中,启用这些功能后,功耗可降低35%。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

而且,在调度性能核心和能效核心方面,Intel硬件线程调度器也会充分考虑能效。如果工作负载合适,将优先考虑单个能效核心。当多线程发生时,会根据需要扩展能效核心,然后定向到性能核心。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

升级Xe2微架构的GPU

上一代Meteor Lake引入瑞旋GPU后,核显性能翻倍,令人印象深刻。此次Lunar Lake的GOU也升级为第二代Xe2微架构,性能约为上一代的1.5倍。

具体来说,Xe2 GPU的计算能力高达67 TOPS——,其拥有8个第二代Xe核心,采用全新的XMX引擎(INT 8整数运算每秒4096次,FP 16浮点运算每秒2048次),并且可以配备8个更强的光追踪单元、增强型XeSS核心、Xe2矢量引擎(优化能效和AI性能)、Intel ARC软件堆栈和8MB二级缓存。

Lunar Lake还拥有新的媒体引擎,支持AV1硬件编解码器和H.266/VVC视频硬解码。 VVC的优点是在保持相同图像质量的情况下降低码率,从而减少文件大小和传输压力。可以适应分辨率码率,更加灵活。它还支持屏幕内容编码流(SCC)和360度全景流。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

新的显示引擎可支持HDMI 2.1、DP 2.1 和eDP 1.5,并可扩展到最多三个屏幕。其中,eDP 1.5可以提高笔记本屏幕的自适应刷新,并结合Panel replay技术实现显示自适应同步等功能。

新NPU:4 倍峰值性能

作为AI PC的“核心”,NPU为何缺失?去年的Meteor Lake首次集成了NPU。作为新一代NPU,它并不是“2.0”。按照Intel的技术迭代,已经是“4.0”了。

NPU 4的架构增加了NPU尺寸,以更好地执行下一代AI工作负载;提高时钟频率和能源效率以满足性能要求,同时延长电池寿命;它针对现代人工智能进行了优化,可以高效运行大型语言模型和Transformer。

英特尔表示,Lunar Lake的NPU 4是AI PC“最大的集成专用AI加速器”,拥有12个增强型SHAVE DSP、6个神经计算引擎、能效优化的MAC阵列、2倍带宽、支持原生激活函数和数据转换,针对大型语言模型的嵌入式标记化,以及48TOPS 的计算能力。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

与Meteor Lake 的NPU 3 相比,NPU 4 峰值性能提升了4 倍。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

当然,Lunar Lake的AI性能依然基于CPU、GPU、NPU聚合的多重算力,匹配复杂多样的AI负载的同时兼顾能源效率。并且得益于各计算单元性能的大幅提升,Lunar Lake的平台算力达到了120TOPS。无论是游戏或创作中的AI需求,专用的AI助手,还是轻量级的AI负载,都可以更加高效。灵活高效地应对。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

写在最后

英特尔表示,Lunar Lake已投入量产,并将于第三季度正式推出,为20多家OEM厂商的80多款AI PC型号提供动力。

此外,英特尔迄今为止已交付了800万颗Core Ultra处理器,英特尔预计今年将交付超过4000万颗Intel Core Ultra处理器。

需要指出的是,Lunar Lake只是第二代Core Ultra的成员,专注于低功耗移动平台。今年晚些时候将会推出性能更高的Arrow Lake。

据悉,Arrow Lake同样基于Lion Cove和Skymont混合架构,并首次采用Intel 20A制程技术。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍

与前两年相比,今年的COMPUTEX在AI PC的引领下明显热闹了很多,英特尔、AMD、高通等巨头之间的火药味也浓了一些(虽然苹果会在几天后后来WWDC应该也少不了)AI的身影)。

当然,各种计算平台只是争夺AI PC头把交椅的筹码之一。生态合作、软件工具支持、人才投入和培训也至关重要。

尤其是在AI PC发展初期,谁能在市场站稳脚跟,真正实现AI PC的规模化应用,谁就能在未来的竞争中占据领先地位。

因此,今年下半年和明年推出的AI PC产品可能会呈现“百家争鸣”的局面。这不仅是芯片厂商之间的竞争,也是OEM厂商之间的竞争,甚至是x86和ARM两大核心阵营之间的竞争。车轮正面相撞。

PC市场终于又变得有趣了。谁能成为AI PC时代的引领者,让我们拭目以待。

英特尔Lunar  Lake架构变化巨大!AI性能可达前代4倍