英特尔酷睿Ultra 200V详解:远不止能耗暴降那么简单
自今年6月台北电脑展上正式公布Lunar Lake处理器架构细节后,英特尔新一代Core Ultra处理器即Core Ultra 200V系列的性能和能效一直备受用户期待。
全新Lion Cove性能核心和Skymont能效核心将为全新Core Ultra平台带来怎样的性能表现?流星湖良好的能效表现能否进一步提升能效比?而新平台本地化AI算力大幅提升后,投射到应用端又会给用户带来怎样的新体验呢?这些问题都成为了新一代Core Ultra平台最值得期待的关键点。
·Lunar Lake架构设计四大目标转眼到了9月份,柏林IFA展会之前,英特尔终于公布了Lunar Lake平台的能效、性能和应用性能,同时也公布了新平台的具体上市时间。
这次酷睿Ultra 200V系列新品将于9月24日上市,第一批包含九款不同型号处理器,最高可达Core Ultra 9 288V。新品全部采用8核8线程设计,睿频加速频率高达5.1GHz,缓存高达12MB。
Ultra 7核Ultra 9系列均搭载锐炫140V核显,Xe核都是8个,但频率略有不同。内存全部为芯片集成,有16GB和32GB两种规格,均为LPDDR5X 8533MT/s。功耗方面,除了Core Ultra 9 288V基础TDP为30W外,其他均为17W,最大TDP为37W。整体功耗大幅下降。
接下来让我们简单回顾一下月湖的建筑特色,看看它的实际能效和表现如何?
月湖总体设计目标包括四大方向:
其一,拥有突破性的x86处理器能效表现;其二,出色的核心性能表现;其三,优异的GPU图形性能表现;其四,卓越的AI计算能力。在这样的设计目标指导下,Lunar Lake进一步融入了相比上一代Metoer Lake更为复杂的分离式模块化架构设计。将之前的计算模块、图形模块、SoC模块、IO模块整合为计算模块和平台控制模块,还包括一个没有实际功能的填充模块。
同时,它还在整个芯片上集成了LPDDR5x内存颗粒,最高支持双通道32GB容量,这也意味着Lunar Lake平台笔记本产品将不会采用单独的主板内存插槽设计。
·超强能效带来全平台功耗降低50%简单了解了建筑设计的变化之后,我们再来看看大家最关心的能效和性能。
从Intel官方发布的信息来看,Lunar Lake在每瓦性能的提升上着实是下了很大功夫,这使得新的平台总体功耗下降了50%。
同时,增强并集成了新的电源管理解决方案,通过新的电源架构带来更好的电源控制并提高电源利用率。而且,存储器改用芯片封装后,PHY功耗降低了40%。加上核心集群能效的提升,月湖在功耗方面实现了多项关键创新。
此外,在Meteor Lake时代,Intel引入了低功耗设计,采用两颗超低功耗Crestmont核心来承载低功耗应用任务,以降低整个平台的能耗。 Lunar Lake在此基础上进一步提高了低功耗岛的效率,由4个Skymont低功耗核心组成,并将共享二级缓存增加到4MB。
这些变化最终反馈到测试端或应用端后,每瓦的性能提升将比老平台或同期竞品有显着优势。例如UL Procyon的Office生产力应用测试,新款Intel酷睿Ultra 9 288V性能比酷睿Ultra 7 165H以及骁龙X1E-80-100高7%,但是封装功耗则分别下降了53%和49%。相对于骁龙X1E-80-100而言每瓦性能提升1.2倍,相对于酷睿Ultra 7 165H而言提升高达2.29倍!两代酷睿Ultra处理器之间的每瓦性能差异确实令人惊叹。
此外,Core Ultra 200V系列集成的全新Xe2架构GPU也实现了各代之间每瓦性能的提升。在三款游戏《刺客信条:英灵殿》、《赛博朋克2077》和《模拟农场22》、酷睿Ultra 9 288V对比酷睿Ultra 7 165H,性能分别提升32%、44%以及68%,功耗分别降低35%、22%以及11%,每瓦性能提升显著。的测试中
过去,搭载x86架构处理器的PC设备在整体功耗方面往往表现不尽如人意,从而导致其电池续航时间受到批评。虽然Core Ultra平台的出现极大地提升了续航能力,但往往是在更高功耗的基础上通过增加电池容量来实现的。这显然不是移动级处理器芯片技术迭代的初衷。
从某种程度上来说,Lunar Lake是Intel Core家族中真正实现了全平台层面功耗大幅降低的产品。
参考Intel官方测试数据可以看到,与Intel酷睿Ultra 9 288V和酷睿Ultra 7 165H相比,MobileMark 30测试功耗降低了36%,网页浏览功耗降低了34%,功耗降低了34%。 Zoom 1*1在线视频压缩率降低45%。Teams 和Youtube 4K30 AV1 编解码器功耗分别降低了41% 和33%。
更低的功耗自然会带来更长的电池寿命。使用相同的OEM产品,与Core Ultra 7 268V平台上的Snapdragon X1E-80-100平台相比,UL Procyon Office生产力电池寿命超过1.7小时,Teams 3*3在线视频会议持续时间减少2小时。在同一测试项目中,Core Ultra 9 288V可分别实现14小时和9.9小时的续航。与Snapdragon X1E-78-100和AMD Ryzen AI 9 HX 370相比,电池寿命要高得多。
因此,全新的Lunar Lake平台拥有更加极致的能效表现。它实现UL Procyon Office生产力测试功耗降低50%、实现全平台50%的能耗降低、实现超过2倍的代际每瓦性能提升、实现20小时的超长续航能力和实现2倍的GPU能效提升。
相比竞品(骁龙平台)也有着20%的每瓦性能优势Lunar Lake全系列处理器采用8核8线程设计。与上一代Core Ultra平台相比,核心数和线程数有所减少,因此一些用户可能会担心其CPU性能。不过,英特尔实际上已经通过多种改进设计弥补了核心/线程数量下降带来的性能差距,实现了平台级能效升级。那么英特尔是如何完成这个看似不可能的任务的呢?
一是·业界最强的CPU单核心性能,重点优化性能核心。关闭超线程后,Lunar LakeLunar Lake放弃了超线程设计更好的性能、功耗和面积比使得性能核心在没有超线程的情况下也能拥有更好的整体性能。
其次,全新的低延迟结构设计。 AMD Ryzen AI 300系列发布后,核心间延迟急剧增加,内存延迟居高不下,导致在使用一些核心或内存敏感的应用程序时出现明显的延迟。 Lunar Lake仍然保持低核心延迟特性,同时降低内存延迟,增强分支预测能力,提高并行处理能力。
根据官方数据,性能功耗比提升15%,性能面积比提升10%,性能功耗面积比提升30%仍然拥有足够低的核心延迟,是的Lunar Lake在应用端仍然拥有更流畅、无延迟的体验。
第三,Intel硬件线程调度器进一步优化。由于Core平台采用“大小核”架构设计,线程调度成为影响处理器性能和效率的关键因素。 Lunar Lake在线程调度上采用了全新的动态调度策略,并通过使用单个能效核心来降低平台功耗。它通过扩展其他能效核心实现多线程任务的高效执行,并根据实际任务负载需求进行性能调度。更强的性能核心。因此,对于轻薄本来说,Lunar Lake的Lion Cove性能核心具有完美的单线程性能。参考官方Lunar Lake能效核延迟大约在23ns左右,性能核间延迟大约在26ns左右,能效核到性能核间延迟大约为55ns,内存延迟控制在了90ns附近,相比Meteor Lake降低了40%!、CINEBENCH 2024和Geekbench 6.3整数计算测试,SPECrate 2017
在多线程能效比方面,Lunar Lake也有非常不错的表现。酷睿Ultra 9 288V的单核性能分别高出基准线20%、21%以及61%。相比锐龙AI 9 HX 370,单核性能分别高出7%,6%以及28%。表明其CPU能效比相比上一代有了很大的提升。
多核性能方面,Core Ultra 200V可以在低功耗范围内带来更好的性能,但毕竟核心数量减少了,峰值性能会略低于竞品。但在各种常规应用的性能方面,例如Handbrake编解码,性能较基线提升了92%,相比竞品也有不同程度的领先。
基于这些改进,Lunar Lake 实际上拥有一个非常快的CPU 核心,分别为对比上一代Meteor Lake,Lunar Lake在9W功耗上的8线程性能,比Meteor Lake 14线程性能高22%,每线程性能高2.1倍;在17W功耗上,Lunar Lake 8线程性能比Meteor Lake 22线程性能高10%,每线程性能高出3倍;在23W功耗上,Lunar Lake 8线程性能仅比Meteor Lake 22线程性能低6%,每线程性能高出2.6倍,和能效核代际间IPC提升幅度达到68%。每线程性能比上一代提升3倍,并且具有更低的核间延迟和核心内存延迟,因此赋予轻薄笔记本极其出色的生产力应用体验。
性能核IPC提升14%其实相比于CPU,笔者个人更期待基于Xe2架构的新一代锐炫核显的性能表现。此次Core Ultra 200V家族集成了英特尔锐炫140V和130V核显两种不同型号。前者有8个Xe核,后者有7个。此外,最高频率和XMX AI算力也有差异。详情请参考下图:
Lunar Lake推出的全新Xe2GPU相比Meteor Lake将图形性能提升了1.5倍,并提供了更大的光线追踪单元,有助于提高游戏的画面质量和真实感。
之所以能够带来1.5倍的图形性能提升,主要是因为Xe2架构的Xe核心增加到了8个,带来了更强的图形计算能力。 AI性能的提升来自于Xe矩阵扩展引擎规格的升级。新的矢量引擎支持4096OPS/时钟和2048OPS/时钟的INT8和FP16计算,并改进了固定功能单元,提高了吞吐量,从而优化了AI计算效率。其整体AI算力达到67TOPS,拥有8MB二级缓存。
游戏性能方面,新一代锐炫核显的游戏性能最为令人期待。根据Intel官方数据,全新锐140V核显与上一代Core Ultra 7 155H集成锐核显相比,游戏帧数平均提升31%;与Snapdragon X1E-84-100处理器相比,除了23款与Snapdragon平台不兼容的游戏之外,在正常完成测试的游戏中,平均帧率比竞品高出68%产品。此外,相比图形性能显着提升的Ryzen AI 300系列集成HX 370处理器的Radeon 890M,Ryzen 140V游戏的平均帧率高出16%。
同时,超过120款游戏完美支持英特尔XeSS技术,全新的Xe2XMX核心将实现更高的游戏帧率。根据官方测试,XeSS技术实现了60%以上的代际性能复合提升。此外,在光线追踪性能、99%低帧率、DX12U游戏性能方面,瑞轩140V相比Radeon 890M和骁龙平台都有非常显着的性能优势。
在图形性能和能效升级的同时,Xe2GPU还为Lunar Lake带来了全新的媒体和显示引擎。其中,媒体引擎在原有AV1编解码器的基础上增加了VVC解码支持,而显示引擎则支持eDP 1.5、DP 2.1、HDMI 2.1接口标准。新的媒体和显示引擎可以更好地支持自适应分辨率流和360全景视频。
VVC解码是新引擎的一大亮点。虽然目前支持的人相对较少,但与AV1 相比,VVC 可以保证类似的质量,同时文件大小减少10%。这可以帮助视频流媒体平台进一步降低成本,是未来视频解码的一大主流方向。
在视频相关性能方面,Lunar Lake相比上一代最大的优势无疑是其优越的能效比。以Youtube 4K AV1视频播放为例。请参阅下面的GIF 图片。左边是流星湖,右边是月湖。播放Youtube 4K AV1 视频时,Lunar Lake 的功耗大部分只有5-7W,而Meteor Lake 基本都在10W 以上。
此外,在4K HEVC转码1080p AVC1080p HEVC1080p AV1这三个常见转码任务中,瑞旋140V相比竞品具有显着的效率优势。
·锐炫核显图形和媒体性能显著提升Intel Core Ultra标志着AI PC时代的开始。作为第二代产品,酷睿Ultra 200V自然会在AI算力方面实现显着提升。新的Lunar Lake处理器确实做到了这一点。其CPU+GPU+NPU算力合计达到120TOPS。全新Xe2GPU架构带来67TOPS峰值AI算力,全新NPU带来48TOPS峰值算力。再加上5TOPS的CPU AI算力,相比上一代Meteor Lake有显着提升。
Intel Core Ultra平台拥有三大AI计算引擎:CPU+GPU+NPU。现阶段,NPU、GPU、CPU的AI利用率分别为25%、40%、35%。英特尔预计
2025年三大引擎利用占比将发生一定变化,CPU占比降低,NPU占比会提升到30%左右,这意味着NPU对于AI应用的重要性进一步提升。

















