TSMC foundry! Intel's new AI PC chip Lunar Lake released: AI computing power 120TOPS!

台積電代工英特爾的新 AI PC 芯片 Lunar Lake 發佈，提升了 GPU 性能、AI 算力和整體算力。Lunar Lake 全部由台積電代工，這是英特爾首次完全由台積電代工。此舉可能與台積電在製程技術上的領先地位以及英特爾代工業務獨立分拆有關。Lunar Lake 的封裝仍由英特爾代工業務集團完成。

6 月 4 日，英特尔 CEO 帕特·基辛格在 COMPUTEX 2024 上发表主题演讲，正式公布了下一代面向 AI PC 的移动处理器 Lunar Lake，不仅 CPU、GPU、NPU 性能全面提升，能耗也大幅降低，综合 AI 算力提升至 120TOPS。

1、Lunar Lake 首次全部由台积电代工，但下一代的 Panther lake 将重回英特尔代工

据介绍 Lunar Lake 由 7 个主要部分组成，整个封装包含内存、加固器和底层芯片，底层芯片使用 Intel Foveros 互连技术将计算芯片和平台控制器芯片结合在一起。在工艺节点方面，Lunar Lake 计算芯片（包括 CPU、GPU 和 NPU 等）采用台积电的 N3B 工艺节点制造，平台控制器芯片则采用台积电的 N6 工艺节点制造，也就是说这款芯片的主要核心 die 全部都是由台积电代工！

要知到之前英特尔的高端移动平台芯片虽然有部分核心是交由台积电代工，但是 CPU 核心一直是英特尔自己生产的。而这种转变，一方面是台积电在制程技术上的领先，另一方面则可能与英特尔代工业务独立分拆有关。英特尔代工业务独立分拆，使得英特尔的设计业务可以更自由的选择外部更有竞争力的供应商，但是这对于英特尔代工业务集团来说并不是一个好消息，所幸的是 Lunar Lake 的封装还是交由英特尔代工业务集团来完成的。

对此，基辛格表示，Lunar Lake 之所以选择台积电制造，是因为当时台积电有更好的制程技术，现在看仍是好选择。感谢台积电，提供了很多核心关键制造技术，使 Lunar Lake 成为可能，也能看出台积电和英特尔在代工产业的合作，包括 UCIe（通用小芯片互连）也是。

不过基辛格强调，到下一代 Panther lake 将几乎全部是基于英特尔制程，将采用 Intel 18A 工艺，还有混合键合技术、晶圆对晶圆（Wafer to Wafer）堆叠，还有先进封装技术和背面供电技术，希望届时能够向大家展示英特尔的晶圆厂能力。

1、CPU 核心：4 个 P 核＋4 个 E 核，性能及效率大幅提升

据介绍，Lunar Lake 的 CPU 内核依然采用的 Hybrid 核心架构设计，拥有 4 个 Lion Cove P-core 性能核心和 4 个 Skymont E-core 效率核心，组合成 8 核心混合设计，以达到性能与效率的最佳。

Lunar Lake 的 Lion Cove P-core 性能核心在缓存层次上进行了众大改进，其采用了多层数据缓存，每个核心包括一个 48KB L0D 缓存（加载到使用延迟为 4 周期）、一个 192KB L1D 缓存（延迟为 9 周期）、一个扩展的 L2 缓存（最高可达 3MB，延迟为 17 周期）。总的来说，这使得 240KB 缓存的延迟时间与 CPU 内核的延迟时间相差无几，而之前的 Redwood Cove 只能在相同时间内达到 48KB 缓存。4 个 P 核心还共享了 12MB L3 缓存，可以带来更出色的单线程性能，并优化核心 PPA 设计。

英特尔添加了第三个地址生成单元 (AGU)/存储单元对，以进一步提升存储性能。值得注意的是，这使加载和存储管道的数量达到平衡，分别为 3 个；在大多数英特尔架构中，加载单元的数量都比存储单元多。

总体而言，英特尔在真正的长期 CPU 设计理念中，已经投入了更多缓存来解决这个问题。随着 CPU 复杂度的增加，缓存子系统也在不断增加，以保证其正常运行。在这种情况下，保证 CPU 正常运行是提高其性能和保持其能效的关键改进。

深入研究 Lion Cove 的计算架构，该架构在英特尔的 P 核设计上专注于提高性能和效率。该架构采用一种新的前端方法来处理指令，其预测块比以前大 8 倍，提取范围更广，解码带宽更高，Uops 缓存容量和读取带宽也大幅增加。UOP 队列容量增加，这也提高了整体吞吐量。在执行过程中，Lion Cove 的无序引擎在整数 (INT) 和矢量 (VEC) 域之间划分，具有独立的重命名和调度功能。

数据转换后备缓冲区 (DTLB) 也进行了修改，将其深度从 96 页增加到 128 页，以提高其命中率。这种分区方式可以实现未来的可扩展性、每个域的独立增长，并且有利于降低特定域工作负载的功耗。乱序引擎也得到了改进，分配/重命名从 6 个增加到 8 个，退出从 8 个增加到 12 个，深度指令窗口从 512 个增加到 576 个，执行端口从 12 个增加到 18 个。这些变化使管道更加稳健，执行起来也更加灵活。

Lion Cove 中的整数执行单元也得到了改进：整数 ALU 从 5 个增加到 6 个，跳跃单元从 2 个增加到 3 个，移位单元从 2 个增加到 3 个。它们将 64x64 单元增加到超过 64，并从 1 个单元增加到 3 个，为最复杂的操作提供更强大的计算能力。另一个显著的进步是 P 核心数据库从 “sea of fubs” 迁移到了 “sea of cells”。更新 P 核心子结构组织的过程从微小的、以锁存器为主的分区转变为更广泛、更大的以触发器为主的分区，这些分区在发展过程中非常不可知。

Lion Cove 架构也与性能提升保持一致，与上一代 Redwood Cove 相比，IPC 性能预计将提升两位数百分比。这种提升尤其明显，尤其是在超线程的改进方面，IPC 提高了 30%，动态功率效率提高了 20%，并且在不增加核心面积的情况下平衡了先前的技术，体现了英特尔在现有物理限制内提高性能的承诺。

Lion Cove 的电源管理也得到了改进，包括采用 AI 自调节控制器来取代静态热保护带。它让系统以自适应方式动态响应实际的实时运行条件，以实现更高的持续性能。它使用更精细的时钟粒度，现在间隔为 16.67MHz。与 100MHz 相比，这意味着更精确的电源管理和性能调整，从而从功率预算中获得最大效率。

至少从纸面上看，Lion Cove 看起来比 Golden Cove 有了很大的改进。它整合了改进的内存和缓存子系统、更好的电源管理以及 IPC 性能的提升，而不是专注于提高频率。

Lunar Lake 的 Skymont E-core 效率核心是专为实现全新水平的性能效率而设计。4 个 E-core 共享 4MB L2 缓存，能比上一代有着超过 2 倍的省电表现，并比上一代提升 2 倍的 Vector 与 AI 输出性能。

Skymont 核心具有更全面的微架构，首先是 9-wide 解码阶段，其解码簇比前几代多 50%。这由更大的微操作队列支持，现在可容纳 96 个条目，而旧设计中只有 64 个。使用 “Nanocode” 可在每个解码簇内增加更多微代码并行性。

Skymont 核心的无序执行引擎也得到了显著改进。分配宽度增加到 8-wide，而退出阶段则加倍到 16-wide。这增强了内核同时发出和执行多条指令的能力，并通过依赖中断机制减少了延迟。

Skymont 将重排序缓冲区从之前的 256 个条目加深到 416 个条目，以提供排队和缓冲功能。此外，物理寄存器文件 (PRF) 和保留站的大小也增加了。这些增强功能使内核能够处理更多正在运行的指令，从而提高指令执行的并行性。

需要注意的是，调度端口最初为 26 个，其中 8 个用于整数 ALU，3 个用于跳转操作，3 个用于每个周期的加载操作，从而进一步实现了灵活高效的资源分配。在矢量性能方面，Skymont 支持 4×128 位 FP 和 SIMD 矢量，这使每秒千兆次浮点运算 (Gigaflops/TOPs) 翻倍，并降低了浮点运算的延迟。英特尔还重新设计了内存子系统，四个内核共享 4MB L2 缓存，将 L2 带宽翻倍至每周期 128B，在此过程中，降低了内存访问延迟，同时提高了数据吞吐量。

英特尔公布的性能指标，凸显了 Skymont E 核的电源效率的显著提升：与上代的 Meteor Lake 的 LP E 核相比，单线程性能提高了 1.7 倍，而功耗仅为其三分之一。

当将 Skymont E-core 集群与 Meteor Lake 的 LP E-core 集群直接进行比较时，多线程性能提高了 2.9 倍，而功耗却全面降低。

这对于移动和桌面设计同样有用。换句话说，Skymont E 核心非常灵活，在移动场景中充分利用了低功耗结构和系统缓存，并针对桌面计算块优化了多线程吞吐量。与 Raptor Cove 相比，Skymont 在单线程工作负载中提供了 2% 更好的整数和浮点性能，其功率和热量范围几乎与其前代产品相同。

Skymont E 核代表了英特尔内核架构开发的下一步，在解码、执行、内存子系统和电源效率方面取得了显著的进步，满足了更节能计算的需求，并且比以前的 Crestmont E 核提高了 IPC 增益。

2、GPU 性能提升 50%，还有全新显示、多媒体和图像引擎

Lunar Lake 的 GPU 采用的是新一代的 Xe2 GPU 构架，拥有 8 组新一代 Xe 核心、8 个光线追踪单元、XMX AI 引擎和 8MB 的专属缓存。能够提供 67 GPU TOPS 的算力、实时的光线追踪、基于 AI 的 XeSS 画质提升、Intel Arc 软件堆叠等功能，相比上一代 Meteor Lake 能带来 50% 的图形处理性能提升。

Lunar Lake 内部还集成了与 GPU 搭配的全新显示、多媒体和图像引擎（IPU）。其中，显示核心拥有 3 个 eDP 1.5、DP 与 HDMI 2.1 输出接口，多媒体引擎支持 AV1 和最新的 VVC 编译功能，IPU 则可提供 Temporal noise reduction、Multi-frame 与 Dual exposure staggered HDR 等图像强化功能。

具体来说，英特尔的 eDisplayPort 1.5 包含面板重放功能，该功能集成了自适应同步和选择性更新机制。这有助于通过仅刷新屏幕发生变化的部分而不是整个显示屏来降低功耗。这些创新不仅节省能源，而且还通过减少显示延迟和提高同步精度来改善视觉体验。

描绘像素处理管道是英特尔显示引擎所依赖的基本基础之一，每条管道支持六个平面，用于高级颜色转换和合成。此外，它还集成了对颜色增强、显示缩放、像素调整和 HDR 感知量化的硬件支持，确保屏幕上的图形生动准确。该设计非常灵活，非常节能，性能经过精心设计，至少在纸面上支持各种输入和输出格式。到目前为止，英特尔尚未提供任何可量化的功率指标、TDP 或其他功率元素。

在压缩和编码方面，Xe2 架构可无损地将显示流压缩率提高到 3:1，包括针对 HDMI 和 DisplayPort 协议的传输编码。这些芯片功能可进一步降低数据负载，并在输出端保持高分辨率，而不会损失视觉质量。

多媒体引擎方面，英特尔采用 VVC 编解码器对视频压缩技术的改进意义重大。与 AV1 相比，此编解码器可将文件大小减少 10%，并支持自适应分辨率流媒体和针对 360 度和全景视频的高级内容编码。这将确保流媒体的比特率较低，而不会降低质量——这是现代多媒体应用的一个基本方面。

Windows GPU 软件堆栈从上到下都非常强大，支持 D3D、Vulkan 和 Intel VPL API 和框架。这意味着，结合这些品质可以为市场上各种运行时和驱动程序提供全面支持，从而提高其在不同软件环境中的整体效率和兼容性。

3、NPU 算力提升至 48TOPS

作为新一代面向笔记本电脑的 AI PC 处理器，Lunar Lake 的神经处理单元（NPU）带来了重大升级，其集成了全新的第四代 NPU 内核（NPU 4），具备 6 个 Neural Compute 引擎、12 个强化 SHAVE 数字信号处理器（DSP）与 9MB 缓存，能够提供 48 TOPS 的 AI 算力。

与上一代 NPU 3 相比，NPU 4 在增强神经处理能力和效率方面有了巨大飞跃。NPU 4 的改进主要是通过实现更高的频率、更好的电源架构和更多的引擎数量来实现的，从而赋予它更好的性能和效率。

在 NPU 4 中，这些改进在矢量性能架构中得到了增强，计算块数量更多，矩阵计算的优化性更好。这需要大量的神经处理带宽；换句话说，这对于需要超高速数据处理和实时推理的应用程序至关重要。

该架构支持 INT8 和 FP16 精度，INT8 每周期最多可进行 2048 次 MAC（乘法累加）运算，FP16 每周期最多可进行 1024 次 MAC 运算，这显然表明计算效率显著提高。

更深入地了解架构后，可以发现 NPU 4 的层次有所增加。其每个神经计算引擎都嵌入了令人难以置信的出色推理管道，包括 MAC 阵列和许多用于不同类型计算的专用 DSP。该管道专为众多并行操作而构建，从而提高了性能和效率。新的 SHAVE DSP 经过优化，矢量计算能力是上一代的四倍，可以处理更复杂的神经网络。

NPU 4 的另一项重大改进是提高了时钟速度，并引入了一个新节点，在与 NPU 3 相同的功率水平下将性能提高了一倍。这使峰值性能提高了四倍，使 NPU 4 成为要求苛刻的 AI 应用的强大引擎。新的 MAC 阵列在芯片上具有先进的数据转换功能，允许动态进行数据类型转换、融合操作和输出数据布局，从而使数据流以最小的延迟达到最佳状态。

NPU 4 的带宽改进对于处理更大的模型和数据集至关重要，尤其是在基于 Transformer 语言模型的应用程序中。该架构支持更高的数据流，从而减少瓶颈并确保即使在运行时也能顺利运行。NPU 4 的 DMA（直接内存访问）引擎将 DMA 带宽翻倍——这是提高网络性能的重要补充，也是处理重型神经网络模型的有效方法。进一步支持更多功能，包括嵌入标记化，从而扩大了 NPU 4 的潜力。

NPU 4 的另一项显著改进在于矩阵乘法和卷积运算，其中 MAC 阵列可以在单个周期内处理最多 2048 个 MAC 运算（INT8）和 1024 个 MAC 运算（FP16）。这反过来又使得 NPU 能够以更高的速度和更低的功率处理更复杂的神经网络计算。这在矢量寄存器文件的维度上产生了差异；NPU 4 的宽度为 512 位。这意味着在一个时钟周期内，可以进行更多的矢量运算；这反过来又提高了计算效率。

NPU 4 支持激活函数，现在有更多种类的激活函数可以支持和处理任何神经网络，并可选择精度来支持浮点计算，这将使计算更加精确和可靠。改进的激活函数和优化的推理管道，将使其能够以更快的速度和更高的准确度执行更复杂和更细致的神经网络模型。

NPU 4 中的 SHAVE DSP 升级，使得其矢量计算能力达到了 NPU 3 的四倍，将整体的矢量性能整体提高 12 倍。这对于转换器和大型语言模型 (LLM) 性能非常有用，使其更加快速和节能。增加每个时钟周期的矢量操作可以实现更大的矢量寄存器文件大小，从而显著提升 NPU 4 的计算能力。

总体而言，NPU 4 的性能比 NPU 3 有了大幅提升，整体的矢量性能提高了 12 倍，TOPS 算力提高了 4 倍，IP 带宽提高了 2 倍。这些改进使 NPU 4 成为高性能和高效率的 AI 解决方案，适合性能和延迟至关重要的最新 AI 和机器学习应用。这些架构改进以及数据转换和带宽改进使 NPU 4 成为管理要求极高的 AI 工作负载的顶级解决方案。

4、更好的安全技术和高速连接技术

Lunar Lake 平台的控制层还内置了安全和新一代高速连接技术。

在安全方面，拥有 Intel Partner Security（合作伙伴安全）引擎、Intel Silicon Security（硅安全）引擎、Converged Security 和 Manageability（融合安全与可管理性）引擎。

连接方面，Lunar Lake 平台则整合了最新的 Wi-Fi 7、Bluetooth 5.4 与 1GbE MAC 连接技术。

其中，集成的 Wi-Fi 7 解决方案支持多链路操作（Multi-Link Operation 或 MLO），它增加了可靠性，提高了吞吐量（支持 5.8Gbps），改善了延迟，并实现了流量分离/区分。与 BE200 网络接口相比，硅片尺寸缩小了 28%，并采用 11Gbps 的 CNVio3 接口。此外，还采用了射频干扰缓解技术，可动态调整对 Wi-Fi 性能有重大影响的 DDR 时钟频率。

英特尔还宣布与 Meta 的合作更进一步，利用这项 Wi-Fi 7 技术来增强 VR 体验。这进一步优化了视频延迟性能并减少了干扰，从而使 VR 应用更加无缝和引人入胜，至少从无线连接的角度来看是如此。Wi-Fi 7 的新增强功能提供了高、可靠的速度和低延迟，可满足 VR 应用中最具挑战性的需求。

在接口方面，Lunar Lake 提供 4 个 PCIe 5.0、4 个 PCIe 4.0、3 个整合的 Thunderbolt 4（40Gbps）、2 个 USB 3.0 与 6 个 USB 2.0 等接口。值得一提的是，Thunderbolt 4 接口通过 Thunderbolt Share 加速，可以将生产力提升到一个新水平，实现多台电脑连接。

5、3D Foveros 封装与 Scalable Fabric Gen 2 互联

Lunar Lake 以上所有的计算核心、Memory Side 缓存、安全、连接和 I/O 模块均通过英特尔的 3D Foveros 多芯片封装技术共同封装在处理器基板上，并采用 Memory On Package 封装，在 Lunar Lake 核心的旁边封装了 32GB 內存。

需要指出的是 Lunar Lake 的 32GB w/ 2 Ranks LPDDR5X 內存颗粒与处理器一同封装在基版上，每芯片可有着 8.5GT/s 的传输频宽、支持 16b x 4 信道，能够降低 40% PHY 电源并节省 250mm²的电路版面积。

Lunar Lake 的 CPU、GPU 和 NPU 计算核心则通过 Scalable Fabric Gen 2 进行互联，然后通过 D2D 直接与平台控制层的 Scalable Fabric Gen 2 连接，能够无缝的衔接计算节点、芯片层，让计算核心能有着更好的扩展性与效率。此外，借助 Home Agent 统筹整个层级的一致性（Hierarchical Coherency），包括 Memory Side 缓存、每个核心丛集中的 Coherency Agent，包括平台控制层的 I/O Coherency。

6、全新的供电设计与电源管理，综合能耗可降低 40%

在供电方面，Lunar Lake 采用了新的 4 个 PMIC 供电设计，可提供更多的供电路径、动态电压 ID 与更多的监控功能。针对 SoC 的供电使用优化达到最佳的性能效率。

在电源管理方面，集成的英特尔线程控制器专注于效率，还有针对每种负载类型优化的功率平衡器，增强的 “睡眠” 状态电源和延迟，以及基于 ML 的 WL 分类与频率控制。Thread Director（线程调度器）通过识别每个工作负载的级别并使用其能源和性能内核评分机制，帮助操作系统将线程调度到性能和效率最佳的内核上。

另外，Lunar Lake 还在众多核心芯片中加入了共享的 8MB Memory Side 缓存，可以降低 DRAM 的传输次数并节省电源，借助缓存机制让核心与 DRAM 间的延迟进一步降低并提升传输带宽。

根据英特尔公布的数据显示，得益于先进的工艺节点、新的 E-core 设计、Memory Side 缓存、供电设计、电源管理及线程调度器技术，Lunar Lake 比起上一代的 Meteor Lake 的能耗可降低 40%。

7、Lunar Lake 三季度出货，Arrow Lake 四季度推出

据介绍，目前 Lunar Lake 已有超过 80 款设计，来自 20 家 OEM 厂商，预计第三季开始出货。

英特尔还透露了未来的面向 AI PC 的移动处理器构架，今年第四季将推出面向桌面端的 Arrow Lake，明年将会推出采用 Intel 18A 的 Panther Lake，2026 年后还会有后续新产品。

小结：综合 AI 算力高达 120 TOPS

从 Lunar Lake 的内部的各个核心来看，相对于上代的 Meteor Lake，无疑是带来了重大的升级，不仅 CPU 核心将 Lion Cove P 核与 Skymont E 核集成在一起，还带了最新的 Xe2-LPG GPU 架构，以及新一代的 NPU 4 内核，带来了领先的 AI 性能。

结合 CPU、GPU 和 NPU 所提供的 AI 算力，使得整个 Lunar Lake 平台的 AI 总算力达到了 120 TOPS，凸显了英特尔在 AI 方面的投资。其中，CPU 可通过 VNNI 与 AVX 指令提供 5 TOPS 的算力，驱动轻度 AI 工作；GPU 提供的 67 TOPS 算力则通过 XMX 与 DP4a 提供游戏与创作所需的 AI 性能；NPU 提供的 48 TOPS 算力能够处理密集向量与矩阵运算，提供 AI 辅助与创作等功能。

作为对比，高通骁龙 X Elite 的 NPU 的算力为 45TOPS，苹果 M4 的 NPU 的算力只有 38TOPS，虽然 AMD 最新推出的 AI PC 芯片——锐龙 AI 300 系列集成的 AMD 第三代 NPU 内核的 AI 算力提升到 50TOPS，英特尔 Lunar Lake 的 NPU 内核的 AI 算力 48TOPS 略低，但是依然是大幅超过了微软对于 Copilot+ PC 的最低 NPU 算力 40TOPS 的需求门槛，并且英特尔更专注于提供更高的综合的 AI 算力，即通过 AI 引擎结合 NPU、CPU 和 GPU，将综合 AI 算力提高到了 120TOPS，达到了上代 Meteor Lake 的接近 3 倍，这样的提升幅度不可谓不高。

特别值得一提的是，Lunar Lake 还带来了供电和电源管理方面的大幅改进，结合更先进的工艺节点、CPU 计算核心等在能效方面的改进，使得 Lunar Lake 比起上一代的 Meteor Lake 的能耗大幅降低，更适合于移动设备。

根据英特尔披露的数据显示，Lunar Lake 的 GPU 性能提升 50%、NPU 内核的 AI 算力增加了四倍、SoC 耗电量减少 40%、GPU AI 算力增加 3.5 倍，整个 SoC 的算力超过了 120TOPS。

总结来说，Lunar Lake 相比上代的 Meteor Lake 带来了巨大的性能提升，特别是在 AI 能力方面，同时也带来了更高的能效和更低的功耗。相对于其他的 AI PC 芯片竞品来说，依然有着不小的优势。

英特尔 CEO 基辛格在演讲当中也表示，非常看好 AI PC 的发展，目前已有超过 800 万台搭载英特尔—Core Ultra 处理器的 AI PC 出货，显示 AI PC 时代已然来临。

同时基辛格还预计今年基于英特尔芯片的 AI PC 出货将达到 4500 万台，在 2028 年时，搭载 AI 功能的 PC 在所有 PC 当中的占比将达到 80% 的水平。而英特尔拥有 300 多个 AI 加速功能、500 多个人工智能模型，当 AI PC 进入市场时，英特尔已经拥有了完整的 AI PC 生态系统。

显然，随着 Lunar Lake 的推出，将有助于进一步增强英特尔在 AI PC 芯片市场的竞争力。不过，Lunar Lake 的具体市场表现如何，还有待观察。

谈到对 Windows on Arm 是否影响市占，Gelsinger 认为，这不是第一个 Windows on Arm 的产品发布，x86 市占率仍维持领先，目前还没明确诱因促使消费者从 x86 平台转换到 Arm 平台，也还没看到类似产品能取代 x86 既有构架，认为消费者需要有改变的理由，加上新推出的 Lunar Lake 拥有最好显卡，并不怕市占受影响。

被问到是否视高通为对手？Gelsinger 笑说欢迎高通推出自家产品进入市场，因为这有助于更快创造整个市场，不过对自己很有自信，目前出货量已经售 100 万台，从这角度看，表现比高通昨天呈现的 Snapdragon X Elite 更优秀。此外，从 Lunar Lake 到下一代 Panther Lake，英特尔是打造自家生态系，是全新的篇章，在整个 AI 也很难被取代。

Gelsinger 指出，下半年客户购买 Lunar Lake 的 PC 会相当有感，相信也会和高通产品做比较，未来会有更多跑分等信息出现。

目前英特尔积极扩展海外制造，在美国也有多项半导体建设。Gelsinger 认为英特尔、三星、台积电在美国布局，显示美国芯片产业将有很大发展，研调机构也预期美国在半导体的影响力从 10% 增加至 2030 年的 20%，相信会有很大动能的发展。英特尔在演讲中不断赞扬台积电在 Lunar Lake 及与联电的合作，显示重视台湾生态系，但全球需要更平衡的供应链，相信现在正在成形中。

被美国限制出口限制，是否可能让中国加速芯片开发？Gelsinger 坦言，芯片禁令如同一条魔术界线（magic line），限制太强确实促使中国打造自研芯片，的确伤害出口市场，因此要小心平衡，英特尔要确保这方面能符合全球生态系伙伴的期待。同时英特尔也会持续出口产品到中国，像中国技术受到限制，随着制程达到 2 纳米以下，英特尔这部分在中国市场仍具吸引力。

另一个记者询问为何 Pat Gelsinger 不去韩国？他响应这次旅程没到韩国，但之后将再造访韩国，与当地科技厂、客户有密切关系，因为韩国对英特尔绝对有举足轻重的重要性。

文章来源：芯智讯，原文标题：《台积电代工！Intel 新 AI PC 芯片 Lunar Lake 发布：AI 算力 120TOPS！》