字节跳动被曝自研 CPU,应对 AI 服务器芯片短缺

据路透社报道,字节跳动正在开发自研 CPU,以支撑其日益增长的 AI 基础设施需求。三位知情人士透露,因英特尔和 AMD 服务器 CPU 近几个月每季度涨价 10% 至 35%,且交付周期长达半年,字节跳动已加速推进自研替代方案。

CPU 与数据中心

该芯片将部署在字节跳动自有服务器和数据中心,用于内部运行,并为 Coze 等 AI 代理产品的大规模推广做准备。项目目前仍处早期阶段,字节跳动正同时探索 Arm 和 RISC-V 两种架构,并已接触外部合作伙伴协助设计与代工制造。

供需失衡驱动自研

AI 行业正从训练阶段转向推理部署,这一转变对 CPU 需求产生了深远影响。推理场景中,任务调度、数据预处理、API 网关、数据库查询等大量工作仍依赖 CPU 完成,GPU 无法完全替代。随着推理工作负载激增,CPU 在 AI 基础设施中的地位被重新评估。

在此背景下,英特尔和 AMD 的服务器 CPU 出现了严重的供需失衡。价格上涨和交付延迟迫使大型科技公司重新审视供应链策略。谷歌推出了 Axion 处理器,亚马逊推出了 Graviton 系列,微软也在定制 ARM 服务器芯片。自研芯片正从"可选项"变为"必选项"。

字节跳动的芯片布局

字节跳动的芯片业务始于 2020 年,经过数年发展已形成四大产品线:用于豆包大模型推理的 AI 芯片、面向数据中心通用计算的服务器 CPU、服务于视频解码与内容审核的 VPU,以及专注于数据中心网络优化的 DPU。芯片团队规模已超过千人,其中 AI 芯片方向超过 500 人,CPU 团队约 200 人。

代号 SeedChip 的 AI 推理芯片计划于 2026 年 3 月底前获得首批出样,目标年内量产至少 10 万颗,逐步提升至 35 万颗。此外,字节跳动还在 5 月 27 日与高通达成协议,计划采购数百万颗 AI ASIC 芯片,高通将协助把字节跳动已完成的自研芯片设计转化为可量产的半导体产品。

字节跳动 2026 年计划投入超过 2000 亿元人民币用于 AI 领域,其中相当大比例用于 AI 处理器采购与研发。这一投入规模反映了公司对 AI 基础设施的高度重视。

双架构策略

同时探索 Arm 和 RISC-V 两种架构是字节跳动自研 CPU 的一大特点。Arm 架构在服务器领域已有成熟生态(亚马逊 Graviton 是成功范例),而 RISC-V 作为开源指令集架构,长期来看能够提供更大的自主可控空间。两条路线并行,既降低了对单一架构的依赖风险,也为未来技术路线的最终选择保留了灵活性。

不过,自研 CPU 从设计到规模化部署通常需要 3-5 年周期。在此期间,字节跳动仍需依赖外部供应商满足算力需求。与高通的合作在一定程度上弥补了这一空窗期。

行业趋势

字节的行动是全球科技巨头芯片自研潮的一部分。当 AI 基础设施的年度投入达到数千亿元级别,核心芯片全部依赖外部供应商的结构性风险将不可接受。自研芯片从一开始就不仅是技术选择,而是成本和供应链安全的刚性约束。

来源:Reuters

相关推荐