高通发布面向智能体AI时代的数据中心技术路线图,推出全新高通飞龙产品组合
高通在投资者日活动上宣布发布全新数据中心解决方案,进一步强化构建面向AI优化的全栈数据中心基础设施领域的布局。
高通全新平台解决方案的发布,将进一步强化构建面向AI优化的全栈数据中心基础设施领域的布局。
0
科客点评:高通全新平台解决方案的发布,将进一步强化构建面向AI优化的全栈数据中心基础设施领域的布局。
2026年6月25日,纽约——高通技术公司(NASDAQ:QCOM)今日在投资者日活动上宣布发布全新数据中心解决方案,涵盖高通飞龙™ C1000 CPU、高通® 高带宽计算(HBC)技术、高通飞龙™ AI300推理加速器、连接产品及定制芯片解决方案。所有产品均旨在实现最大化每瓦特性能与Token吞吐能力,同时降低客户总体拥有成本。全新平台进一步强化了高通技术公司在构建面向AI优化的全栈数据中心基础设施领域的布局,覆盖面向智能体与数据中心级别的CPU、AI推理加速器、高带宽光电互联及规模化高性能定制芯片解决方案。此前高通已推出高通飞龙AI200与AI250,高通飞龙AI300将正式纳入这一数据中心解决方案产品组合,AI加速器技术路线图以年度为迭代周期。

高通公司总裁兼CEO安蒙表示:“智能体AI正在推动数据中心AI推理需求的大幅增长。随着智能体AI成为主流工作负载,基础设施必须在更低功耗、更低成本的前提下实现更高性能。这正契合高通的技术优势,我们已为这一转变做好充分准备。依托高通飞龙,我们将高性能低功耗计算能力引入数据中心市场,并与多家领先客户签订多年、多代合作协议。”
面向超大规模云服务商打造的推理优先平台
高通技术公司依托数十年在系统级芯片、低功耗设计、高性能处理和领先IP方面的深厚技术积累,以及超过400亿组件的工程经验,构建分布式机架级AI基础设施,专为超大规模场景下的智能体密集型数据中心级AI推理负载而设计。这些创新将显著优化词元(Token)经济性、同时降低时延、简化集成,并支持规模化部署,从而进一步降低总体拥有成本。面对智能体AI带来的Token需求的大幅增长,高通技术公司的解决方案将持续优化每瓦特下Token吞吐量,成为降低总体拥有成本(TCO)的关键驱动因素。
高通技术公司执行副总裁兼数据中心业务总经理Tony Pialis表示:“企业的当前需求早已超越单一硬件组件,如何在分布式、始终在线的基础设施上,实现多类型算力的规划,正变得至关重要。借助高通飞龙,我们将计算、AI、内存与连接整合到一个统一的机架级平台中,专为日益复杂的智能体驱动工作负载设计,并解决了内存带宽和功耗的关键瓶颈。得益于高通技术公司在高性能、低功耗规模化计算方面的数十年技术积累,我们能够为数据中心领域带来行业内少有企业能够比肩的能力。”
从芯片到机架:分布式、机架级AI推理平台

高通飞龙C1000 CPU
专为数据中心打造的CPU,能够为智能体、通用型和AI管理节点工作负载提供领先的性能表现和资源利用效率,同时具备同档产品中最佳的能效和总体拥有成本。
Qualcomm Oryon™ CPU核心采用定制化设计,针对核心性能和5GHz以上的频率进行优化,能够为规模化部署的智能体工作负载提供卓越性能。
采用超过250核的核心设计,提供卓越的吞吐能力和扩展性,同时保持出色的单核性能。
根据规格参数预估,每瓦特性能较现有服务器CPU竞品的基准数据提升超过2倍。
整套架构经过专门规划设计,面向关键数据中心业务场景提供最佳吞吐性能、响应速度和基础设施利用率;同时降低资本支出与运营成本,从而在规模化部署环境下,实现行业领先的单位TCO性能表现。
采用多芯粒互联架构,并结合先进的封装工艺实现模块化集成,支持性能和IO扩展,适配数据中心领域从通用处理到AI CPU的需求。
支持速率高达2TB/s的领先PCIe 7.0连接和CXL连接技术,可支持下一代加速器、高速网络和存储,以及分布式内存架构。
内存子系统采用行业领先的低功耗内存技术,带来超高带宽、大容量、低时延和卓越的能效表现。
基于CPU的推理任务可选配搭载HBC扩展。
搭载先进的RAS(可靠性、可用性、可维护性)特性,支持ECC纠错、故障隔离与错误恢复,保障大规模部署下的稳定可靠运行。
同时支持风冷与液冷散热方案,可适配各类数据中心部署环境,机架与服务器均符合OCP ORv3标准。
CPU产品组合包括:智能体CPU,面向高吞吐智能体调度规划、低时延交互式AI用例;通用CPU,针对自有业务负载实现最优单位TCO性能,面向第三方弹性业务提供最优单位虚拟CPU性能;AI CPU,专为最大化生成式AI计算场景中的XPU利用率而设计。
预计于2028年实现商用。
高通高带宽计算(HBC)技术
采用创新的专用近存计算架构,通过3D堆叠硅基解决方案将计算与超高速带宽内存相融合,解决AI计算中的数据搬运瓶颈。
高通HBC技术具备多代际演进的技术路线图,相较高带宽内存(HBM),可实现更快速、更高效、扩展性更强的处理能力,在降低总体拥有成本的同时实现更高能效。
搭载第一代HBC技术的AI250,单卡可实现业界领先的133TB/s带宽速率,与采用LPDDR5X的AI200相比,有效内存带宽提升18倍;搭载第二代HBC技术的AI300进一步实现阶梯式性能跃升,有效内存带宽较AI200提升54倍。
与竞品已公布的板卡级标准化产品参数相比,HBC技术支持的每瓦特带宽相比HBM技术提升6倍。
与竞品已公布的机架级标准化产品参数相比,HBC技术支持的每瓦特存储容量为静态随机存取存储器(SRAM)技术的200倍。
HBC技术旨在支持AI智能体实现高效规模化扩展,满足对持续推理、内存带宽和实时响应的需求。
我们与供应链的战略合作关系以及独特的实现路径,解决了近存计算带来的复杂性问题,这得益于高通领先的3D堆叠、系统级设计、LPDDR控制器以及能效设计技术专长。
搭载第一代HBC技术的AI250预计将于2027年年中实现商用出样。
高通飞龙AI300(加速卡/机架级产品)

高通飞龙AI300支持风冷与直液冷散热,是继AI200、AI250之后推出的第三代机架级AI推理平台。
AI300集成突破性的第二代高通HBC技术以实现计算加速,支持集成内存和更高的有效内存带宽,面向分布式推理部署设计(AI250搭载第一代HBC技术)。
AI300支持行业领先的内存容量与有效带宽,为大语言模型和多模态大模型(LLM、LMM)推理及智能体AI工作负载提供高吞吐量、低时延性能。
与现有的基于GPU的架构相比,在单卡每瓦特内存带宽方面,AI300的每瓦特性能预计可实现4至8倍的提升。
可支持通过UALink(超加速器链路)与ESUN(以太网纵向扩展网络)进行纵向扩展;支持基于铜缆与光缆的横向扩展。
预计将于2028年商用出样。
定制芯片
面向下一代AI与云数据中心基础设施,规模化提供客户定制芯片。
面向智能体AI及其他专用工作负载,提供定制化专属芯片。
具备跨芯片、系统和软件的端到端协同设计能力,满足客户差异化的性能、功耗与集成需求。
先进封装与模块化架构设计,旨在提升性能、能效与可扩展性。
业经验证的IP和高效设计流程,可助力加速产品上市周期,降低执行风险。
基于生态系统与供应链合作伙伴关系,支持从设计到大规模量产的全流程交付。
连接技术
面向下一代AI数据中心的广泛连接技术组合,涵盖Die-to-Die芯片互联、铜缆连接、光互联及园区级长距互联。
支持800G和1.6T高带宽连接、可适配光模块、有源光缆(AOC)、有源电缆(AEC)应用场景,覆盖数据中心内部链路至最远20公里的园区级部署。
集成高通技术公司的串行解串器(SerDes)、四电平脉冲幅度调制(PAM4)、轻量化相干数字信号处理器(DSP)、信号完整性与遥测技术,支撑可扩展、高性能AI基础设施。
解决数据传输瓶颈。随着分布式、解耦式、带宽密集型基础设施的发展,这一瓶颈是制约AI数据中心性能的核心痛点。
全生态合作布局
除全新的高通飞龙数据中心产品组合外,高通技术公司今日宣布与Meta达成多年、多代合作协议。
高通技术公司与Meta今日宣布达成战略合作协议,高通技术公司将成为Meta数据中心多代CPU的供应商。Meta下一代服务器集群计划搭载高通技术公司的数据中心CPU——高通飞龙™ C1000,彰显了在大规模横向扩展部署场景中,高性能、高能效计算的重要性日益提升。
此外,全球超35家科技与AI生态领军企业也分享了对高通技术公司数据中心愿景和商用解决方案的支持,包括爱德万测试、Arista、Astera、Cirrascale、仁宝电脑、Confidential Core AI、Core42、台达、Fibercop、富士康、技嘉科技、HUMAIN、英业达、IONOS、联想、Master Works、Microchip Technology、美光、南亚科技、NEC、NeuReality、广达电脑、和硕联合科技、三星SDS、Saptiva AI、SK海力士美国、Supermicro、泰瑞达、TeraHop、联华电子、VAST Data、Viettel IDC、VNPT集团和纬创。点击此处查看生态合作伙伴引言。
高通技术公司致力于推进面向数据中心的多代产品技术路线图,并以年度为迭代周期持续演进,聚焦提升AI推理性能、优化能效、降低总体拥有成本(TCO)。添加科客公众号kekebat,获取更多精彩资讯。
注:转载文章,不代表本站赞同其观点和对其真实性负责,本站不承担此类稿件侵权行为的连带责任。如版权持有者对所转载文章有异议,请与我们联系。
