
欧洲杯体育
智东西
作家 | 程茜剪辑 | 漠影智东西4月29日报说念,昨日下昼,阿里平头哥旗下首款智能网卡产物磐脉920厚爱发布,该产物发布即量产,并起首在阿里云数据中心部署。
这是AI算力海浪下,平头哥在AI基础设施收集边界的关键落子。
磐脉920的几项性能参数也颇有代表性:遴选全自研ASIC芯片架构,国内首个内置PCIe Switch的400G智能网卡,支握多旅途RDMA,最大支握400Gbps蒙胧带宽,可在万卡智算集群、通算集群、高性能存储场景部署。

▲磐脉920
这些性能都指向了当下AI基础设施中的关键一环——数据传输。
大模子正从单一大参数基座走向超大模子、多模态交融、长陡立文、端边云协同、Agent范围化、及时推理的演进阶梯,模子参数暴涨、陡立文窗口扩容、考试数据量级指数级增长、推理并发需求爆发,算力、存力、网力不再是配套基础设施,而是决定大模子性能上限、落地本钱、迭代速率与产业范围化的三大中枢底座,三者互为敛迹、统筹兼顾。
这次磐脉920的发布,也意味着平头哥完成了算网存的全栈布局。
一、平头哥首款自研智能网卡亮相,买通低时延互联壁垒模子参数范围迈向万亿级、AI谋略集群范围突破万卡,通讯瓶颈已成为制约算力发展的中枢难题,高性能互联更成为AI基础设施的刚需。
但值得可贵的是,AI考试与推理两大中枢场景,对收集及网卡的性能需求存在显耀各异,传统企业级网卡已难以适配其严苛条款。
在AI考试场景,考试任务经常需要数千张以至上万张GPU同期协同运算,不仅要高频、大都量传输考试数据,还要保证通盘节点同步完成数据搬运与谋略任务。而通盘集群的开动后果会受限于全网最慢节点,也就是说即便多数GPU谋略、传输速率出众,唯有存在一处慢速链路或节点,通盘任务就需恭候其完成,会牵累后果。
反不雅AI推理场景,其无需高强度同步合作,但中枢诉求集中在小包高并发、低反当令延,且流量具有较着突发性。同期,推理场景中夹杂流量并存,各种流量在时延明锐度、带宽需求、突发性情上各异显耀,这就条款智能收集既能已矣低时延、高可靠传输,又能兼顾全网流量的高效平衡转发。
平头哥产物总监李旭慧涌现,若收集架构、网卡性能及传输挽救未作念好优化就会出现算力挥霍,高端GPU的现实诳骗率经常较低,会导致巨额高性能算力闲置。
正因如斯,高性能网卡的不毛性无庸赘述。而行为平头哥首款产物,磐脉920的性能参数也相配过硬。
磐脉920支握PCIe 5.0和112G PAM4,提供最大400Gbps蒙胧带宽,收发包率超400Mpps,具有512个超线程中枢,搭建高效可编程平台;同期集成芯片级收集架构、内置PCIe Switch。

硬核主义对应的恰是磐脉920超低时延互联、多旅途喷洒与传输知晓性、细粒度拥塞收敛才气、强适配通用性四大上风,以匹配AI训推场景需求。
起首在时延层面,磐脉920依托内置PCIe Switch,能或者传统网卡的物理门径,确保网卡以极低时延直连GPU和SSD,减少对外部交换芯片的依赖,使系统本钱诽谤30%。
其次是多旅途喷洒与传输知晓性,其支握多旅途RDMA突破了传统RDMA依赖单一说念径的本领门径,可灵验裁汰训推任务完成期间。李旭慧称,他们里面实测的数据夸耀,基于磐脉920现实考试和推理的完成期间训诲了14%。
第三是纯真拥塞收敛才气,其通过集成细粒度收集感知技能和用户可编程拥塞收敛算法,通达自界说API,可适配智算、通算等不同收集环境部署,在微秒级拥塞反应和聘请性重传布局下,能保证通讯知晓。
终末是强适配通用性,磐脉920是半高半长单宽的圭臬尺寸,能适配各式主流管事器、兼容主流操作系统和通讯库,作念到即插即用。
在应用方面,它能为政企、云厂商、AI企业等客户,提供高带宽、低时延、高可靠、可纯真定制的收集加快才气,灵验诽谤算力集群通讯损耗、削减举座运维本钱;另一方面,其直面大模子考试、智算集群互联、多模态推理、散布式超算等高速增长的AI中枢场景,为其增长提供了更高效且具性价比的惩处决策。
二、补皆AI网力关键一环,算存网全链路自研算力与收集的磋议密不行分,二者相得益彰、统筹兼顾。
李旭慧作念了形象的比方,若是把算力比作AI时期的石油,网力则是输油管说念,算力提供能源,网力保险后果,二者协同才气开释灵验算力。但当下在AI算力产业中“收集拖了后腿”。
如今一个很较着的产业趋势是,AI算力要点从考试单边主导向考试+推理共同驱动,且推理需求已显耀跨越考试。
折柳于考试,智能体驱动下的推理业务,夹杂流量场景会愈发复杂,对收集的详尽挽救才气条款大幅训诲。传统TCP网卡盛大依赖内核转发架构,数据搬运转发支拨大、性能瓶颈较着,单路现实灵验蒙胧才气受限,而智能体业务自然具备交互经常、链路复杂、数据流转量大的特质,会进一步放大传统网卡的短板。
在这么的判断下,下一代AI收集,需要打造大带宽、低时延的高性能网卡决策,才气邻接握续飞腾的业务需求,同期联动算力、存力协同发力,共建新一代一体化AI基础设施体系。
与绝大多责怪寞芯片公司和互联网公司芯片业务不同,平头哥已完成了算力、存力、网力的全布局。当今其已推出真武系列AI芯片、倚天系列Arm管事器CPU、磐脉系列智能网卡、镇岳系列存储主控芯片四大数据中心中枢芯片,变成完好的底层芯片矩阵。

这一产物矩阵已变成明晰的单干体系:算力芯片为AI考试、通用谋略提供中枢肠能因循,存储芯片保险海量数据高速读写与知晓存储,智能网卡则专攻高速通讯传输难题。而更具想象力的是,往时这三大产物还可协同优化,提供更有竞争力的基础设施惩处决策。
三、阿里“通云哥”打造全栈AI,产业价值已显现从芯片、云管事到大模子,阿里一直在构建全栈AI上风。
这一布局的底层逻辑,是专家科技赛说念行业巨头竞争范式的迭代升级。单纯依靠单项本领上风的时期已然拆伙,拔旗易帜的是全链条协同布局的角逐,隐敝底层中枢芯片、基础硬件设施、大模子,直至云管事,全栈详尽实力正成为中枢竞争的关键分水岭。
而行为国内科技企业的代表,阿里一经把通义大模子功绩部、阿里云和平头哥构成的阿里巴巴AI黄金三角“通云哥”,打造为一台AI超等谋略机。
正如李旭慧所说,平头哥布局磐脉920的中枢想路,永恒围绕AI全栈惩处决策的落地需求伸开:但凡制约举座算力性能的关键门径,就是重点布局的地方。
自研芯片侧,平头哥在算力、存力和网力三大边界均已矣了业界最初水平,举例,其“真武”PPU已成为出货量最高的国产GPU之一。
大模子边界,2023年8月起,千问系列模子的编程和Agent才气稳居国内第一梯队,是千行百业广博头部企业的首选模子。
云管事方面,阿里云已置身专家头部阵营。本年4月,Gartner发布的《2025年专家IaaS公有云管事市集份额》禀报夸耀,2025年中国IaaS市集阿里云以32.8%的份额位居第一,较2024年的30.1%训诲2.7个百分点。

▲Gartner专家IaaS公有云管事市集份额禀报
如今,阿里“通云哥”三位一体的布局全面成型,变成研发、考据、迭代到生意化落地的良性轮回,回避传统各门径寥落联想、不祥说合的本领景观,通非凡重脚轻紊、双向赋能的闭环效应,构筑起芯片适配模子、平台承载芯模、三者双向优化的深度适配关系。
放眼专家欧洲杯体育,能作念到芯片、云、大模子三者的相互优化协的公司寥寥可数,而这亦然阿里在专家AI产业竞争中的中枢壁垒。
