面向Agentic时代,阿里云“芯-云-模型-推理”全面升级!
创始人
2026-05-21 13:51:20
0

Agentic时代

阿里云全栈就绪!

“芯-云-模型-推理”重磅发布

这是行业首次围绕Agent进行全栈产品发布。阿里云资深副总裁刘伟光在峰会上表示,Agent突破临界点之后可以24小时不间断工作,对AI和云的需求无穷无尽。阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的AI工厂。

01

基于真武AI芯片的超节点服务器

峰会上,阿里发布基于新一代AI芯片真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0,可让128张AI芯片组成一台计算机,P2P时延低于150ns,主打解决Agent场景下的海量并发推理和大模型训练需求。

首次亮相的真武M890采用自研并行计算架构,内置144GB显存,性能是真武810E的3倍,片间互联带宽达到800GB/s,芯片原生支持FP32到FP4等多种数据精度,可应用于高精度训练、低精度和超低精度推理的全场景,低精度推理场景下,不仅可以保证模型输出质量,还能显著降低单次推理的算力开销。

平头哥同时首次公布了真武系列芯片的路线规划:未来两年将陆续推出算力更强的真武V900、真武J900两代芯片。目前真武系列AI芯片累计出货56万片,已服务中国电信、中国一汽、浦发银行等20多个行业的400多家客户。

平头哥半导体副总裁高慧表示,Agentic时代,一个Agent在执行任务时可能在毫秒间连续发起数十次模型调用,同时需要CPU、GPU、网络和存储等核心部件紧密协同。平头哥构建全栈自研芯片矩阵,核心就是希望实现算力、网力、存力的系统级协同,让每一个Agent都能流畅、稳定运行。

02

全面迈入Agentic Cloud

Agent时代的云,不再只是被人类调用的资源池,而是Agent自主决策、自主执行的运行环境。为此,阿里云对云产品进行了Skill化、MCP化和CLI化改造,让每一个云产品都变成Agent可以“像调函数一样调用”的标准化能力模块。

阿里云首席技术官李飞飞认为,传统云产品的交互逻辑是为人设计的——用户看着控制台点击按钮,或者通过API编写代码调用。但Agent工作负载是“无规律弹性、短生命周期、瞬时起量即走”,与传统云计算的稳态负载截然不同。

对此,阿里云为Agent构建了完整的运行环境支撑,提供轻量高效的沙箱执行环境、多Agent协同能力、跨任务的记忆能力、顺畅的数据流转通路,以及全域智能运维能力。

03

Qwen3.7-Max国产第一

胜任35小时长程任务

在模型层,阿里巴巴发布全新一代千问旗舰模型Qwen3.7-Max。在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max位列国产模型第一,对标全球最强模型。

Qwen3.7-Max面向Agent全新设计,在编程、推理等核心能力上持续突破,可胜任复杂编程、多智能体协作、生产级办公自动化等高难度任务。

一个典型案例是:在训练时从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作35小时,独立完成了一个生产级AI计算内核的编写与调优,最终性能较官方版本提升10倍。

阿里巴巴通义大模型事业部负责人周靖人表示:“大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。”

近3个月内,千问旗舰大模型已稳定迭代3.5、3.6、3.7三个版本,持续抬高国产模型的性能上限。

04

百炼推理平台实现极致弹性

在百炼推理平台,阿里巴巴构建了大规模GPU资源集群,并通过并池调度实现资源高效利用。在此基础上,百炼通过上下文缓存消除重复计算,借助吞吐弹性调度机制应对流量波峰波谷与负载波动。在效果优化方面,百炼引入了Agentic RL,基于Agent执行反馈的强化学习机制,驱动模型持续迭代。此外,百炼内建了安全治理能力,确保自主运行的Agent始终不越界。

在生态策略上,百炼保持开放接入。除了阿里自研的千问模型矩阵,平台还将接入智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可灵、Vidu Q3等第三方模型。

05

千问云:Agentic时代的新入口

全栈升级之外,阿里云还发布了为Agent而生的全新AI产品官网“千问云”(www.qianwenai.com),提供Qwen、GLM、Kimi、DeepSeek、Wan、HappyHorse等150多款主流模型API,并将模型服务的核心能力封装为Skills和CLI工具,可让Agent工具高效地用模型和开发AI应用。

阿里云资深副总裁刘伟光表示,过去模型服务平台为人服务,未来用模型的主力将是Agent,千问云正在全面重构模型服务平台,为开发者和Agent提供更友好的体验。

来源:阿里云

相关内容

开盘大跌!半导体龙头 ,突...
今日(5月21日),A股市场主要指数集体高开,科创50指数、创业板...
2026-05-21 14:53:49
半导体设备股反复走强 盛剑...
半导体设备股反复走强, 盛剑科技2连板, 联动科技涨超10%, 芯...
2026-05-21 14:51:29
半导体板块短线走低,上海合...
半导体板块短线走低,上海合晶跌超10%,东芯股份跌超8%,赛微电子...
2026-05-21 14:48:57
半导体设备板块持续拉升,北...
每经AI快讯,5月21日,半导体设备板块持续拉升,北方华创逼近涨停...
2026-05-21 14:43:28
长鑫科技IPO上会在即!科...
截至10:38,科创半导体ETF华夏(588170)上涨2.17%...
2026-05-21 14:39:42
半导体板块领涨
扬子晚报网5月21日讯(记者 范晓林)今天是周四,昨天利仁科技8连...
2026-05-21 14:39:01
告别铜线束缚!英特尔玻璃基...
5月21日消息,据报道,英特尔在2026年光纤通信大会现场展示了首...
2026-05-21 14:38:13
北京市医药健康可信数据空间...
5月20日,在2026腾讯云融合创新峰会上,中关村科学城数据集团总...
2026-05-21 14:37:37
平头哥真武芯片已出货56万...
【大河财立方 记者 陈薇 文图】5月20日,在2026阿里云峰会上...
2026-05-21 14:35:28

热门资讯

半导体板块短线走低,上海合晶跌... 半导体板块短线走低,上海合晶跌超10%,东芯股份跌超8%,赛微电子、利扬芯片、大为股份等跟跌。
半导体设备板块持续拉升,北方华... 每经AI快讯,5月21日,半导体设备板块持续拉升,北方华创逼近涨停,长川科技、中微公司、芯源微、联动...
半导体板块领涨 扬子晚报网5月21日讯(记者 范晓林)今天是周四,昨天利仁科技8连板,威龙股份6连板,达实智能4连板...
告别铜线束缚!英特尔玻璃基板实... 5月21日消息,据报道,英特尔在2026年光纤通信大会现场展示了首批基于玻璃芯基板的芯片原型机。该原...
AI芯片真武M890亮相,覆盖... 2026年5月20日,截至14:13,上证科创板芯片指数(000685)强势上涨3.79%,成分股中...
算力高景气叠加存储芯片涨价,科... 5月21日,截至10:30,科创芯片指数上涨2.62%。 热门ETF方面,科创芯片ETF易方达(58...
港股异动 | PCB概念股涨幅... 智通财经获悉,PCB概念股涨幅居前,截至发稿,大族数控(03200)涨8.21%,报178港元。广合...
国金证券:GB300推动超级电... 国金证券发布观点称:AIDC算力密度跃迁驱动供电架构变革,超级电容成为结构性必需品。AI负载从稳态转...
光电共封装CPO板块5月20日... 证券之星消息,5月20日光电共封装CPO板块较上一交易日上涨1.33%,沃格光电领涨。当日上证指数报...