新型AI芯片能耗重大突破,已登Nature子刊
创始人
2025-11-25 14:08:52
0

该研究由来自香港大学、香港科技大学和西电杭州研究院的团队共同完成。论文第一作者为香港大学博士生洪海桥。香港大学的刘正午博士、李灿教授和黄毅(Ngai Wong)教授为共同通讯作者,合作者还包括张薇教授(港科大)、毛伟教授(西电)等。

AI 浪潮席卷全球,但算力功耗的 “电费焦虑” 也随之而来。传统冯・诺依曼架构下,数据在 CPU 和内存间 “疲于奔命”,消耗了大量能量。

存算一体(Compute-in-memory, CIM)技术被寄予厚望。它直接在内存里 “算”,通过在模拟域执行高效的乘加运算,被视为消除数据搬运瓶颈的终极方案之一。

但,这只是故事的一半。模拟计算的结果,最终必须通过 “翻译官”—— 模数转换器(ADC)—— 变回数字信号,才能进行后续处理。

然而这个 “翻译官” 的开销,却成了新的 “拦路虎”。

在一篇新发表于《自然・通讯》(Nature Communications)的研究中,来自香港大学、香港科技大学和西电杭州研究院的团队指出,在先进的存算一体系统中,ADC 可能消耗高达 87% 的总能量和 75% 的芯片面积!

  • 论文《Memristor-based adaptive analog-to-digital conversion for efficient and accurate compute-in-memory》
  • 论文链接:https://www.nature.com/articles/s41467-025-65233-w

这个占据绝对大头的能耗组件,几乎抵消了存算一体本应带来的巨大能效优势,成了整个架构中最亟待解决的瓶颈。

英雄的隐痛:为什么存算一体绕不开 ADC?

要理解这个瓶颈,我们得先看 AI 到底在 “算什么”。

正如《Nature》上的一篇综述(Lanza 等人,2025)所指出的,AI 应用的核心是海量的向量矩阵乘法。传统架构(如 CPU)必须将这些运算分解成无数个单独的步骤,在内存和处理器之间来回倒腾数据。这个过程极其低效:Lanza 等人的文章分析,数据传输带来的能耗可能是计算本身的 200 倍,并带来巨大的延迟。

存算一体通过在内存阵列(例如忆阻器)中直接利用物理定律(如欧姆定律和基尔霍夫定律)并行完成 VMM,完美解决了这个问题。

但魔鬼藏在细节中。模拟计算的结果是连续的电流或电压,而数字世界只认 0 和 1。ADC 就是这个翻译官。问题是,这个来自传统混合信号领域的 “翻译官”,他的工作方式极其 “一刀切”,在这种新型 AI 芯片中格格不入。

传统 ADC 采用的是 “均匀量化”(Uniform Quantization)。无论信号长什么样,都用一组固定的、等距的量化边界去 “切割”。

但这和神经网络的实际情况完全不符。研究人员展示,不同网络层的输出信号分布千差万别(如上图 Conv 1, 2, 3 所示),有的像正态分布,有的则是偏态或局部均匀的。用一套固定的边界去衡量千变万化的计算信号,必然导致在信号密集的区域 “分不清”,在信号稀疏的区域又 “浪费” 了边界,结果就是精度严重损失,AI 芯片推理效果不尽人意。

为了弥补这种损失,设计者被迫使用更高精度的 ADC(即更密集的边界),但这又会导致 ADC 的硬件开销(功耗和面积)呈指数级暴涨,陷入了恶性循环。

让量化边界学会自适应

既然固定的边界不行,那让它 “活动” 起来不就好了吗?

港大团队的思路是:既然你是固定的,那我就把你变成 “活” 的。他们看中了 “忆阻器”(Memristor)。

忆阻器是一种神奇的纳米器件,它的电阻值不是固定的,而是可以通过施加电压来编程,并且断电后也能 “记住” 这个状态。

简单的融合替换难以产生突破性的作用,团队利用忆阻器设计了一种全新的 “量化单元”(Q-cell),它本质上是一个模拟内容可寻址存储器。通过改变忆阻器的电阻值,研究人员可以在硬件上随意编程设置 ADC 的量化边界。

这样一来,ADC 就能 “看菜下碟”:

研究团队使用算法(如 Lloyd-Max)先分析 AI 模型每一层输出的数据到底长什么样,然后寻找出一套最优的、非均匀的量化边界,最后再通过忆阻器把这套 “定制边界” 写入硬件。

不止是 “量体裁衣”,更是 “瘦身革命”

这种 “量体裁衣” 的自适应方法(Adaptive Quantization),效果立竿见影。

在 VGG8 网络和 CIFAR-10 数据集上,4-bit 精度下,传统均匀量化的准确率仅为 52.3%,而自适应 ADC 能飙升到 88.9%。在 5-bit 精度下,忆阻器 ADC 也达到了 89.55% 的高准确率,逼近理想性能。

在更具挑战性的 ResNet18 网络上,这种优势依然明显,相较于均匀量化,自适应方案带来了显著的精度提升。

如果只是更准,那还不够。忆阻器 ADC 的真正杀手锏,在于它为整个存算一体系统带来的 “减负” 效应。

首先,ADC 本身的效率。与公开发表的 SOTA 设计相比,这款忆阻器 ADC 在 5-bit 精度下,实现了 15.1 倍 的能效提升和 12.9 倍 的面积缩减。

更关键的是系统层面。当这个高效 ADC 被集成回存算一体系统后:

在 VGG8 网络中,ADC 模块的系统能耗占比从 79.8% 猛降至 22.5%(系统总能耗降低 57.2%),面积占比也从 47.6% 降至 16.9%(系统总面积降低 30.7%)。

在 ResNet18 上,也实现了类似的 56.9% 的能耗和 25.1% 的面积节省。

这意味着,存算一体系统中最臃肿、最耗电的那个部件,被彻底 “驯服” 了。

这项工作为解决混合信号存算一体中的 ADC 瓶颈提供了一个全新的、硬件友好的范例,为实现高效、准确的下一代 AI 硬件铺平了道路。

相关内容

第三方腐蚀电位测量测试实验
第三方腐蚀电位测量测试实验报告 1.检测范围 本次腐蚀电位测量...
2026-04-05 19:58:50
原创 ...
苹果年度旗舰的爆料永远是科技圈的顶流。今日,海外供应链与多家权威媒...
2026-04-05 19:58:13
业绩暴增,688809,华...
半导体产业迎来业绩兑现潮。 强一股份业绩暴增 4月3日晚间,强一股...
2026-04-05 19:57:52
原创 ...
4月4日,在澳门银河综艺馆的紧张较量中,中国乒坛名将王艺迪遭遇一场...
2026-04-05 19:56:57
海量数据中标:中国人民对外...
证券之星消息,根据天眼查APP-财产线索数据整理,根据中国人民对外...
2026-04-05 19:56:44
国家移民管理局:4月15日...
4月2日,国家移民管理局发布关于启用电子边境管理区通行证的公告。全...
2026-04-05 19:56:06
稳压器生产厂商如何选?沈阳...
稳压器生产厂商概述 稳压器在现代社会的电力系统中扮演着重要角色,能...
2026-04-05 10:00:55
手机屏幕驱动电路的电源纹波...
测试的核心价值:回收验机的隐性筛查手段 二手手机回收场景中,屏幕状...
2026-04-05 09:59:44
一元硬币载218个“嗅探器...
在一元硬币大小的玻璃片上,制备了218个传感器,每一个都可以精准地...
2026-04-05 09:59:25

热门资讯

攻略实测!掌心麻将圈辅助器开(... 攻略实测!掌心麻将圈辅助器开(有挂攻略)
教程实测!欢乐游戏是否能辅助(... 教程实测!欢乐游戏是否能辅助(怎么开挂)
给大家实测!大众互娱有挂吗确实... 给大家实测!大众互娱有挂吗确实有挂(详细开挂教程)
教程辅助!威互娱推筒子辅助软件... 教程辅助!威互娱推筒子辅助软件大全(其实确实有挂)
实测分享!朱雀开心罗松开挂版本... 实测分享!朱雀开心罗松开挂版本软件(记者曝光内幕)
万能实测!微乐湖北麻将辅助游戏... 万能实测!微乐湖北麻将辅助游戏(有挂攻略)
揭秘!聚友互娱透视挂开挂方法(... 揭秘!聚友互娱透视挂开挂方法(详细开挂教程)
一分钟了解!麻友圈原来确实有挂... 一分钟了解!麻友圈原来确实有挂(内幕分享)
5分钟实测!钱柜手游廉江麻将开... 5分钟实测!钱柜手游廉江麻将开挂作弊软件(的确是有挂)
5分钟实测!微乐广西麻将透视辅... 5分钟实测!微乐广西麻将透视辅助神器(的确是有挂)