6月20日那天,华中科技大学信息存储系统教育部重点实验室里,电流发出嗡嗡的声响,显得格外引人注目。“喻家山二号”芯片的研发工作,已经进入了关键时刻。图1展示了华科大信息存储系统教育部重点实验室存算一体芯片研发团队的成员,其中前排右四的是冯丹教授,前排右五则是童薇教授。如果时间回到2024年11月底,全球存储容量最大的MRAM(磁性随机存储器)存算一体芯片“喻家山一号”,就诞生在这所实验室里。这款芯片是由华科大副校长、信息存储系统教育部重点实验室主任冯丹教授领衔的团队研发成功的,它成功打破了冯·诺依曼架构在计算机领域长达70年的统治地位,创新性地将“存储”与“计算”合二为一。这种设计大大降低了数据在移动过程中的能耗,芯片的算力可以达到每秒30.1万亿次AI运算,能效比甚至超过了市面上高端的边缘AI芯片。冯丹教授表示,“喻家山二号”芯片将在“喻家山一号”的基础上进行迭代,进一步提升其算力和能效表现。
“小小的芯片,却有着强大的能力。”在武汉光电国家研究中心的展厅里,摆放着两块银灰色的“喻家山一号”芯片,单芯片面积还不到2平方厘米。图2展示了这款“喻家山一号”存算一体芯片。童薇教授拿起其中一块芯片,语气中流露出骄傲之情,“存储容量64Mb,算力高达30.10TOPS,能效达到140.54TOPS/W。”这组数字究竟意味着什么呢?冯丹教授给出了答案:“在传统的芯片设计中,数据必须像搬运工一样,从存储区长途跋涉到计算区,这个过程不仅消耗了大量的能量,还占用了大量的时间。而我们的‘喻家山一号’,能够让数据在存储单元内直接完成计算,省去了数据搬运的环节。”这不仅使得芯片的算力达到了每秒30.1万亿次AI运算的水平,还让每瓦的功耗能够驱动140.54万亿次运算。简而言之,这款芯片不仅运算速度惊人,而且非常节能。图3展示了存算芯片板卡的设计情况。
“当时我们设计了两款芯片,一款基于MRAM介质,另一款则基于ReRAM(阻变存储器)介质,结果两款芯片都顺利点亮了,这有点出乎意料。”童薇教授这样回忆道。团队首先确认芯片能否正常上电,接着测试了读写等基本功能,包括存储容量是否达标、计算能力是否正常等等。在测试过程中,ReRAM芯片的表现相当顺利,能够正常工作。但MRAM芯片却连续一个月没有任何反应。“示波器上完全看不到任何信号,尽管我们输入了激励信号,但芯片依然没有任何输出。尽管能够上电,但就是无法被激活。”童薇教授至今还记得那段日子,实验室的气氛一度非常压抑。在冯丹教授的带领下,团队一遍又一遍地排查问题,最终发现是芯片的一个引脚定义出了错,“那一刻,悬在大家心头的那块大石头终于落了地”。
随着ChatGPT和DeepSeek的相继上线,2025年,冯丹教授决定进行一项大胆的尝试:将一个1.5B(15亿)参数规模的模型的部分计算任务,卸载到“喻家山一号”芯片上运行。测试结果表明,芯片具备了支撑大模型推理的系统级能力。冯丹教授解释道:“就像CPU需要编译器将高级语言转化为机器码一样,我们的存算一体芯片也需要一套专门设计的编译工具链,将目标操作转化为芯片能够理解的指令。”冯丹教授带领团队完成了存算一体芯片的设计以及配套的软件工具链的开发工作。然而,团队并没有因此而感到兴奋,实验室的气氛依然平静,因为他们知道,还有更远大的目标等待着自己去实现。
“要做,就做最好的。”回想起1987年,17岁的冯丹教授考入华中工学院(现华中科技大学)计算机专业,她首次系统学习了冯·诺依曼架构。那时,她或许还没有预料到,自己未来会成为这一经典理论的突破者。到了2006年,冯丹教授已经在该校任教十多年了。她投身于国家973计划“下一代互联网信息存储的组织模式和核心技术研究”中,在探索“多层次、可扩展的存储对象”模式的过程中,她逐渐认识到冯·诺依曼架构的局限性,并萌生了存算一体的创新构想。图4展示了未封装的“喻家山1号”存算一体芯片。冯丹教授这样阐释道:“存算一体的核心,就是把计算功能迁移到存储端,让数据在存储位置就地运算,彻底消除数据搬运带来的开销。”这一构想在2009年迎来了曙光——惠普实验室发现了忆阻器效应,为存算一体的物理实现奠定了理论基础。存算一体技术的目标,就是在最大程度上降低甚至消除数据传输过程中的能耗。





