6月21日,6774澳门永利李祎副教授、缪向水教授研究團隊在高能效憶阻科學計算方面的最新成果以“Sparse matrix multiplication in a record-low power self-rectifying memristor array for scientific computing” 為題在線發表在《科學進展》(Science Advances)。該研究基于超低功耗自整流憶阻器陣列,首次提出利用器件非線性實現高面積效率、高計算并行度的稀疏矩陣運算以加速科學計算應用。
科學計算是基礎科學研究和工業制造的重要技術,高性能計算機的性能提升是科學計算進一步發展的關鍵硬件基礎。基于憶阻器的存算一體技術及硬件已在加速神經網絡中的稠密矩陣計算方面取得了顯著進展。然而,在加速科學計算中常見的大規模稀疏矩陣計算時,由于陣列集成規模和模拟計算原理等方面的限制,硬件開銷巨大,無法充分發揮憶阻存算一體的能效優勢。為解決上述問題,團隊通過新憶阻器件、新計算原理、存算一體新電路及新架構的跨層面協同研究,以突破稀疏矩陣計算的能效限制,推動憶阻存算一體技術在高性能計算場景下的應用。

圖1.基于自整流憶阻器的存算一體為稀疏矩陣計算提供了一種高能效計算方法
在此背景下,該研究實現了以下幾個方面的技術突破:(1)在器件層面,制備了高性能的Pt/HfO2/TaOx/Ta自整流憶阻器陣列,其具有極低的漏電流(小于0.1 pA),而且功耗優于國際上已有文獻報道值(SET: 2.4 aJ,RESET: 150 aJ;讀取功耗LRS: 150 aJ,HRS: 0.12 aJ),為實現高能效大規模計算奠定了重要基礎。(2)在模拟計算機制方面,首次提出了一種基于器件非線性的模拟存算一體機制,并在陣列中實現了稀疏矩陣壓縮與高并行計算,顯著降低了硬件開銷和電路功耗。(3)最後,通過電路、算法和混合精度計算架構的跨層次協同優化,成功在實際科學計算任務上取得了與雙精度浮點計算系統相媲美計算精度,并将2-bit至8-bit的稀疏矩陣計算能提高到了97 – 11 TOPS/W。相較于現有的存算一體技術,本系統的面積效率提升了340倍,能效提升超過85倍。這項工作克服了憶阻存算一體技術在科學計算應用上的關鍵性能瓶頸,為推動憶阻存算一體技術在高性能計算領域的發展邁出了堅實一步。

圖2.基于自整流憶阻器的稀疏矩陣計算在科學計算上的應用驗證及與現有存算一體技術的性能對比
該研究工作得到了科技部國家重點研究計劃、國家自然科學基金“後摩爾時代新器件基礎研究”重大研究計劃培育項目的資助,以及湖北江城實驗室的支持。6774澳门永利為論文第一完成單位,6774澳门永利博士研究生李健聰和任升廣為共同第一作者,李祎副教授和缪向水教授為論文共同通訊作者。
論文鍊接:https://www.science.org/doi/10.1126/sciadv.adf7474