3月17日,信息技術和材料科學交叉領域期刊InfoMat(影響因子:24.798)在線刊發了6774澳门永利李祎副教授、缪向水教授團隊題為“Self-selective memristor-enabled in-memory search for highly efficient data mining”的研究論文,李祎副教授和缪向水教授為論文共同通訊作者,6774澳门永利博士研究生楊嶺和黃曉弟為共同第一作者,香港智能晶片與系統研發中心陳佳博士以及華為公司參與了本工作。
相似性搜索是一類基礎的計算問題,其本質是通過衡量數據之間的相似性,從大量數據中定位與查詢對象最相關的信息,是數據挖掘、信息檢索等技術的核心。該過程涉及龐大的高維向量計算,對計算機的算力和能效有極高要求,由于傳統馮·諾伊曼架構的“存儲牆”瓶頸和集成電路摩爾定律的放緩,計算機系統的性能提升十分有限,難以滿足海量數據相似性搜索的需求。
針對此問題,團隊将憶阻存内計算(In-memory computing)的思想進一步發展聚焦,提出了存内搜索(In-memory search)的創新方案(圖1),針對相似性搜索難題,首先提出利用憶阻器電導的本征随機性構造高斯随機矩陣的編碼策略及編碼硬件(Encoder),并基于憶阻器模拟計算能力設計構建高緊湊、低功耗的非易失三态内容可尋址存儲器(nvTCAM),從而實現相似性搜索的兩大核心流程—特征編碼和相似度計算的原位并行執行。該方案将随機數産生器、矩陣運算單元、存儲器三者的功能集成在同一憶阻電路中一步實現。此外,團隊基于信息熵理論改進了經典局部敏感哈希算法,使得特征編碼更加緊湊,降低了計算和存儲開銷。通過上述軟硬件協同設計,憶阻存内搜索系統在分類、聚類等數據挖掘場景中能耗降低至CPU的1/168和專用集成電路(ASIC)的1/18.8。

圖1.基于憶阻器的存内搜索系統
此項工作是李祎副教授、缪向水教授團隊在存内搜索方向的階段性研究成果。團隊長期從事憶阻器及存内計算技術的相關研究,近年将存内計算思想引入相似性搜索驅動的機器學習,從器件、電路、架構、算法四個層次對存内搜索這一新興技術開展了系統研究,在圖像檢索、類腦競争學習、小樣本學習等場景下進行了驗證(圖2),研究成果發表在IEEE Electron DeviceLetters、Advanced Intelligent Systems、Science China Information Sciences等期刊。

圖2.基于憶阻器的歐氏距離、餘弦距離計算引擎及其在機器學習中的應用探索
上述系列研究工作得到了科技部國家科技創新2030“腦科學與類腦研究”重大項目、國家重點研究計劃、國家自然科學基金“後摩爾時代新器件基礎研究”重大研究計劃培育項目、面上項目以及華為公司的資助。
論文鍊接:https://onlinelibrary.wiley.com/doi/full/10.1002/inf2.12416