近日,湖南大學(xué)電氣與信息工程學(xué)院劉杰教授課題組自主研制出了“存算一體”非馮·諾依曼類腦芯片架構(gòu),用于加速分子動(dòng)力學(xué)高性能科學(xué)計(jì)算。相較主流Intel CPU、NVIDIA GPU芯片,在保持計(jì)算高精度前提下,實(shí)現(xiàn)了約2個(gè)數(shù)量級提速。研究成果以“Accurate and efficient molecular dynamics based on machine learning and non von Neumann architecture”為題,發(fā)表在《npj Computational Materials》期刊。第一作者為電氣院博士生莫平輝,通訊作者為劉杰教授。
自1946年發(fā)明至今,馮·諾依曼架構(gòu)一直占據(jù)統(tǒng)治地位,是CPU、GPU等主流芯片的基礎(chǔ),也是手機(jī)、臺(tái)式機(jī)、筆記本、計(jì)算服務(wù)器、超級計(jì)算中心的底層基礎(chǔ)架構(gòu)。目前,需要運(yùn)行分子動(dòng)力學(xué)等高性能科學(xué)計(jì)算時(shí),使用馮·諾依曼架構(gòu)的計(jì)算機(jī)是幾乎所有研究人員的唯一選擇,這已成為一種“固有范式”(paradigm)。遺憾的是,馮·諾依曼架構(gòu)中,計(jì)算單元(例如CPU/GPU)和存儲(chǔ)單元(例如內(nèi)存)是互相獨(dú)立的(即“存算分離”),導(dǎo)致計(jì)算總耗時(shí)和計(jì)算總功耗中的絕大部分(>90%)消耗于存儲(chǔ)單元、計(jì)算單元之間的頻繁數(shù)據(jù)搬運(yùn),俗稱“存儲(chǔ)墻(memory wall)”和“功耗墻(power wall)”瓶頸。這嚴(yán)重制約了計(jì)算性能的提升。
為解決該問題,劉杰教授團(tuán)隊(duì)自主設(shè)計(jì)了“存算一體”的類腦芯片架構(gòu),并基于FPGA研制出了基于新型非馮·諾依曼芯片架構(gòu)的分子動(dòng)力學(xué)計(jì)算系統(tǒng)“NVNMD”(第一版),實(shí)現(xiàn)了從傳統(tǒng)馮·諾依曼芯片架構(gòu)向新型非馮·諾依曼芯片架構(gòu)的“范式轉(zhuǎn)移(paradigm shift)”。NVNMD的核心計(jì)算模塊中,存儲(chǔ)單元和計(jì)算單元緊密融為一體(即“存算一體”),避免了頻繁的數(shù)據(jù)搬運(yùn),極大緩解了計(jì)算中的“存儲(chǔ)墻”和“功耗墻”瓶頸。實(shí)測表明,相較主流CPU、GPU等傳統(tǒng)馮·諾依曼架構(gòu)芯片,可將計(jì)算速度提升大約2個(gè)數(shù)量級;并可將計(jì)算功耗降低大約3個(gè)數(shù)量級。
長期以來,受制于馮·諾依曼芯片架構(gòu)內(nèi)稟的“存儲(chǔ)墻”等瓶頸,在“速度”和“精度”這兩個(gè)核心指標(biāo)上,分子動(dòng)力學(xué)存在“魚與熊掌不可兼得”的問題——經(jīng)典分子動(dòng)力學(xué)(classical molecular dynamics, CMD)速度快,但精度低,難以滿足高精度計(jì)算要求;第一性原理分子動(dòng)力學(xué)(ab-initio molecular dynamics, AIMD)精度高,但速度慢,難以計(jì)算大系統(tǒng)。該成果提出的新型NVNMD兼具AIMD級別的高精度、CMD級別的高速度,在物理、化學(xué)、生物、制藥、地質(zhì)、材料、半導(dǎo)體、納米技術(shù)等領(lǐng)域有廣泛應(yīng)用前景。
該成果得到了中組部海外高層次人才計(jì)劃、國家自然科學(xué)基金、湖南省委組織部百人計(jì)劃、湖南省科技廳、長沙市科技局、華為技術(shù)有限公司等經(jīng)費(fèi)支持。目前,該團(tuán)隊(duì)正在基于高端工藝節(jié)點(diǎn),設(shè)計(jì)非馮·諾依曼架構(gòu)ASIC芯片的NVNMD(第二版),旨在實(shí)現(xiàn)單節(jié)點(diǎn)(平方cm量級芯片、百瓦量級功耗、新型非馮·諾依曼芯片架構(gòu))分子動(dòng)力學(xué)算力大致相當(dāng)于美國最強(qiáng)超算中心Summit算力總和(占地一棟樓、十兆瓦量級功耗、傳統(tǒng)馮·諾依曼芯片架構(gòu))的研究目標(biāo)。