科技日?qǐng)?bào)北京10月8日電 (記者張夢(mèng)然)英國(guó)《自然》雜志封面以“矩陣游戲”為題,發(fā)表了人工智能(AI)公司“深度思維”團(tuán)隊(duì)的最新發(fā)現(xiàn):AI可解決矩陣乘法問題。這是第一個(gè)可為矩陣乘法等基本任務(wù)發(fā)現(xiàn)新穎、高效且正確算法的AI系統(tǒng)。換句話說,這個(gè)名為“AlphaTensor”的AI能自行發(fā)現(xiàn)新算法,從而解決了50年來數(shù)學(xué)領(lǐng)域一個(gè)懸而未決的問題——找到兩個(gè)矩陣相乘最快的方法。
數(shù)學(xué)在計(jì)算機(jī)編程中經(jīng)常出現(xiàn),通常作為描述和操縱現(xiàn)實(shí)世界現(xiàn)象表示的一種手段。例如,它用于表示計(jì)算機(jī)屏幕上的像素、天氣狀況或人工網(wǎng)絡(luò)中的節(jié)點(diǎn)。在這種情況下,使用數(shù)學(xué)的主要方式之一,就是對(duì)矩陣進(jìn)行計(jì)算。
在對(duì)游戲進(jìn)行編程時(shí),矩陣描述了可能的運(yùn)動(dòng)選項(xiàng)。為了實(shí)現(xiàn)這樣的運(yùn)動(dòng),矩陣經(jīng)常被相乘和/或相加。這需要海量的工作,隨著矩陣變得越來越大尤其如此,這就是為什么計(jì)算機(jī)科學(xué)家花費(fèi)大量時(shí)間和精力來開發(fā)越來越有效算法來完成工作的原因。1969年,數(shù)學(xué)家沃爾克·斯特拉森想出了一種方法,只使用7個(gè)乘法運(yùn)算而不是標(biāo)準(zhǔn)的8個(gè)乘法運(yùn)算將兩個(gè)2×2矩陣相乘。
但在新成果中,“深度思維”研究人員從游戲系統(tǒng)中尋找靈感,這些游戲大多數(shù)都是基于強(qiáng)化學(xué)習(xí)的。在構(gòu)建了一些初步系統(tǒng)之后,研究小組將重點(diǎn)轉(zhuǎn)向了樹搜索,這也用于游戲編程,是系統(tǒng)在特定情況下查看各種方案的一種手段。當(dāng)應(yīng)用于乘法矩陣時(shí),研究人員發(fā)現(xiàn),將AI系統(tǒng)轉(zhuǎn)換為游戲可搜索最有效的方法來獲得所需的結(jié)果——數(shù)學(xué)結(jié)果。
研究人員通過允許它搜索、評(píng)估來測(cè)試他們的系統(tǒng),然后使用現(xiàn)有算法,并以獎(jiǎng)勵(lì)來激勵(lì)選出最有效的算法。系統(tǒng)學(xué)會(huì)了影響矩陣乘法效率的因素。接下來,研究人員將允許系統(tǒng)創(chuàng)建自己的算法,尋求進(jìn)一步提高效率。他們發(fā)現(xiàn),在許多情況下,系統(tǒng)選擇的算法比人類前輩創(chuàng)建的算法更好。
“深度思維”團(tuán)隊(duì)希望,未來AI能更多地用來幫助攻克數(shù)學(xué)和科學(xué)領(lǐng)域的一些最重要的難題。
【總編輯圈點(diǎn)】
“AlphaTensor”的前身,其實(shí)就是在國(guó)際象棋、圍棋和將棋等游戲中打敗人類高手的“阿爾法零”,可以說,這項(xiàng)工作展示了智能體從游戲到解決數(shù)學(xué)問題的一次重要轉(zhuǎn)變。從數(shù)學(xué)角度看,新AI可比以往更高效地探索算法空間,加深人們對(duì)矩陣豐富性的理解。而從更深遠(yuǎn)的角度講,矩陣乘法正是計(jì)算機(jī)圖形、數(shù)字通信、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和科學(xué)計(jì)算等諸多領(lǐng)域的核心,這一AI帶來的不僅僅是“矩陣游戲”,還將是以上這些領(lǐng)域計(jì)算效率的大幅提升。
原標(biāo)題:“矩陣游戲”橫空出世 AI首次創(chuàng)建高效準(zhǔn)確數(shù)學(xué)算法