歐洲研究者設(shè)計(jì)出一種類(lèi)似大腦的人工神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠在沒(méi)有任何明確的訓(xùn)練或預(yù)編程的前提下具備數(shù)字和空間認(rèn)知,以及書(shū)面語(yǔ)言處理的能力。他們基于生成模型的機(jī)器學(xué)習(xí)方法的成果顯著推動(dòng)了自我學(xué)習(xí)人工智能的發(fā)展,同時(shí)也加深了對(duì)人類(lèi)認(rèn)知的理解。
該研究由帕多瓦大學(xué)(University of Padova)的 Marco Zorzi 領(lǐng)導(dǎo),并從一開(kāi)始就得到了歐洲研究中心(ERC)的資助。這個(gè)名叫 GENMOD 的項(xiàng)目表明建立一個(gè)能夠基于感官數(shù)據(jù)觀察世界并生成世界的內(nèi)部表征的人工神經(jīng)網(wǎng)絡(luò)是可能的。比如說(shuō),該網(wǎng)絡(luò)可以依靠自己發(fā)展出近似的數(shù)感(number sense)——確定基本數(shù)字性質(zhì)的能力,比如更大或更小——而且還不需要實(shí)際理解這些數(shù)字本身,就像人類(lèi)和嬰兒和一些動(dòng)物一樣。
Zorzi 說(shuō)「我們的研究顯示,在概率框架內(nèi)的生成學(xué)習(xí)可以成為開(kāi)發(fā)人類(lèi)認(rèn)知的更合理的神經(jīng)網(wǎng)絡(luò)模型的關(guān)鍵步驟。」
視覺(jué)數(shù)量感(visual numerosity)的測(cè)試顯示了該網(wǎng)絡(luò)的能力,同時(shí)也為人類(lèi)和動(dòng)物在沒(méi)有任何預(yù)先存在的數(shù)字或算術(shù)知識(shí)的基礎(chǔ)上出現(xiàn)判斷一個(gè)集合中的物體數(shù)量的能力提供了見(jiàn)解。
Zorzi 及其同事向這個(gè)自修正網(wǎng)絡(luò)(self-revising network)輸入了數(shù)萬(wàn)張圖像,其中每張圖像都包含了 2 到 32 個(gè)大小不同的隨機(jī)排布的物體;然后研究人員發(fā)現(xiàn)在這個(gè)遵循無(wú)監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)中涌現(xiàn)出了對(duì)數(shù)量感(numerosity)的感知。在響應(yīng)每一張圖像時(shí),該網(wǎng)絡(luò)會(huì)強(qiáng)化或弱化神經(jīng)元之間的連接,以使其數(shù)字敏銳度(即精確度)可以根據(jù)其剛剛觀察到的模型進(jìn)行精細(xì)調(diào)節(jié);這個(gè)過(guò)程獨(dú)立于物體的總體表面積,確保了其神經(jīng)元確實(shí)是在檢測(cè)數(shù)量。
實(shí)際上,該網(wǎng)絡(luò)開(kāi)始為估計(jì)圖像中物體的數(shù)量生成自己的規(guī)則和學(xué)習(xí)過(guò)程,其所遵循的神經(jīng)元活動(dòng)模式也曾在猴子的頂葉皮層中被觀察到過(guò)。頂葉皮層是大腦中涉及數(shù)字和算術(shù)知識(shí)的區(qū)域,這表明 GENMOD 模型可能近似反映了真實(shí)大腦的工作方式。
像一個(gè)孩子那樣學(xué)習(xí)數(shù)字敏銳能力
「一個(gè)六個(gè)月大的孩童有相對(duì)較弱的近似數(shù)感:比如說(shuō),他可以區(qū)分 8 個(gè)點(diǎn)和 16 個(gè)點(diǎn)之間的差異,但卻無(wú)法區(qū)分 8 個(gè)點(diǎn)和 12 個(gè)點(diǎn)之間的差異。辨別能力在整個(gè)童年都在提升。我們的網(wǎng)絡(luò)在數(shù)字敏銳度上表現(xiàn)出了相似的過(guò)程——其觀察的圖像越來(lái)越多,同時(shí)其確定物體數(shù)量的能力也隨時(shí)間逐漸提升。」據(jù) Zorzi 說(shuō),他計(jì)劃在 7 月 26 日的歐洲科學(xué)開(kāi)放論壇 2016(EuroScience Open Forum 2016)中的「Can we simulate the human brain?(我們能模擬人類(lèi)大腦嗎?)」研討會(huì)上討論他的研究。
該項(xiàng)目在數(shù)字認(rèn)知上的成果可能對(duì)神經(jīng)科學(xué)和教育有重要的意義,比如理解患有計(jì)算障礙(dyscalculia)的孩子數(shù)感受損的可能原因,年齡增長(zhǎng)對(duì)數(shù)字技能的影響和增進(jìn)由腦損傷引起的病理的研究。
憑借其在機(jī)器視覺(jué)、神經(jīng)信息學(xué)和人工智能方面的應(yīng)用,GENMOD 在其它一些領(lǐng)域甚至還可能會(huì)有更為深遠(yuǎn)的影響。
「之前利用人工神經(jīng)網(wǎng)絡(luò)建模人類(lèi)認(rèn)知的許多成果都基于監(jiān)督式學(xué)習(xí)算法。這樣的算法除了在生物學(xué)上不合理之外,還要求在每一個(gè)學(xué)習(xí)事件中都有外部的教育信號(hào)可用,并且表現(xiàn)出了一種值得懷疑的假設(shè):學(xué)習(xí)在很大程度上是判別式的?!筞orzi 解釋說(shuō),「相反,生成模型在沒(méi)有任何監(jiān)督或獎(jiǎng)勵(lì)的前提下學(xué)習(xí)感官數(shù)據(jù)的內(nèi)部表征。也就是說(shuō),物體的圖像等感官模式不需要進(jìn)行標(biāo)注來(lái)告訴網(wǎng)絡(luò)輸入中呈現(xiàn)了什么或它應(yīng)該如何做出反應(yīng)?!?/p>
人類(lèi)感知建模中的突破
該 GENMOD 團(tuán)隊(duì)還利用深度神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)了第一個(gè)全面的、真實(shí)的字母感知(letter perception)計(jì)算模型,該模型以完全無(wú)監(jiān)督的方式從不同字體、樣式和大小的數(shù)千張字母圖像中進(jìn)行了學(xué)習(xí)。通過(guò)預(yù)先輸入的自然場(chǎng)景的隨機(jī)圖像,該網(wǎng)絡(luò)學(xué)會(huì)了隨時(shí)間定義線條、形狀和圖案。當(dāng)它隨后被用于觀察書(shū)面文本時(shí),它應(yīng)用了相同的過(guò)程來(lái)區(qū)分字母,并最終區(qū)分出了單詞。
「這支持了關(guān)于人類(lèi)如何發(fā)展出書(shū)面語(yǔ)言的假設(shè)。大腦中沒(méi)有一部分是為閱讀而發(fā)展的,因此當(dāng)我們需要識(shí)別對(duì)象時(shí),使用的是相同的認(rèn)知過(guò)程,」Zorizi 說(shuō)?!高@個(gè)生成模型方法是建立人類(lèi)感知和認(rèn)知模型的一個(gè)重大突破,這與神經(jīng)生物學(xué)理論強(qiáng)調(diào)大腦中混合自下而上和自上而下的相互作用相一致?!?/p>
無(wú)監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)也可能被用于各種各樣的應(yīng)用中,這些應(yīng)用中的數(shù)據(jù)都是未被分類(lèi)且沒(méi)有標(biāo)簽的。比如,該網(wǎng)絡(luò)可以用來(lái)在功能磁共振成像中識(shí)別人類(lèi)大腦活動(dòng)的特征,這對(duì)于其他技術(shù)或人類(lèi)觀察者來(lái)說(shuō)是不可能的。它甚至可以用來(lái)制造真正智能的智能手機(jī),把像智能檢測(cè),學(xué)習(xí)和決策克服日益嚴(yán)重的網(wǎng)絡(luò)過(guò)載問(wèn)題這樣的認(rèn)知能力灌輸?shù)揭苿?dòng)設(shè)備中。
「我們的發(fā)現(xiàn)證明了生成模型代表了前進(jìn)中關(guān)鍵的一步。我們希望我們的工作能影響更廣泛的認(rèn)知建模社區(qū),激發(fā)其他研究者在未來(lái)的研究中去擁抱框架,」Zorzi 說(shuō)。