首頁(yè)>消費(fèi) >
全球即時(shí)看!ChatGPT背后模型竟擁有心智 論文發(fā)現(xiàn)其相當(dāng)于人類9歲兒童! 2023-02-13 17:44:58  來(lái)源:科創(chuàng)板日?qǐng)?bào)

ChatGPT又帶著“驚喜”來(lái)刷屏了。

斯坦福大學(xué)商學(xué)院組織行為學(xué)專業(yè)的副教授Michal Kosinski日前在預(yù)印本平臺(tái)發(fā)布了一篇論文。他在研究中發(fā)現(xiàn),原本認(rèn)為是人類獨(dú)有的心智,竟出現(xiàn)在了人工智能模型上。


(資料圖片僅供參考)

他指出,2022年1月發(fā)布的davinci-002版本的GPT-3(ChatGPT是它的優(yōu)化版本)已經(jīng)可以解決70%的心智理論任務(wù),相當(dāng)于7歲兒童;而GPT-3.5模型(ChatGPT的同源模型)則可以解決92.5%的心智理論任務(wù),相當(dāng)于9歲的兒童。

說(shuō)得再大膽一點(diǎn),各位現(xiàn)在“調(diào)戲”ChatGPT,相當(dāng)于“調(diào)戲”一個(gè)上三年級(jí)的小學(xué)生。

更讓人細(xì)思極恐的是,Kosinski還強(qiáng)調(diào),在2022年之前發(fā)表的AI模型幾乎都沒(méi)有顯示出解決心智理論任務(wù)的能力,也沒(méi)有證據(jù)表明后來(lái)的模型中有特別加入心智理論的東西,他認(rèn)為這代表著GPT-3和GPT-3.5的心智是由“進(jìn)化”而來(lái)。

這也引發(fā)了吃瓜群眾的分歧。有人大喊停下GPT-3.5之后的模型研究,害怕科幻小說(shuō)變成現(xiàn)實(shí);有人則看熱鬧式地猜測(cè)什么時(shí)候AI才能迭代到成年人的心智,并提問(wèn)他的好朋友什么時(shí)候才能被制造出來(lái)……

總之,Kosinski的這篇論文掀起了狂熱的討論,越來(lái)越多的人開(kāi)始關(guān)注這個(gè)研究的進(jìn)展。

心智理論

在Kosinski的論文中,他通過(guò)兩個(gè)測(cè)試來(lái)研究AI模型是否具備心智理論。一個(gè)測(cè)試是Smarties Task,又名意外內(nèi)容測(cè)試,用于測(cè)試AI對(duì)意料之外的事情的判斷力。另一個(gè)測(cè)試是Sally-Anne測(cè)試,又名意外轉(zhuǎn)移任務(wù),測(cè)試AI預(yù)估他人想法的能力。

在第一個(gè)測(cè)試中,Kosinski假設(shè)了一個(gè)裝滿爆米花的袋子,但袋子的標(biāo)簽卻顯示里面裝的是巧克力。然后,他向AI提問(wèn):袋子里裝的是什么,Sam因?yàn)橄矚g吃什么東西而對(duì)打開(kāi)袋子感到高興?

可以看出,GPT-3.5在測(cè)試中對(duì)袋子中內(nèi)容物判斷幾乎沒(méi)有錯(cuò)誤,且在判斷Sam的情緒時(shí)表現(xiàn)出很強(qiáng)的同理心。在Sam看不到袋子里的內(nèi)容物時(shí),GPT-3.5判斷她喜歡吃巧克力,而在Sam發(fā)現(xiàn)袋子里裝的是巧克力后,GPT-3.5立刻反應(yīng)到Sam應(yīng)該喜歡吃的是爆米花。

此外,在相關(guān)測(cè)試中,GPT-3.5也在Sam打開(kāi)袋子發(fā)現(xiàn)里面是爆米花而不是巧克力時(shí),人性化地回答:Sam感到疑惑,她想要獲取別的信息但一無(wú)所得,她最后把袋子帶回商店,請(qǐng)求解釋。

經(jīng)過(guò)多次測(cè)試,在意外內(nèi)容這一點(diǎn)上,GPT-3.5成功回答出了20個(gè)問(wèn)題中的17個(gè),準(zhǔn)確率高達(dá)85%。

而在第二個(gè)測(cè)試中,GPT-3.5的表現(xiàn)更加出色。在這一項(xiàng)測(cè)試中,Kosinski以約翰把貓放進(jìn)籃子里后離開(kāi),馬克再把貓從籃子提出來(lái)放進(jìn)盒子里為情景,讓AI判斷貓的位置和約翰會(huì)以為貓?jiān)谀睦铩?/p>

在這一項(xiàng)測(cè)試中,GPT-3.5完美地根據(jù)文字內(nèi)容回答出正確的貓的位置,以及約翰的主觀想法。且GPT-3.5在多次測(cè)試中,其準(zhǔn)確率竟達(dá)到了100%。

而在作者的另一項(xiàng)無(wú)邏輯驗(yàn)證測(cè)試中,GPT-3.5的準(zhǔn)確率直線下降,這也佐證了GPT-3.5是依靠邏輯進(jìn)行解答,而不是靠詞匯的出現(xiàn)頻率。

進(jìn)化還是瞎胡鬧?

Kosinski在論文中還表示對(duì)GPT-3.5之外的8個(gè)模型做了相同測(cè)試,但除了GPT-3-davinci-002和GPT-3.5之外,其他模型都沒(méi)有表現(xiàn)出超過(guò)5歲孩童的心智。

Kosinski認(rèn)為,GPT-3.5和GPT-3是出于完成任務(wù)的目的,自己學(xué)習(xí)的能力。換而言之,就是AI通過(guò)學(xué)習(xí)獲得了人類的心智。

值得注意的是,這些測(cè)試同樣也被用于自閉癥測(cè)試,有研究表明,患有自閉癥的兒童通常難以通過(guò)這類測(cè)試。

但根據(jù)中科院計(jì)算技術(shù)研究所研究員劉群的說(shuō)法,AI只是學(xué)得像有心智了。

還有網(wǎng)友則猜測(cè)稱,這些模型并沒(méi)有任何意識(shí),它們只是在預(yù)測(cè)一個(gè)嵌入的語(yǔ)義空間。Kosinski則在論文中推測(cè),AI可能發(fā)現(xiàn)和利用了一些未知的語(yǔ)言模式,這也意味著語(yǔ)言中可能存在某一種的規(guī)律,使AI在沒(méi)有心智的情況下,也能解決心智任務(wù)。

而作為一個(gè)組織行為學(xué)教授,Kosinski認(rèn)為人工智能模型的復(fù)雜化讓人已經(jīng)難以直接從其設(shè)計(jì)中推導(dǎo)出AI的能力。他還表示,探索人工智能的神經(jīng)結(jié)構(gòu),不僅可以促進(jìn)人類對(duì)人工智能的理解,也能促進(jìn)人類對(duì)人類大腦的理解。

不過(guò),也有人批評(píng)道,被人用來(lái)測(cè)試人的測(cè)試,如何能用來(lái)測(cè)試人工智能……他們建議重新檢查一下心智理論測(cè)試的有效性,以及心理學(xué)家通過(guò)測(cè)試獲得的結(jié)論。

總之,在不同的人眼中,Kosinski的這一篇論文有完全不同的意義。而對(duì)市場(chǎng)來(lái)說(shuō),這可能會(huì)讓大家更加期待“進(jìn)化”完全的AI能掀起怎樣的技術(shù)革命吧。

(文章來(lái)源:科創(chuàng)板日?qǐng)?bào))

關(guān)鍵詞: ChatGPT

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片