首頁(yè)>資訊 >
與動(dòng)物語(yǔ)言交流,這件人做不到的事,AI能勝任? 2021-11-16 18:22:12  來(lái)源:36氪

你看過(guò)《忠犬八公的故事》嗎?

這部評(píng)分很高的電影,完美詮釋了秋田犬小八和主人公帕克之間的情誼。小八每天都想方設(shè)法去車站等已故的主人,風(fēng)雨無(wú)阻,一等就是十年。還有不少優(yōu)秀的影視作品都反映了同一個(gè)主題:人和動(dòng)物的交流。了解動(dòng)物是一個(gè)難題。首先,動(dòng)物甚至有“語(yǔ)言”嗎?如果它們有自己的語(yǔ)言,除了生存的基本知識(shí)之外還有很多話要說(shuō)嗎? AI 正在幫我們解答這些問(wèn)題。

“神秘外星人”

使用 AI 探索動(dòng)物語(yǔ)言是合理的。畢竟,人工智能已被證明在破譯古代人類語(yǔ)言方面非常有效。一個(gè)由國(guó)際科學(xué)家組成的團(tuán)隊(duì),最近發(fā)起了一個(gè)雄心勃勃的"鯨語(yǔ)翻譯計(jì)劃"(Project CETI)。他們選擇的研究對(duì)象生活在充滿神秘魅力的藍(lán)色海洋中,是一種極具情感和智慧的、令人著迷的“神秘外星人”:抹香鯨(Physeter macrocephalus)。抹香鯨外形龐大,體型似魚,用肺呼吸,體重超過(guò) 50 噸,體長(zhǎng)可高達(dá) 18 米,屬于體型最大的齒鯨;頭部巨大,可占整個(gè)身體的 1/3,下頜較小,僅下頜有牙齒,頸部較短,鼻孔為噴孔,位于吻端,前肢成鰭,前臂和后肢退化,無(wú)背鰭,尾似魚,靠尾擺動(dòng);具有極強(qiáng)的潛水能力,不僅在深度上,而且在下潛時(shí)間上都是哺乳動(dòng)物的 No.1。

圖丨你可能想不到它的主食是什么吧?深海中的大王烏賊是它的最愛

受“探索外星智能”(SETI, search for extraterrestrial intelligence)的啟發(fā),項(xiàng)目負(fù)責(zé)人 David Gruber 聯(lián)合科學(xué)家和研究者們?cè)噲D進(jìn)行一次前所未有的探索: 破譯抹香鯨的語(yǔ)言,以實(shí)現(xiàn)人鯨對(duì)話。由此,鯨類翻譯計(jì)劃(Project CETI , Cetacean Translation Initiative)誕生了。通過(guò)傾聽、解讀抹香鯨的聲音,獲得與它們交流的方式,以運(yùn)用最前沿的技術(shù)來(lái)造福人類,造福地球的生物,達(dá)到珍愛生命、保護(hù)生命、人與自然的和諧共處的宗旨。該項(xiàng)目采用非營(yíng)利性的模型,由來(lái)自紐約城市大學(xué)、UC 伯克利、MIT、哈佛、谷歌研究院和《國(guó)家地理》等知名學(xué)府、研究和環(huán)保機(jī)構(gòu)的多領(lǐng)域?qū)<夜餐M成,匯集了頂尖的密碼學(xué)家、機(jī)器人專家、語(yǔ)言學(xué)家、AI 專家、技術(shù)專家和海洋生物學(xué)家。他們一致認(rèn)為,只有采用跨學(xué)科的研究思路,將相關(guān)方向的專業(yè)知識(shí)融會(huì)貫通,才能更全面、深入、透徹的了解鯨類的語(yǔ)言。其關(guān)鍵步驟如下:

記錄:從各種傳感器收集鯨魚通信和行為數(shù)據(jù)的大型縱向的多模態(tài)的數(shù)據(jù)信息;

過(guò)程:協(xié)調(diào)和處理多傳感器的數(shù)據(jù);

解碼:借助 ML 技術(shù),構(gòu)建鯨魚的交流模型并描述其結(jié)構(gòu),將其與行為緊密聯(lián)系起來(lái);

編碼和回放:通過(guò)一次次的交互式播放實(shí)驗(yàn),改進(jìn)并完善鯨魚語(yǔ)言模型。

因而,多種最新的技術(shù)也有了更廣闊的用武之地,涵蓋 AI、機(jī)器學(xué)習(xí)(ML, Machine Learning)、密碼學(xué)和機(jī)器人技術(shù)等等。

正如阿波羅計(jì)劃的地球上升照片一樣,CETI 的發(fā)現(xiàn)和進(jìn)步極有可能重塑人類對(duì)其在這個(gè)星球上所處地位的理解。

該項(xiàng)目的主要研究工作概括為以下幾點(diǎn):

開發(fā)最精密的機(jī)器人技術(shù),包括與國(guó)家地理學(xué)會(huì)的探索技術(shù)實(shí)驗(yàn)室合作,在傾聽鯨魚的聲音的同時(shí),將其聲音融入語(yǔ)境之中。

部署“核心鯨魚監(jiān)聽系統(tǒng)”,這是一種新穎的水聽器陣列,可用于研究 20×20 公里的野外地點(diǎn)的鯨群。

多米尼加的抹香鯨項(xiàng)目成效顯著,已捕獲了關(guān)于鯨魚聲音、社會(huì)生活和行為的大量數(shù)據(jù)。

創(chuàng)建大數(shù)據(jù)管道,以檢查記錄的數(shù)據(jù),并使用先進(jìn)的 ML、自然語(yǔ)言處理(NLP, Natural Language Processing)和數(shù)據(jù)科學(xué)(DS,Data Science)對(duì)其進(jìn)行解碼。

增強(qiáng)伙伴合作關(guān)系,啟動(dòng)公共界面、數(shù)據(jù)可視化、溝通平臺(tái)和領(lǐng)導(dǎo)力倡議,以參與并促進(jìn)全球社區(qū)的發(fā)展。

圖 |鯨魚生物聲學(xué)數(shù)據(jù)收集的示意圖

第一個(gè)問(wèn)題,為什么選擇的是抹香鯨呢?

在此,我們解答你心中的第一個(gè)疑問(wèn):人類借 AI 嘗試和動(dòng)物交流,為什么要選抹香鯨?其實(shí),相對(duì)于所有的生物而言,抹香鯨擁有最大的大腦,并且與人類有著驚人相似的特征。 抹香鯨具有更高層次的功能,如有意識(shí)的思考和未來(lái)規(guī)劃,有豐富的情感體驗(yàn),可以表達(dá)和感受同情、愛、痛苦和直覺等等。它的生物聲學(xué)系統(tǒng)如下圖所示。在 A 中,抹香鯨頭包括鯨蠟器官(c),一個(gè)充滿近 2000 升蠟狀液體的腔體,以及垃圾艙 (f),包含一系列起到聲透鏡作用的晶圓狀體。兩者相當(dāng)于兩個(gè)連接管,在大型成熟雄鯨中形成一個(gè)長(zhǎng)約 10 米、孔約 0.8 米的彎曲圓錐形角。在頭部前側(cè)的“聲唇”(i)發(fā)出的聲音,通過(guò)彎曲的喇叭進(jìn)行傳遞,在出口表面產(chǎn)生平坦的波面。而 5-B 中展示的是,抹香鯨回聲定位和尾波咔噠聲的時(shí)間結(jié)構(gòu)。

另外,它們生活在母系社會(huì)和多元文化社會(huì),有方言和強(qiáng)大的多代家庭紐帶?,F(xiàn)代鯨魚作為海洋環(huán)境的超強(qiáng)“管家”,已有超過(guò) 3000 萬(wàn)年的歷史了,從時(shí)間節(jié)點(diǎn)上看,已是最早原始人類的5倍,而我們對(duì)這些動(dòng)物的了解才只是剛剛開始。

第二個(gè)問(wèn)題,為何現(xiàn)在去研究?

這個(gè)問(wèn)題得從 20 世紀(jì) 60 年代末的一個(gè)發(fā)現(xiàn)說(shuō)起。當(dāng)時(shí),包括 CETI 首席顧問(wèn) Roger Payne 博士在內(nèi)的科學(xué)家發(fā)現(xiàn),鯨魚會(huì)彼此唱歌。如下圖所示,他的唱片《座頭鯨之歌》掀起了一場(chǎng)聲勢(shì)浩大的“拯救鯨魚”運(yùn)動(dòng),這是歷史上最成功的保護(hù)行動(dòng)之一。

這場(chǎng)運(yùn)動(dòng)最終推動(dòng)了《海洋哺乳動(dòng)物保護(hù)法》的頒布,該法案標(biāo)志著大規(guī)模捕鯨時(shí)代的結(jié)束,并有效拯救了幾個(gè)瀕臨滅絕的鯨魚種群,留存下了地球上最神秘的聲音。迄今為止,工程學(xué)、AI 和語(yǔ)言學(xué)的進(jìn)步使得更深入地了解鯨魚和其他動(dòng)物的交流成為可能,打破了之前遙不可及的神話。在這個(gè)項(xiàng)目中,他們會(huì)使用自然語(yǔ)言技術(shù)來(lái)研究分析抹香鯨的 40 億個(gè)交流代碼,將每個(gè)聲音與特定的背景聯(lián)系起來(lái),這一過(guò)程至少需要五年時(shí)間。 如果該團(tuán)隊(duì)實(shí)現(xiàn)了這些目標(biāo),下一步將是開發(fā)和部署一個(gè)互動(dòng)聊天機(jī)器人,與生活在野外的抹香鯨進(jìn)行對(duì)話。

第三個(gè)問(wèn)題,AI 讀懂動(dòng)物“語(yǔ)言”的潛力如何?

我們都知道,人類通常非常擅長(zhǎng)識(shí)別他們熟悉的動(dòng)物叫聲的聲學(xué)差異。而隨著基于信號(hào)分類算法變得更加先進(jìn),我們有理由相信,人工智能將很快達(dá)到可以比人類做得更好。現(xiàn)在已經(jīng)看到一些成功的跡象。2017 年,科學(xué)家們開發(fā)的程序,能夠以大約 90% 的準(zhǔn)確率識(shí)別出許多不同的狨猴叫聲。狨猴是群居的群居動(dòng)物。他們的“詞匯”包括 10 到 15 個(gè)叫聲,每個(gè)都有自己的含義。研究表明,像人類嬰兒一樣,小狨猴通過(guò)聽到其他狨猴與它們交談來(lái)學(xué)習(xí)交流。猴子類人的交流系統(tǒng)使它們?cè)谘芯空Z(yǔ)言、社會(huì)交流或發(fā)聲的科學(xué)家中很受歡迎,攜帶自閉癥相關(guān)突變的狨猴也是研究改良這種疾病的良好模型。

一支麻省理工團(tuán)隊(duì)開發(fā)了一種算法,將來(lái)自狨猴呼叫的頻率模式轉(zhuǎn)換為圖片,然后將這些類似字母的圖像傳遞給人工神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。最終,該算法以 80% 的準(zhǔn)確率從背景噪音中篩選出猴子的談話,并且在 90% 以上的情況中正確識(shí)別出猴子發(fā)出的聲音。同年,另一個(gè)團(tuán)隊(duì)讓 AI 僅根據(jù)給羊的面部表情來(lái)識(shí)別羊是不是處于困境之中。在這項(xiàng)研究中,劍橋大學(xué)團(tuán)隊(duì)首先根據(jù)綿羊疼痛面部表情,列出了與不同疼痛程度相關(guān)的幾個(gè)“面部動(dòng)作單元”(AU),然后在 480 張綿羊照片中手動(dòng)標(biāo)記了這些 AU——鼻孔變形、每只耳朵的旋轉(zhuǎn)和每只眼睛的縮小等等。然后,他們訓(xùn)練機(jī)器學(xué)習(xí)算法通過(guò)將 90% 的照片及其標(biāo)簽提供給它,并在剩余的 10% 上測(cè)試該算法。最終,該程序識(shí)別 AU 的平均準(zhǔn)確率為 67%,與普通人的準(zhǔn)確率差不多。而且,改進(jìn)訓(xùn)練程序還能進(jìn)一步提高了準(zhǔn)確性。團(tuán)隊(duì)認(rèn)為,他們的方法也適用于其他動(dòng)物,可以為動(dòng)物帶來(lái)更好的診斷和治療方案。未來(lái),如果能同時(shí)結(jié)合聲音+圖像的想法,我們可以更全面地了解動(dòng)物可能想說(shuō)什么。借助 AI,擁有一個(gè)能夠翻譯動(dòng)物語(yǔ)言的“谷歌翻譯”固然是好事,更重要的是,目前一些物種正處于生存的關(guān)鍵時(shí)刻,隨著技術(shù)的進(jìn)步和成熟,我們可以在技術(shù)的支撐下,建設(shè)一個(gè)對(duì)人類和動(dòng)物都更光明、更密切的未來(lái)。

本文來(lái)自微信公眾號(hào) “學(xué)術(shù)頭條”(ID:SciTouTiao),作者:學(xué)術(shù)頭條,36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞: 這件 人做 動(dòng)物

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片