近期花了一些時(shí)間繼續(xù)學(xué)習(xí) ChatGPT,體會(huì)到了認(rèn)知 ChatGPT 的整個(gè)過(guò)程,就是在消除我自己偏見(jiàn)的過(guò)程。其中存在大量信息不對(duì)稱(chēng)的地方。哪怕關(guān)于 ChatGPT 的討論這么多了,噪音里面有價(jià)值的信息也并不總是好找。
(資料圖片)
接下來(lái)就分享一些觀點(diǎn)。
1. 重點(diǎn)并不是「聊天機(jī)器人」
首先,對(duì)于 ChatGPT 來(lái)說(shuō),它帶來(lái)的大家提到的 AI 的革命性進(jìn)展,壓根不是做出了好用的 chatbox,或者說(shuō)聊天機(jī)器人。
換句話說(shuō),它并不意味著,我們的生活和工作里并不會(huì)有太大變化,主要的變化就是多了一個(gè)聊天機(jī)器人。如果按照這個(gè)前提條件去聊,它看起來(lái)就不是革命性的。
要真如此的話,憑什么說(shuō)它是 iPhone 時(shí)刻?
真實(shí)情況是,聊天只是 OpenAI 做的一個(gè)演示,用它來(lái)做 demo,讓大家很好的看到了 GPT 這個(gè)模型的威力。在這個(gè)威力之外,大家還是只覺(jué)得它是聊天機(jī)器人,這就是一個(gè)啼笑皆非的事了。
當(dāng)然,我們都知道,這個(gè)聊天機(jī)器人是 OpenAI 團(tuán)隊(duì)用來(lái)獲取真實(shí)世界對(duì)話的方法,用它來(lái)繼續(xù)迭代訓(xùn)練模型,來(lái)強(qiáng)化學(xué)習(xí)的 RLHF 的一個(gè)方法。選擇開(kāi)放給用戶的這條路線,看起來(lái)好像常見(jiàn),或者說(shuō)之前也見(jiàn)過(guò),但實(shí)際上在科研領(lǐng)域這是一個(gè)非常歪門(mén)邪道、一個(gè)非常不主流的方式。
之前不管是企業(yè)還是高校,以前大家做這方面的研究,不管是大模型還是 AI 方面的研究,都是用做題家的思路,就是用各種學(xué)術(shù)界的評(píng)測(cè),如 20 個(gè)專(zhuān)家標(biāo)注的確定性的 QA 問(wèn)答題來(lái)完成。都是命題作文。
但現(xiàn)在 OpenAI 說(shuō),我不參加這些考試,我不參加這做題,我也不去跟你比論文數(shù),就是把模型扔到人民群眾的汪洋大海里去。
現(xiàn)實(shí)就是,很會(huì)寫(xiě)高考作文,和很會(huì)跟人聊天,確實(shí)是兩碼事。所以使用 ChatGPT 的時(shí)候有很多方式就不對(duì),比如我自己作為一個(gè)可能稍微了解 NLP 的,或者了解產(chǎn)品、技術(shù)實(shí)現(xiàn)邏輯的,我就會(huì)去想:這個(gè)是不是難為他了?這個(gè)他肯定不會(huì)吧?我就不問(wèn)了。
當(dāng)知道他是個(gè)機(jī)器,就容易擔(dān)心給的前提條件不夠。它胡說(shuō)八道,給一些錯(cuò)誤的答案,我是有奇怪的愧疚感的。所以就潛意識(shí)里特別照顧它,把問(wèn)題表述得格外完整才問(wèn)出來(lái)。
這樣結(jié)果就是不夠真實(shí)。包括我做 NLP 的一些老同學(xué),他們也會(huì)帶著很多假設(shè)和前提條件去問(wèn),他們問(wèn)的都不是正常人聊天會(huì)問(wèn)的。而現(xiàn)在用 ChatGPT 的大部分的人不是產(chǎn)品或者技術(shù)背景,并不知道背后的原理,所以問(wèn)出來(lái)的就更真實(shí)。OpenAI 最初也是用格外真實(shí)的語(yǔ)料去做訓(xùn)練,所以能訓(xùn)練出來(lái) ChatGPT 的效果。
2.很多當(dāng)下的問(wèn)題,都是技術(shù)性問(wèn)題
認(rèn)知的另一個(gè)偏差是,它就是一個(gè)終態(tài)了。于是會(huì)認(rèn)為它的很多問(wèn)題,代表它不智能。
比如說(shuō) ChatGPT 搜的信息不準(zhǔn)確,以及胡說(shuō)八道。很多朋友都會(huì)這么覺(jué)得,問(wèn)了幾個(gè)問(wèn)題,發(fā)現(xiàn)不對(duì),就認(rèn)為 ChatGPT 沒(méi)有什么大家說(shuō)的那么的有價(jià)值。
對(duì)于信息準(zhǔn)確性的問(wèn)題其實(shí)是好解決的,而且必然會(huì)解決。因?yàn)楝F(xiàn)在使用的模型,并不是在一句一句的學(xué),不是像某些人想象的一樣,在跟每個(gè)人溝通的時(shí)候來(lái)現(xiàn)學(xué)現(xiàn)賣(mài)(當(dāng)然在聊上下文的時(shí)候,它會(huì)考慮上下文,這個(gè)可以定義為短時(shí)的學(xué)習(xí))。背后所用的大模型,實(shí)際是一個(gè)用 2021 年的語(yǔ)料訓(xùn)練的固定的模型,這個(gè)底層的模型是沒(méi)有實(shí)時(shí)進(jìn)化能力的。
那為什么信息準(zhǔn)確這個(gè)問(wèn)題好解決?這個(gè)后面一起說(shuō)。
另外一種常見(jiàn)說(shuō)法是,ChatGPT 既然是一個(gè)生成式的工具,所以應(yīng)該是能幫助甚至替代內(nèi)容創(chuàng)作者的。目前看起來(lái),這方面的水平有限。有可能幫忙寫(xiě)個(gè)周報(bào),幫忙潤(rùn)色一下文字,幫忙寫(xiě)個(gè)小紅書(shū)筆記等等,哪怕這種簡(jiǎn)單的工作,大家也發(fā)覺(jué)了,寫(xiě)出來(lái)的 AI 感非常強(qiáng)、并不是很擅長(zhǎng)用人的語(yǔ)氣表達(dá),能明顯感覺(jué)到他整個(gè)表述的方式是有一種奇奇怪怪的感覺(jué),這種感覺(jué)就讓人心懷疑慮:這個(gè)所謂的 AI,不也模仿不了人的語(yǔ)氣嗎?你看,人類(lèi)還是有一些所謂「靈魂」的部分存在的,AI 寫(xiě)內(nèi)容,就是沒(méi)有靈魂。
而很殘酷的是,我也認(rèn)為,內(nèi)容創(chuàng)作的風(fēng)格和語(yǔ)氣也不是大問(wèn)題,依然是個(gè)技術(shù)性問(wèn)題,因?yàn)?AI 最擅長(zhǎng)的就是模仿,對(duì)于文本的模仿反而是相對(duì)來(lái)說(shuō)容易的。只不過(guò)一方面,因?yàn)?ChatGPT 是基于英文語(yǔ)料主要訓(xùn)練的(中文語(yǔ)料只有 1% 左右),所以在中文的表達(dá)上會(huì)有比較大的問(wèn)題,翻譯體很明顯。
另外就是ChatGPT本身就被刻意訓(xùn)練了。它目前這樣的語(yǔ)氣和表達(dá)風(fēng)格,是訓(xùn)練出來(lái)的,不是 AI 天然就是這樣的。因此說(shuō)這是個(gè)技術(shù)性的問(wèn)題。比如說(shuō)之前 AI 繪圖剛出來(lái)的時(shí)候,大家當(dāng)然就習(xí)慣性基于當(dāng)時(shí)的版本去考察,說(shuō) AI 能畫(huà)成這樣還不錯(cuò),但是 AI 畫(huà)的圖還都有 AI 感。這個(gè)所謂的 AI 感大概意思就是光影的問(wèn)題、細(xì)節(jié)的問(wèn)題(比如畫(huà)手),這個(gè) AI 感在 Midjourney v5 里消除得差不多了。因?yàn)檫@就是個(gè)可訓(xùn)練的技術(shù)性問(wèn)題。
(這是我用 Midjourney 畫(huà)的愛(ài)因斯坦和霍金,歷史上不存在這兩張照片)
所以 ChatGPT 信息準(zhǔn)確度的問(wèn)題,內(nèi)容表達(dá)和語(yǔ)氣的問(wèn)題,人格的問(wèn)題,都是技術(shù)問(wèn)題??赡芫蜁?huì)有朋友問(wèn)了,那你說(shuō)都是技術(shù)問(wèn)題,那 AI 發(fā)展了這么多年了,可不是每個(gè)都是技術(shù)問(wèn)題嗎?為什么 ChatGPT 就不一樣呢?
3. 重要的是「理解和推理」
ChatGPT 最特殊的地方,是揭示了一種可能性,即 AI 可以呈現(xiàn)理解和推理能力了。這是過(guò)去大半個(gè)世紀(jì)的學(xué)者們所一直追求,而不可得的。
這里要簡(jiǎn)單說(shuō)一下 GPT 背后的邏輯。首先語(yǔ)言模型是很早就有的, 10 年前我讀研的時(shí)候,如果學(xué) NLP,你翻開(kāi)教材的第一頁(yè)可能就能看到語(yǔ)言模型,就跟學(xué)高等數(shù)學(xué)第一課都是先學(xué)函數(shù)一樣,不是什么新鮮的、現(xiàn)在才發(fā)明出來(lái)的成果。
為什么作為一個(gè)語(yǔ)言模型,大家這么驚奇?并非由于它可以對(duì)話了、能寫(xiě)所謂一碗水端平的片兒湯文章了,更不是能獲取什么信息和知識(shí),而是在這個(gè)大語(yǔ)言模型當(dāng)中體現(xiàn)了推理。
體現(xiàn)了推理是一個(gè)事實(shí)論述。說(shuō)到這里,必然會(huì)有一些朋友,援引很多人包括知名學(xué)者的說(shuō)法來(lái)反駁,說(shuō)語(yǔ)言模型只是統(tǒng)計(jì)的模型,因此不能稱(chēng)之為理解和推理。
這里也不妨多說(shuō)幾句大語(yǔ)言模型的邏輯。最基礎(chǔ)的很簡(jiǎn)單,依據(jù)上文,預(yù)測(cè)下一個(gè)詞。過(guò)去能力不足,是根據(jù)一兩個(gè)詞預(yù)測(cè)下一個(gè)詞,后來(lái)出現(xiàn)了更多的算法和更好的硬件,于是可以預(yù)測(cè)更多的上下文了。像現(xiàn)在 ChatGPT 就能依據(jù)幾千個(gè)字符去做預(yù)測(cè),這歸功于有如神助的 Transformer 算法。
但是,大語(yǔ)言模型依然還是一個(gè)猜詞游戲,是統(tǒng)計(jì)意義上的一個(gè)算法,它沒(méi)有別的復(fù)雜思考,就是從海量的記憶(模型)里,搜尋出最有可能出現(xiàn)的下一個(gè)詞。
所以很自然,聽(tīng)起來(lái),無(wú)論誰(shuí)都會(huì)覺(jué)得,這種統(tǒng)計(jì)邏輯的語(yǔ)言模型,恐怕只能解決記憶問(wèn)題,不能解決邏輯問(wèn)題。就像我們讀了很多書(shū)籍、文獻(xiàn)、維基百科、百度百科等等各種知識(shí)。那接下來(lái)我們能做的是什么?很明確的,可能做一個(gè)好翻譯,或者能寫(xiě)一篇像模像樣的文章,但是搞別的應(yīng)該是不行的。畢竟是個(gè)復(fù)讀機(jī)嘛,是個(gè)「模糊的印象」(a Blurry JPEG of the Web)嘛(這是科幻作家Ted Chiang 對(duì) ChatGPT 的評(píng)價(jià),已經(jīng)被更多人認(rèn)為是偏見(jiàn)了)。
不管怎么去想象這個(gè)算法邏輯,我們都很難想象只是記憶,就能產(chǎn)生邏輯。這在 2022 年之前都是天方夜譚,而 2022 年底過(guò)后,ChatGPT 讓這變成了一個(gè)可能性。
為什么 ChatGPT 在一個(gè)詞兒一個(gè)詞兒蹦的時(shí)候就呈現(xiàn)了邏輯?這依然是個(gè)科學(xué)上的未解之謎,以及都在爭(zhēng)論不休的話題。畢竟我們想象中,一段有邏輯的文字,應(yīng)該是先設(shè)定主題,再想框架和段落,再去落筆的。
這里要特別補(bǔ)充一點(diǎn):表現(xiàn)出了推理和邏輯能力,與本質(zhì)上有沒(méi)有推理和邏輯能力,是兩碼事。前者是個(gè)事實(shí)問(wèn)題,已經(jīng)可以說(shuō)是公認(rèn)了,從原理上反駁意義不大,用過(guò)即知;后者則是個(gè)哲學(xué)問(wèn)題,還在爭(zhēng)論之中。
什么叫有邏輯能力很早就是學(xué)術(shù)界有爭(zhēng)議的話題,從控制論出現(xiàn)就在討論「看起來(lái)的智能是不是智能」的問(wèn)題了。同時(shí),人腦運(yùn)作的很多原理目前尚不清楚,如何產(chǎn)生的邏輯推理,也不清晰。
很奇妙的是,在目前的模型中,「think step by step」是一個(gè)很好用的咒語(yǔ),跟人的思考是很像的,機(jī)器只要不是直接給結(jié)果,而是多想幾步,就能呈現(xiàn)非常好的效果。
這些都是題外話了。實(shí)際上對(duì)產(chǎn)學(xué)研而言最驚訝和最興奮的,不是討論本質(zhì)上有沒(méi)有推理和邏輯能力,而是表現(xiàn)上有沒(méi)有。
4. 通往通用人工智能之路
OpenAI在這個(gè)大語(yǔ)言模型上做了什么,把 GPT 以及 ChatGPT 做出來(lái)的?其實(shí)沒(méi)做太多算法上的、底層規(guī)則上的很復(fù)雜的事情。而是用很工程的手段,甚至堪稱(chēng)暴力的手段去訓(xùn)練,然后反復(fù)地調(diào)試。
所以一個(gè)非常古老的、已經(jīng)長(zhǎng)滿了青苔的語(yǔ)言模型,居然可以實(shí)現(xiàn)有推理能力的高水準(zhǔn)的 AI,非常叫人意外。追求 AGI 的路,從 1956 年達(dá)特茅斯會(huì)議實(shí)際已經(jīng)啟航了,明斯基、麥卡錫、司馬賀、紐厄爾這些人工智能的創(chuàng)始人,本來(lái)預(yù)期是十年二十年就實(shí)現(xiàn)的夢(mèng)想,花了大半個(gè)世紀(jì),依然進(jìn)展不大。
學(xué)者們最開(kāi)始想的,跟大多數(shù)人想象的 AI 必須先學(xué)的一步是類(lèi)似的,就是學(xué)習(xí)推理。他們被稱(chēng)為符號(hào)派,就是把世間萬(wàn)物的所有的邏輯和知識(shí)抽象出來(lái),把它們變成形式語(yǔ)言,像數(shù)學(xué)題一樣可以計(jì)算與推演,一生萬(wàn)物,不就是智能嗎?這條路一度是人工智能的主流派系,一直到 20-30 年后,嘗試了各種各樣的方向,發(fā)覺(jué)全都被堵死了。
接下來(lái)就是統(tǒng)計(jì)學(xué)習(xí)和深度學(xué)習(xí)的時(shí)代,就是讓機(jī)器去自我消化數(shù)據(jù),它就能解決問(wèn)題。這時(shí)候的學(xué)者們更落地、更實(shí)在了,不關(guān)心 AGI,而是關(guān)心垂直課題了,比如說(shuō)人臉識(shí)別、自動(dòng)駕駛、下圍棋和玩游戲等等,這些似乎都是做的還不錯(cuò)的。語(yǔ)言模型也在其中,大家認(rèn)為它能解決一些問(wèn)題(谷歌翻譯和百度翻譯就是語(yǔ)言模型的邏輯),顯然不能解決一切問(wèn)題。
而 ChatGPT 的啟示,就像說(shuō)有一個(gè)田徑隊(duì),短跑、長(zhǎng)跑、接力跑、馬拉松等等運(yùn)動(dòng),有不同的教練去用不同的方法訓(xùn)練,畢竟是不同的課題。但是今天,有一個(gè)教練,用了全新的方法訓(xùn)練了一個(gè)隊(duì)員,發(fā)現(xiàn)這隊(duì)員跑啥都行,接力跑、長(zhǎng)跑、短跑都能拿好的名次,甚至跑去試了試扔鉛球也是前幾名,扔標(biāo)槍也是前幾名,跳鞍馬也是前幾名,他不一定都能拿到第一,但這個(gè)效果大家非常驚訝。
還是前文說(shuō)的,有邏輯、能從信息中發(fā)掘知識(shí),并不是個(gè)值得爭(zhēng)論的問(wèn)題,它是個(gè)事實(shí)。很多學(xué)者花了很多年研究,怎樣讓機(jī)器識(shí)別詞性(形容詞、動(dòng)詞、名詞等),這是個(gè)專(zhuān)有課題,而詞性標(biāo)注的效果,ChatGPT 也完成得很好。類(lèi)似的課題,非常大量。用三體的話說(shuō),說(shuō)許多學(xué)者、博士們還在研究的NLP 的中間課題不存在了,一點(diǎn)兒也不為過(guò)。哪怕不提這些研究課題,注冊(cè)使用下 GPT-4,你肯定也會(huì)有體感,這種體感是不會(huì)說(shuō)謊的。
那么 AI 有了邏輯和理解能力,能做什么呢?能做太多了。
前面說(shuō)的技術(shù)性的問(wèn)題,反而可以交給一些基于規(guī)則的產(chǎn)品解決。例如,ChatGPT 自己可能信息不全,但它能比很多人更好地查到所要的信息,而不只是把網(wǎng)頁(yè)排個(gè)序;ChatGPT 自己可能不會(huì)寫(xiě)很厲害的文章,但經(jīng)過(guò)一個(gè)熟練的寫(xiě)手訓(xùn)練之后,確實(shí)能理解你想要什么,就能變成一個(gè)有固定文風(fēng)的寫(xiě)手;原生的 ChatGPT 可能完全不知道怎么使用 Word,但是讓它看大量的人是怎么使用的,很快也就能學(xué)會(huì)了。
這才是 ChatGPT 最不一樣的地方:它比之前所有的 AI 都更像一個(gè) AI。當(dāng) AI 這個(gè)詞在 1956 年出現(xiàn)的時(shí)候,大家想象的是一個(gè)智能的東西,而現(xiàn)在,它真的出現(xiàn)了,至少有了真正智能的可能性。這一點(diǎn)在學(xué)術(shù)圈和科研領(lǐng)域最早引起了轟動(dòng),可能比普通用戶的震驚程度還要大。
之前是大家看不到通往通用人工智能的路的,所以 ChatGPT 的意義不是聊天機(jī)器人本身,而是這個(gè)新的范式,揭示了一種全新的可能性。未必是唯一的可能性,但確實(shí)是一種可能性。過(guò)去從來(lái)沒(méi)有過(guò)的可能性。
5. 繼續(xù)推演未來(lái)
接下來(lái)可能會(huì)發(fā)生什么呢?我觀察和思考到了 7 個(gè)方面,分享一下。
第一:不光 AI 的企業(yè)都得投入大模型,而且很快會(huì)進(jìn)入工程上的軍備競(jìng)賽。
這里跟很多朋友想的不一樣,大模型不是比參數(shù)量。如果去搜參數(shù)量的模型,快手還官方自豪地發(fā)布過(guò)一個(gè)有萬(wàn)億參數(shù)量的模型,當(dāng)然跟 GPT-3 也沒(méi)法比。
同時(shí),也不是單純比數(shù)據(jù)多少。數(shù)據(jù)確實(shí)是一個(gè)壁壘,但是還有一個(gè)更加核心的競(jìng)爭(zhēng)力,即調(diào)試工程。比如對(duì)于百度,之前做的文心大模型,底層數(shù)據(jù)量真的不比 OpenAI 的少,或者很有肯跟底層的模型都不一定比 GPT-3 的質(zhì)量差。只是完全沒(méi)有采用 ChatGPT 的方法訓(xùn)練(InstructGPT),也就是怎么激發(fā)。激發(fā)也是非常玄學(xué)和魔幻,OpenAI 有一個(gè)人數(shù)不小的工程團(tuán)隊(duì),專(zhuān)門(mén)通過(guò)語(yǔ)料和代碼,做激發(fā)和調(diào)試,讓它變得更智能。
這可以說(shuō)是最后畫(huà)龍點(diǎn)睛的一步。就像說(shuō)有一個(gè)天分特好的小孩,需要調(diào)教,而如何調(diào)教是不存在一個(gè)很確定性的方法論的,調(diào)教本身也是個(gè)黑盒,有很多坑每個(gè)團(tuán)隊(duì)都得慢慢趟、反復(fù)試錯(cuò)。
從 GPT-3 這個(gè)底層模型的出現(xiàn),到 ChatGPT ,其實(shí)花了很多的工夫,在這個(gè)過(guò)程中,工程比研究要重要得多。學(xué)術(shù)研究它提供的是方法,但是 ChatGPT 背后并沒(méi)有新的方法,更重要的還是工程團(tuán)隊(duì)用了一些所謂的比較 tricky 的方法。所以 OpenAI 公開(kāi)了底層的算法和邏輯,并沒(méi)有公開(kāi) ChatGPT 的源代碼。對(duì)于百度來(lái)說(shuō),花了一兩個(gè)月重新開(kāi)始調(diào)教,效果肯定跟 ChatGPT 是沒(méi)法比的。百度和國(guó)內(nèi)其它家面臨的大多也是調(diào)教的問(wèn)題,想要砸錢(qián)訓(xùn)練出來(lái)一個(gè)底層的 GPT-3 的模型不是難點(diǎn),InstructGPT 才是。
第二,如何調(diào)教,會(huì)直接影響 AI 成為什么樣的 AI。
并不是說(shuō)各種不同的團(tuán)隊(duì)去激發(fā)大語(yǔ)言模型,最后激發(fā)出來(lái)的效果殊途同歸、一定是一個(gè)東西。很多沒(méi)有了解技術(shù)細(xì)節(jié)的朋友總覺(jué)得 ChatGPT 很蠢,因?yàn)榭偸且煌胨似?、按格式?lái)寫(xiě)命題作文,這個(gè)是刻意調(diào)教的結(jié)果。為的是獲取最大公約數(shù)的用戶,不要出現(xiàn)任何政治錯(cuò)誤的問(wèn)題、偏見(jiàn)的問(wèn)題。
想要真的調(diào)教一個(gè)極端分子、調(diào)教一個(gè)特別溫柔心理咨詢(xún)師,甚至調(diào)教一個(gè)詩(shī)人,原則上都是可以的,就看怎么調(diào)。
一種說(shuō)法是,目前的 OpenAI 用了 6 萬(wàn)多條語(yǔ)料就調(diào)出來(lái)了 ChatGPT。那用別的語(yǔ)料、用更多的語(yǔ)料,會(huì)發(fā)生什么?可以預(yù)見(jiàn)的是,未來(lái)各種各樣的人格都會(huì)調(diào)出來(lái),不同團(tuán)隊(duì)做的 AI 風(fēng)格各異,跟人與人的區(qū)別一樣。
因此,ChatGPT 并不是,有一個(gè)團(tuán)隊(duì)花了很多年種出來(lái)了一個(gè)品種的蘋(píng)果,這個(gè)品種的蘋(píng)果叫 ChatGPT,你吃了一口這個(gè)蘋(píng)果說(shuō)太酸了,扔了。就認(rèn)為這件事沒(méi)有價(jià)值。
這個(gè)叫 ChatGPT 的蘋(píng)果是重要的,但更重要的是,發(fā)現(xiàn)了一片叫大語(yǔ)言模型的土地,可以種各種 AI 的水果,不光有蘋(píng)果,還有梨子、菠蘿、葡萄等等,有大量的可能性。這是一定會(huì)發(fā)生的?,F(xiàn)在很多團(tuán)隊(duì)去追逐的,并不是要做同一個(gè)品種的、酸甜度一模一樣的叫 ChatGPT 度蘋(píng)果出來(lái),而是都看到了這里面做其它水果的價(jià)值。
第三, ChatGPT 的這個(gè)范式是可靠的,那很多技術(shù)性的問(wèn)題解決就只是時(shí)間問(wèn)題。
這是在回應(yīng)前面說(shuō)的問(wèn)題。只要這個(gè)范式是可靠的,很多技術(shù)性的問(wèn)題無(wú)非就是加算力、加數(shù)據(jù)以及有耐心地調(diào)教。
早在 1956 年塞謬爾就做過(guò)一個(gè)跳棋程序,在當(dāng)年已經(jīng)能下贏很多專(zhuān)業(yè)選手了,那時(shí)很多科學(xué)家就意識(shí)到,未來(lái)機(jī)器能在棋類(lèi)游戲中下贏人類(lèi),只是個(gè)時(shí)間問(wèn)題(包括在讀大學(xué)的陸奇,就有這個(gè)洞察了)。到了 1997 年,深藍(lán)下贏了國(guó)際象棋大師, 到了 2016 年 AlphaGo 下贏了圍棋世界冠軍,如今的很多游戲 AI,DOTA2、星級(jí)爭(zhēng)霸 2 的 AI 也都可以下贏很多頂級(jí)的選手。在范式不變且可靠的前提下,學(xué)會(huì)下棋就是個(gè)技術(shù)性問(wèn)題,也就意味著是個(gè)時(shí)間問(wèn)題。
對(duì)有邏輯能力的大模型來(lái)說(shuō),前文說(shuō)過(guò)的信息準(zhǔn)確度的問(wèn)題,都未必在內(nèi)部解決。ChatGPT 也可以跟訓(xùn)練有素的有數(shù)學(xué)知識(shí)的產(chǎn)品合作。就像一個(gè)聰明小孩,不懂?dāng)?shù)學(xué)但是足夠聰明,那可以配個(gè)小伙伴,這個(gè)小伙伴不是很聰明,但上過(guò)奧數(shù)班,倆人一搭配,問(wèn)題就解決了。這不是假想。
知名的計(jì)算智能引擎產(chǎn)品 Wolframe 就跟 ChatGPT 合作了,可以在補(bǔ)充了更準(zhǔn)確的知識(shí)和規(guī)則的前提下,解決大量的問(wèn)題,比如化學(xué)、數(shù)學(xué)、物理、地理、幾何、歷史、材料、工程等等。
(來(lái)源:ChatGPT Gets Its “Wolfram Superpowers”!)
第四,解決各種問(wèn)題的速度,或者說(shuō)滿足各種需求的速度,可能是指數(shù)級(jí)的。
這個(gè)是很感性的判斷,確實(shí)沒(méi)有很有說(shuō)服力的論據(jù)?,F(xiàn)在大家也都不知道多長(zhǎng)時(shí)間會(huì)發(fā)生什么事情。不過(guò)大概率它的發(fā)展速度不會(huì)是線性的,因?yàn)槿四X的學(xué)習(xí)是緩慢的,畢竟神經(jīng)元信號(hào)傳遞存在速度限制、神經(jīng)元的數(shù)量和規(guī)模有整體的限制的。但計(jì)算機(jī)不一樣,就像一個(gè)人腦不行,那可以連接 10 個(gè)人腦。10 個(gè)愛(ài)因斯坦的腦袋連起來(lái),它是不是乘以 10 不一定,但的進(jìn)化速度肯定比生物進(jìn)化要快得多。
ChatGPT 的成功會(huì)讓已經(jīng)在過(guò)去領(lǐng)域里卷到疲倦的大廠,紛紛進(jìn)入軍備競(jìng)賽,這也會(huì)加速這個(gè)進(jìn)程。另外,對(duì)于很多場(chǎng)景來(lái)說(shuō),讓產(chǎn)品對(duì)接大模型,是不復(fù)雜的,ChatGPT 作為中間層很合適,主要負(fù)責(zé)解釋和推理,并不用每個(gè)場(chǎng)景都再訓(xùn)練一遍(未來(lái)難說(shuō)會(huì)不會(huì)各種場(chǎng)景都有自己的大模型)。從 Office 和 Adobe 這么快的跟進(jìn)也可見(jiàn)一斑。
這里就有一個(gè)很殘酷的現(xiàn)實(shí),就是業(yè)務(wù)融合 AI 模塊之后,每個(gè)打工人在用 AI 的這個(gè)過(guò)程,就是在加速淘汰自己的過(guò)程。
第五,調(diào)試工程師會(huì)變成很值錢(qián)的崗位。
這個(gè)好理解,對(duì)于大模型來(lái)說(shuō),可解釋性非常差,換句話說(shuō),可控性很差。前面也說(shuō)了,它是非常巨大的黑盒,只能通過(guò)調(diào)教、不能通過(guò)指揮,不能指哪打哪,說(shuō)這個(gè)問(wèn)題回答得不好,下次必須這么這么回答——沒(méi)法這么去訓(xùn)練它。所以調(diào)教就顯得特別重要了,調(diào)試工程師就會(huì)變得越來(lái)越值錢(qián)。
不過(guò)調(diào)試工程師到底具備什么樣的能力?了解場(chǎng)景,還是了解代碼?這個(gè)不大清楚。這是個(gè)全新的崗位,大家都在探索。
第六,失業(yè)問(wèn)題。
可惜的是,值錢(qián)的崗位未來(lái)不會(huì)特別多,但不值錢(qián)的崗位會(huì)變得越來(lái)越多。
失業(yè)問(wèn)題很有意思,之前 OpenAI 自己官方下場(chǎng)寫(xiě)了一篇報(bào)告,具體內(nèi)容就不展開(kāi)說(shuō)了,只說(shuō)最后的幾個(gè)結(jié)論:
第一,80% 的人受影響,會(huì)有 10% 的工作內(nèi)容受 LLM 影響(受影響的定義是同等質(zhì)量的工作成果,降低 50% 的工作時(shí)間),19%的人「大受影響」,即會(huì)有至少 50% 的工作內(nèi)容受 LLM 影響。
第二,薪資越高的人越容易受影響。受過(guò)良好教育的、有豐富工作經(jīng)驗(yàn)的、高薪的職業(yè),被影響的概率是偏大的。
第三,有一個(gè)影響程度排行榜,其實(shí)就是高危列表。里面高頻出現(xiàn)的包括:數(shù)學(xué)家、口譯員和筆譯員、作家和寫(xiě)手、區(qū)塊鏈工程師等。
第四,部分職業(yè)存在可能性被徹底替代掉。對(duì)于這個(gè)榜單,人工標(biāo)注的結(jié)果里有 15 個(gè)職業(yè);GPT-4 標(biāo)注的結(jié)果里有 86 個(gè)職業(yè)。AI 下手果然還是更狠一些。
(報(bào)告來(lái)源:https://arxiv.org/pdf/2303.10130.pdf)
感興趣的朋友可以自己讀一下全文。這個(gè)估計(jì)當(dāng)然不會(huì)特別準(zhǔn)確,但是他們用了盡可能量化的方式,有一定預(yù)見(jiàn)性。未來(lái)會(huì)不會(huì)發(fā)生?我認(rèn)為大概率確實(shí)會(huì)發(fā)生的,只是時(shí)間上不好講。有一些相對(duì)容易落地、容易快速被替換掉的,比如說(shuō)個(gè)體戶可能危險(xiǎn)性更大一些。比如做插畫(huà)的畫(huà)師、做電商圖片的這些美工、一些公眾號(hào)的小編等等。大公司的組織,整個(gè)工作內(nèi)容或者崗位要做調(diào)整,會(huì)有組織管理上的問(wèn)題,可能會(huì)慢一些。
那這中間可能也有過(guò)渡期,比如 AI 繪圖變成主流之后,畫(huà)師們未必就全都失業(yè)。就像 Photoshop 出現(xiàn)之后大家更多是從用紙和筆去繪圖,變成了用另外一個(gè)工具去做。未來(lái) AI 繪圖背后,也要有需求轉(zhuǎn)化的這一步(prompt engineering) 。不過(guò)比較悲觀的是,AI 繪圖和 Photoshop 不一樣,還是存在效率差異的。用紙和筆的畫(huà)師和用 Photoshop 的畫(huà)師,生產(chǎn)力的變化可能沒(méi)那么大;但是 AI 的生產(chǎn)力是劇烈的大幅提升,意味著不太需要那么多從業(yè)者了。這就必然有一個(gè)結(jié)構(gòu)性的大的波動(dòng)。那未來(lái)會(huì)怎么樣?會(huì)不會(huì)出現(xiàn)大的社會(huì)問(wèn)題?這個(gè)就不是我能討論的了。
第七,大多數(shù)人機(jī)交互都不存在了。
冰箱發(fā)明之前,很多人研究的是怎么存儲(chǔ)冰塊、制造冰塊,有了冰箱,就不再需要這種冷藏方式了。對(duì)于產(chǎn)品交互也是這樣,用戶過(guò)去為什么要點(diǎn)按鈕?要做各種操作?包括用 Photoshop、 Word 里很多反人類(lèi)的各種各樣的、根本記不住的復(fù)雜的功能。
所以我們看起來(lái)更像是處于過(guò)渡期,真的技術(shù)能力達(dá)到以后,當(dāng)下的大多數(shù)人機(jī)交互也沒(méi)有必要存在了,只需要剩下自然語(yǔ)言交互,這就跟我寫(xiě)過(guò)的那篇猜想對(duì)應(yīng)上了(從 ChatGPT 看 AI 未來(lái)的 7 種場(chǎng)景可能性)。
跟寫(xiě)之前的文章時(shí)不一樣,我這段時(shí)間試用了 GPT-4 基礎(chǔ)上的 ChatGPT,包括跟更多專(zhuān)家聊了一些技術(shù)上的問(wèn)題?,F(xiàn)在的我覺(jué)得這是很有確定性的。就像前面說(shuō)的,現(xiàn)在的發(fā)展是指數(shù)級(jí)的速度。
寫(xiě)在最后
如今 ChatGPT 發(fā)布后,整個(gè)產(chǎn)學(xué)研都已經(jīng)到了快車(chē)道上了,這個(gè)快車(chē)道上是沒(méi)有人有能力去踩剎車(chē)的。我們作為個(gè)體,也是不可能回避這個(gè) AI 的歷史車(chē)輪的。
大家都知道阿里有一個(gè)經(jīng)常被群嘲的價(jià)值觀,叫擁抱變化。這個(gè)詞現(xiàn)在看感覺(jué)還挺應(yīng)景的。
所以不如反過(guò)來(lái)想問(wèn)題:汽車(chē)時(shí)代來(lái)的時(shí)候,馬車(chē)夫肯定非常焦慮,馴馬師也很焦慮。不過(guò)汽車(chē)是工具,對(duì)大部分人來(lái)說(shuō)它是非常有幫助的。它的出現(xiàn)并不是說(shuō)要摧毀誰(shuí),摧毀哪些崗位,或者摧毀哪個(gè)行業(yè)。它還是為人類(lèi)服務(wù)的。
我們可以用汽車(chē)做很多有價(jià)值的事。沒(méi)有交通工具的效率提升,全球化也不可能發(fā)生。我們可以多想一下,有了 AI 我們能干什么。
最近跟身邊幾個(gè)比較要好的朋友聊 AI,大家達(dá)成的一致,都是先用起來(lái)。先用它做點(diǎn)什么,感受下它能做什么、不能做什么。未來(lái)有無(wú)限的可能性,不妨把目光放長(zhǎng)遠(yuǎn)一點(diǎn);不糾結(jié)當(dāng)下的得失,看看 AI 未來(lái)的機(jī)會(huì)。保持這樣的心態(tài)也許更容易接受變化。
就說(shuō)到這里,希望對(duì)你有啟發(fā)。
題圖由 Midjourney 繪制。
關(guān)鍵詞:
- 天天資訊:認(rèn)知 ChatGPT 的過(guò)程就是消除偏見(jiàn)的過(guò)程
- 看熱訊:《龍與地下城》爛番茄91%,游改影開(kāi)始“上道”
- 世界觀察:前職業(yè)撲克手、貨拉拉創(chuàng)始人周勝馥躋身億萬(wàn)富豪行列
- AI+無(wú)代碼將如何重新定義軟件?
- 全球即時(shí)看!中國(guó)意大利商會(huì)首席財(cái)務(wù)官:意企業(yè)期待通過(guò)消博會(huì)平臺(tái)共享中國(guó)高質(zhì)量發(fā)展機(jī)遇
- 天天滾動(dòng):【外眼中國(guó)YOUNG】意大利漢學(xué)家唐云:溫州有一群有激情的人
- 天天熱資訊!中國(guó)公民對(duì)政府的信任度持續(xù)領(lǐng)跑全球
- 今日觀點(diǎn)!全球連線|中國(guó)-中東歐(滄州)中小企業(yè)合作區(qū)深化中國(guó)與中東歐國(guó)家經(jīng)貿(mào)合作
- 【世界快播報(bào)】騰訊高級(jí)執(zhí)行副總裁湯道生:騰訊正研發(fā)類(lèi)ChatGPT聊天機(jī)器人
- 【時(shí)快訊】捷安高科:3月30日召開(kāi)董事會(huì)會(huì)議
- 贛鋒鋰業(yè):目前終端市場(chǎng)對(duì)于電動(dòng)汽車(chē)的需求仍在 鋰鹽價(jià)格向下空間可能不大
- 萬(wàn)科A:2022年度營(yíng)收同比增長(zhǎng)11.27%
- 【快播報(bào)】取消發(fā)行上百只 涉及規(guī)模超千億!資產(chǎn)荒又來(lái)了?
- 均勝電子:2022年凈利3.94億元 同比扭虧為盈
- 今日熱聞!極佳(極佳是什么意思?)
- 上海無(wú)償獻(xiàn)血比例最高達(dá)每千人15.24人次 倡導(dǎo)“獻(xiàn)-供”聯(lián)動(dòng)模式
- 毒品問(wèn)題困擾加拿大 攜少量毒品免罪難治社會(huì)“毒瘤”
- 當(dāng)前要聞:中國(guó)意大利商會(huì)首席財(cái)務(wù)官:意企業(yè)期待通過(guò)消博會(huì)平臺(tái)共享中國(guó)高質(zhì)量發(fā)展機(jī)遇
- 全球看熱訊:全球連線|中國(guó)-中東歐(滄州)中小企業(yè)合作區(qū)深化中國(guó)與中東歐國(guó)家經(jīng)貿(mào)合作
- 環(huán)球時(shí)訊:從行業(yè)盛會(huì)到全民盛宴 網(wǎng)絡(luò)視聽(tīng)(成都)映像周·嘉年華“破圈”而來(lái)
- 低碳菜單引領(lǐng)寧波餐飲消費(fèi)新風(fēng)尚 試點(diǎn)將持續(xù)至今
- 深圳坪山打造餐飲服務(wù)食品安全示范高地 嚴(yán)守食品
- 黑龍江哈爾濱推出“沙盒”監(jiān)管新模式 激發(fā)市場(chǎng)活
- 第三季度全國(guó)消協(xié)受理投訴數(shù)量同比增10.02% 食品
- 北京懷柔對(duì)機(jī)動(dòng)車(chē)檢測(cè)機(jī)構(gòu)開(kāi)展監(jiān)督抽查 規(guī)范機(jī)動(dòng)
- 天津北辰扎實(shí)做好價(jià)格監(jiān)管工作 維護(hù)安全有序市場(chǎng)
- 北京石景山開(kāi)展冬季供暖前特種設(shè)備安全專(zhuān)項(xiàng)檢查
- 陜西延安:開(kāi)展兒童化妝品專(zhuān)項(xiàng)檢查 規(guī)范化妝品市
- 北京海淀開(kāi)展商品條碼專(zhuān)項(xiàng)監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進(jìn)網(wǎng)絡(luò)直播營(yíng)銷(xiāo)治理顯成效 培育放心消費(fèi)直
- 1 天天資訊:認(rèn)知 ChatGPT 的過(guò)程就是消除偏見(jiàn)的過(guò)程
- 2 看熱訊:《龍與地下城》爛番茄91%,游改影開(kāi)始“上
- 3 世界觀察:前職業(yè)撲克手、貨拉拉創(chuàng)始人周勝馥躋身億
- 4 AI+無(wú)代碼將如何重新定義軟件?
- 5 全球即時(shí)看!中國(guó)意大利商會(huì)首席財(cái)務(wù)官:意企業(yè)期待
- 6 天天滾動(dòng):【外眼中國(guó)YOUNG】意大利漢學(xué)家唐云:溫州
- 7 天天熱資訊!中國(guó)公民對(duì)政府的信任度持續(xù)領(lǐng)跑全球
- 8 今日觀點(diǎn)!全球連線|中國(guó)-中東歐(滄州)中小企業(yè)合
- 9 【世界快播報(bào)】騰訊高級(jí)執(zhí)行副總裁湯道生:騰訊正研
- 10 【時(shí)快訊】捷安高科:3月30日召開(kāi)董事會(huì)會(huì)議