首頁(yè)>資訊 >
GPT-4背后的開(kāi)發(fā)者:七大團(tuán)隊(duì),三十余位華人 2023-03-18 15:41:43  來(lái)源:36氪

這個(gè)星期,OpenAI 大模型 GPT-4 的發(fā)布讓全球科技圈的技術(shù)競(jìng)爭(zhēng)進(jìn)入了白熱化。幾天之內(nèi),ChatGPT、必應(yīng)搜索和 Microsoft 365 相繼接入 GPT-4,微軟的 AI 應(yīng)用瞬間比競(jìng)爭(zhēng)對(duì)手拉開(kāi)一個(gè)身位,甚至有人說(shuō),新的工業(yè)革命開(kāi)始了。


【資料圖】

一方面我們被 GPT-4 的效果所震撼,一方面我們也迫不及待的想要了解背后的技術(shù),好奇它的訓(xùn)練方法、使用的算力等。

但遺憾的是,OpenAI 并不 Open。在公開(kāi)的論文(其實(shí)更像技術(shù)報(bào)告)中,OpenAI 明確地說(shuō),GPT-4 模型使用 RLHF 精調(diào)外,不會(huì)公開(kāi)任何技術(shù)細(xì)節(jié)。

鑒于 GPT-4 等大型模型的競(jìng)爭(zhēng)性與安全影響,本報(bào)告不包含有關(guān)架構(gòu)(包括模型大?。⒂布?、訓(xùn)練計(jì)算、數(shù)據(jù)集構(gòu)建、訓(xùn)練方法等更多詳細(xì)信息。

不過(guò),在此報(bào)告中,OpenAI 詳細(xì)列出了貢獻(xiàn)者及其負(fù)責(zé)的工作內(nèi)容。這值得我們細(xì)致研究。這幾百人的貢獻(xiàn)者名單與分類(lèi),能讓我了解到 GPT-4 的成功背后包含了哪些部門(mén)、技術(shù)分枝的努力。

在這篇文章中,我們對(duì)有代表性的貢獻(xiàn)者進(jìn)行了盤(pán)點(diǎn),期待能為讀者帶來(lái)啟發(fā)。

研發(fā)人員占絕大多數(shù)

從組織架構(gòu)的設(shè)置上看,GPT-4 幕后的研發(fā)團(tuán)隊(duì)大致可分為七個(gè)部分:預(yù)訓(xùn)練(Pretraining)、長(zhǎng)上下文(Long context)、視覺(jué)(Vision)、強(qiáng)化學(xué)習(xí) & 對(duì)齊(RL & alignment)、評(píng)估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他貢獻(xiàn)者(Additional contributions)。

預(yù)訓(xùn)練部分的工作細(xì)分為:

計(jì)算機(jī)集群擴(kuò)展(Compute cluster scaling)

數(shù)據(jù)(Data)

分布式訓(xùn)練基礎(chǔ)設(shè)施(Distributed training infrastructure)

硬件正確性(Hardware correctness)

優(yōu)化 & 架構(gòu)(Optimization & architecture)

Training run babysitting

長(zhǎng)上下文部分的工作細(xì)分為:

長(zhǎng)上下文研究(Long context research)

長(zhǎng)上下文內(nèi)核(Long context kernels)

視覺(jué)部分的工作細(xì)分為:

架構(gòu)研究(Architecture research)

計(jì)算機(jī)集群擴(kuò)展(Compute cluster scaling)

分布式訓(xùn)練基礎(chǔ)設(shè)施(Distributed training infrastructure)

硬件正確性(Hardware correctness)

數(shù)據(jù)(Data)

對(duì)齊數(shù)據(jù)(Alignment Data)

Training run babysitting

部署 & 后訓(xùn)練(Deployment & post-training)

強(qiáng)化學(xué)習(xí) & 對(duì)齊部分的工作細(xì)分為:

數(shù)據(jù)集貢獻(xiàn)(Dataset contributions)

數(shù)據(jù)基礎(chǔ)設(shè)施(Data infrastructure)

ChatML 格式(ChatML format)

模型安全(Model safety)

Refusals

基礎(chǔ) RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)

Flagship training runs

代碼功能(Code capability)

評(píng)估 & 分析部分的工作細(xì)分為:

OpenAI Evals 庫(kù)

模型等級(jí)評(píng)估基礎(chǔ)設(shè)施(Model-graded evaluation infrastructure)

加速預(yù)測(cè)(Acceleration forecasting)

ChatGPT 評(píng)估

能力評(píng)估(Capability evaluations)

編碼評(píng)估(Coding evaluations)

真實(shí)世界用例評(píng)估(Real-world use case evaluations)

污染調(diào)查(Contamination investigations)

指令遵循和 API 評(píng)估(Instruction following and API evals)

新功能評(píng)估(Novel capability discovery)

……

細(xì)讀貢獻(xiàn)者名單,不難發(fā)現(xiàn),GPT-4 項(xiàng)目團(tuán)隊(duì)的成員通常「身兼數(shù)職」。對(duì)于希望追趕 ChatGPT 的科技公司來(lái)說(shuō),OpenAI 提供的部門(mén)架構(gòu)樣板提供了一些可以學(xué)習(xí)的思路。另外,它對(duì)于 AI 領(lǐng)域人才的未來(lái)發(fā)展方向或許也有一些啟示。

在 ChatGPT 發(fā)布之后,OpenAI 在人才招聘方面也做出了一些調(diào)整,招募了數(shù)十名前谷歌和 Meta 員工來(lái)創(chuàng)建人工智能聊天機(jī)器人。

在 OpenAI 上,谷歌作為「硅谷黃埔軍?!沟拿^算是坐實(shí)了:根據(jù) LeadGenius 和 Punks & Pinstripes 的數(shù)據(jù)顯示,該公司的 300 多名員工(數(shù)據(jù)截止到 2023 年 1 月)中有許多來(lái)自谷歌和 DeepMind 的母公司 Alphabet。數(shù)據(jù)顯示,OpenAI 目前雇傭了約 59 名谷歌前員工和約 34 名 Meta 前員工,同時(shí)包括幾名蘋(píng)果和亞馬的前遜員工。

鑒于 OpenAI 在 GPT-4 發(fā)布的第一時(shí)間就公開(kāi)了所有貢獻(xiàn)者名單,機(jī)器之心整理了一部分參與工作的華人學(xué)者。如果遺漏,歡迎補(bǔ)充。

預(yù)訓(xùn)練組

Trevor Cai

Trevor Cai 是 GPT-4 項(xiàng)目中吞吐量團(tuán)隊(duì)的負(fù)責(zé)人。Trevor Cai 本碩畢業(yè)于南加州大學(xué),2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,擔(dān)任軟件工程師。

袁啟明

袁啟明(Qiming Yuan)是 GPT-4 項(xiàng)目數(shù)據(jù)集來(lái)源和處理團(tuán)隊(duì)的負(fù)責(zé)人。袁啟明本科畢業(yè)于清華大學(xué),碩士畢業(yè)于得克薩斯大學(xué)奧斯汀分校,2018 年加入 OpenAI。此前,袁啟明曾在微軟工作近三年。

Che Chang

Che Chang 作為 OpenAI 的副總法律顧問(wèn)參與了 GPT-4 的研發(fā),他博士畢業(yè)于美國(guó)西北大學(xué),2021 年加入 OpenAI,此前在 AWS 領(lǐng)導(dǎo)了人工智能 / 機(jī)器學(xué)習(xí)和市場(chǎng)業(yè)務(wù)的法律團(tuán)隊(duì)。最近一段時(shí)間,OpenAI 的法律團(tuán)隊(duì)還在招聘 AI 產(chǎn)品顧問(wèn)。

歐陽(yáng)龍

歐陽(yáng)龍 2019 年加入 OpenAI,擔(dān)任研究科學(xué)家。Long Ouyang 本科畢業(yè)于哈佛大學(xué),博士畢業(yè)于斯坦福大學(xué),曾在斯坦福大學(xué)任博士后研究員。歐陽(yáng)龍也參與研發(fā)了 ChatGPT 相關(guān)的技術(shù)項(xiàng)目,他還是 InstructGPT 論文的第一作者。

翁麗蓮

翁麗蓮(Lilian Weng)是 OpenAI 人工智能應(yīng)用研究的負(fù)責(zé)人,2018 年加入 OpenAI,在 GPT-4 項(xiàng)目中主要參與預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí) & 對(duì)齊、模型安全等方面的工作。

Tao Xu

Tao Xu 2019 年加入 OpenAI,先后畢業(yè)于北京大學(xué)、康奈爾大學(xué)。Tao Xu 曾在微軟的必應(yīng)機(jī)器學(xué)習(xí)研究組工作四年。

Jie Tang

Jie Tang 在加州大學(xué)伯克利分校獲得計(jì)算機(jī)科學(xué)博士學(xué)位,導(dǎo)師是 Pieter Abbeel。加入 OpenAI 前,他曾在初創(chuàng)公司和 Dropbox 工作約四年時(shí)間。Jie Tang 本科就讀于哈佛大學(xué),2008 年獲得計(jì)算機(jī)科學(xué)和經(jīng)濟(jì)學(xué)學(xué)士學(xué)位。

Ben Wang

Ben Wang 目前是賓夕法尼亞大學(xué)本科生,2021 年加入 OpenAI。Ben Wang 參與了 GPT-4 項(xiàng)目的預(yù)訓(xùn)練和長(zhǎng)上下文方面的工作。

視覺(jué)組

Mark Chen

Mark Chen 2018 年加入 OpenAI,任研究科學(xué)家,畢業(yè)于麻省理工學(xué)院(MIT)。他參與了 GPT-4 項(xiàng)目中視覺(jué)方面的工作。

Casey Chu

Casey Chu2020 年加入 OpenAI,畢業(yè)于斯坦福大學(xué)計(jì)算數(shù)學(xué)專(zhuān)業(yè)。Casey Chu 的主要研究方向是多模態(tài) AI 系統(tǒng),他在 GPT-4 項(xiàng)目中主要參與視覺(jué)方面的工作。

胡繩麗

胡繩麗(Shengli Hu)2022 年加入 OpenAI,她碩士畢業(yè)于復(fù)旦大學(xué)、博士畢業(yè)于康奈爾大學(xué)。她的研究興趣在于社會(huì)科學(xué)、計(jì)算語(yǔ)言學(xué)、計(jì)算機(jī)視覺(jué)和語(yǔ)音的跨學(xué)科研究。胡繩麗曾在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音和應(yīng)用統(tǒng)計(jì)方面的頂級(jí)會(huì)議和期刊上發(fā)表過(guò)多篇論文,包括 CVPR、ACL、EMNLP、ECCV 等等,并獲得過(guò)最佳論文獎(jiǎng)提名。

Tianhao Zheng

Tianhao Zheng2022 年加入 OpenAI。他本科畢業(yè)于清華大學(xué),博士畢業(yè)于得克薩斯大學(xué)奧斯汀分校。再加入 OpenAI 之前,他曾先后在英偉達(dá)、谷歌、Twitter 工作過(guò)。Tianhao Zheng 在 GPT-4 項(xiàng)目中主要參與了視覺(jué)方面的工作。

翁家翌

翁家翌(Jiayi Weng)2020 年在清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系獲得本科學(xué)位。2021 年在 Sea AI Lab 實(shí)習(xí)期間,主要參與了強(qiáng)化學(xué)習(xí)算法庫(kù) Tianshou(天授)的開(kāi)發(fā),該項(xiàng)目已獲得 5.9K GitHub Star。CMU 碩士畢業(yè)后,翁家翌加入 OpenAI 任研究工程師。

強(qiáng)化學(xué)習(xí) & 對(duì)齊組

Chong Zhang

Chong Zhang 2010 年就讀浙江大學(xué)計(jì)算機(jī)系,2014 年在加拿大西蒙弗雷澤大學(xué)獲得學(xué)士學(xué)位,隨后在谷歌、蘋(píng)果公司擔(dān)任工程師。2019 年就讀加州大學(xué)洛杉磯分校,2021 年獲得計(jì)算機(jī)碩士學(xué)位后,在 OpenAI 工作至今。

Shengjia Zhao

Shengjia Zhao2016 年本科畢業(yè)于清華大學(xué),2022 年在斯坦福大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位,師從 Stefano Ermon,隨后加入 OpenAI。

Stephanie Lin

Stephanie Lin 本科和碩士期間分別就讀于麻省理工學(xué)院和佐治亞理工學(xué)院。加入 OpenAI 之前,她曾是牛津大學(xué)研究學(xué)者。

Tong Mu

Tong Mu 本科就讀于加州大學(xué)洛杉磯分校,后在斯坦福大學(xué)獲得博士學(xué)位。2022 年加入 OpenAI。

Jeff Wu

Jeff Wu 本碩均就讀于麻省理工學(xué)院。他是初創(chuàng)公司 Terminal.com 的第二名員工,該公司被收購(gòu)后,他曾在谷歌工作約 2 年的時(shí)間。2018 年,Jeff Wu 加入 OpenAI。

肖凱

肖凱(Kai Xiao)在麻省理工學(xué)院獲得了學(xué)士學(xué)位和博士學(xué)位,曾在微軟、DeepMind 等機(jī)構(gòu)實(shí)習(xí)。2022 年 9 月加入 OpenAI。

Kevin Yu

Kevin Yu 在加州大學(xué)伯克利分校獲得物理學(xué)學(xué)士學(xué)位及神經(jīng)科學(xué)博士學(xué)位。2022 年加入 OpenAI。

Haozhun Jin

Haozhun Jin2013 年本科畢業(yè)于清華大學(xué)計(jì)算機(jī)系,2015 年獲得斯坦福大學(xué)碩士學(xué)位。2015 年到 2018 年,他在 Meta 擔(dān)任軟件工程師,2023 年 1 月加入 OpenAI。

顧世翔

顧世翔是出生于日本的加拿大華人,曾是谷歌研究院研究科學(xué)家,研究領(lǐng)域包括深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、概率機(jī)器學(xué)習(xí)和機(jī)器人技術(shù)。他擁有劍橋大學(xué)和馬普所智能系統(tǒng)研究所的機(jī)器學(xué)習(xí)博士學(xué)位,在多倫多大學(xué)獲得了工程科學(xué)學(xué)士學(xué)位,論文指導(dǎo)教授為 Geoffrey Hinton。

評(píng)估 & 分析團(tuán)隊(duì)

Alvin Wang

Alvin Wang2022 年 8 月加入 OpenAI,為評(píng)估 & 分析團(tuán)隊(duì)核心貢獻(xiàn)者之一。此前他曾在 VMware、Tesla 等公司工作過(guò)幾年。2013 年本科畢業(yè)于南加州大學(xué)。

Angela Jiang

Angela Jiang 于 2021 年 11 月加入 OpenAI,在微軟和谷歌有過(guò)短暫的工作經(jīng)歷,她本科畢業(yè)于西北大學(xué),于 CMU 獲得博士學(xué)位。

Jason Wei

Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高級(jí)研究科學(xué)家,在那里推廣了思維鏈提示,并共同領(lǐng)導(dǎo)了指令調(diào)優(yōu)工作。他在谷歌和 Jeff Dean 等人共同撰寫(xiě)了關(guān)于大模型涌現(xiàn)能力的論文。

Juntang Zhuang

Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌實(shí)習(xí)四個(gè)月。他本科畢業(yè)于清華大學(xué),碩士畢業(yè)于耶魯大學(xué),并在耶魯大學(xué)拿到博士學(xué)位。他的研究主要是為生物醫(yī)學(xué)應(yīng)用開(kāi)發(fā)新的機(jī)器學(xué)習(xí)技術(shù)。

Derek Chen

Derek Chen 于 2021 年加入 OpenAI,是一名技術(shù)安全分析師。他畢業(yè)于美國(guó)東北大學(xué),此前在谷歌工作過(guò)不到一年的時(shí)間。

宋飏

宋飏(Yang Song)目前在 OpenAI 擔(dān)任研究員,并將于 2024 年 1 月加入加州理工學(xué)院電子系(Electrical Engineering)和計(jì)算數(shù)學(xué)科學(xué)系(Computing and Mathematical Sciences)擔(dān)任助理教授。宋飏本科畢業(yè)于清華大學(xué)數(shù)理基礎(chǔ)科學(xué)班,2022 年獲得斯坦福大學(xué)計(jì)算機(jī)科學(xué)博士學(xué)位,師從 Stefano Ermon。他的主要研究方向是機(jī)器學(xué)習(xí),包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法與其他科學(xué)領(lǐng)域的交叉(AI for science)。他是擴(kuò)散模型(diffusion models)和分?jǐn)?shù)匹配生成式模型(score-based generative models)的主要奠基人之一。他發(fā)表在 NeurIPS 2019 的工作首次在圖片生成質(zhì)量上實(shí)現(xiàn)了對(duì)生成對(duì)抗網(wǎng)絡(luò)(GAN)的超越。博士期間他的一作論文獲得了 ICLR 2021 杰出論文獎(jiǎng),相關(guān)研究獲得了蘋(píng)果獎(jiǎng)學(xué)金、摩根大通獎(jiǎng)學(xué)金,以及 WAIC 云帆獎(jiǎng)。

模型部署

Michael Wu

Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能應(yīng)用研究。Michael Wu 畢業(yè)于 MIT,是 GPT-4 項(xiàng)目的推理研究負(fù)責(zé)人。

Andrew Peng

Andrew Peng 2022 年底加入 OpenAI,他曾經(jīng)在微軟工作兩年。Andrew Peng 畢業(yè)于加州大學(xué)伯克利分校,主要參與 GPT-4 API 和 ChatML 部署方面的工作。

吳雪楓

吳雪楓(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能應(yīng)用及 API 開(kāi)發(fā)。吳雪楓畢業(yè)于 MIT,在 GPT-4 項(xiàng)目中主要參與 API 開(kāi)發(fā)和 ChatML 部署方面的工作。

Jason Chen

Jason Chen 本科就讀于麻省理工學(xué)院,2007 年到 2014 年期間在谷歌擔(dān)任軟件工程師,2014 年到 2019 年任職于初創(chuàng)公司 Apptimize,2019 年到 2023 年 2 月任職于 Argo AI,2023 年 2 月加入 OpenAI。

其他貢獻(xiàn)者

Xin Hu

Xin Hu 于 2022 年 6 月加入 OpenAI,主要負(fù)責(zé)開(kāi)發(fā)用于云安全、k8s 安全、認(rèn)證 / 授權(quán)和訪問(wèn)控制的安全服務(wù)和平臺(tái)。

此外,在 GPT-4 的開(kāi)發(fā)上 OpenAI 也對(duì)微軟表示了感謝,特別是微軟 Azure 服務(wù)為模型訓(xùn)練提供了基礎(chǔ)架構(gòu)設(shè)計(jì)和管理方面的支持,微軟必應(yīng)團(tuán)隊(duì)、安全團(tuán)隊(duì)也對(duì) GPT-4 的部署等工作作出了貢獻(xiàn)。

參考鏈接:

https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd

https://cdn.openai.com/papers/gpt-4-system-card.pdf

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片