芯東西11月9日?qǐng)?bào)道,今日,人工智能及高性能計(jì)算頂級(jí)技術(shù)盛會(huì)NVIDIA GTC大會(huì)如約而至。
這個(gè)市值已高達(dá)7700億美元的AI頂級(jí)玩家,剛剛推出全球最小、功能最強(qiáng)大、能效最高的下一代AI超級(jí)計(jì)算機(jī)NVIDIA Jetson AGX Orin,其算力達(dá)到200TOPS,可與內(nèi)置GPU的服務(wù)器媲美。
在下午的虛擬主題演講中,NVIDIA創(chuàng)始人兼CEO黃仁勛穿著熟悉的皮衣,公布了一系列最新AI技術(shù)和產(chǎn)品,并推出承載著其“元宇宙”愿景的全新虛擬化身平臺(tái)。
由這個(gè)平臺(tái)生成的“迷你玩具版黃仁 勛”Toy-Me,能與人 自然地問(wèn)答交流。
在幫助企業(yè)降低AI開發(fā)部署門檻方面,NVIDIA可以說(shuō)是做到了極致,比如提供方便企業(yè)構(gòu)建AI大模型的框架,以及定制專屬聲音的虛擬助手。
黃仁勛說(shuō),NVIDIA開發(fā)者數(shù)量已接近300萬(wàn),CUDA過(guò)去15年下載量達(dá)3000萬(wàn)次,一年下載量達(dá)到700萬(wàn)。
此外,NVIDIA繼續(xù)表露對(duì)醫(yī)療健康領(lǐng)域的熱情,推出搭載新一代Orin芯片、無(wú)縫連接醫(yī)療設(shè)備和邊緣服務(wù)器的AI計(jì)算平臺(tái)Clara Holoscan。
黃仁勛還宣布,NVIDIA將構(gòu)建一個(gè)數(shù)字孿生模型來(lái)模擬和預(yù)測(cè)氣候變化,新的超級(jí)計(jì)算機(jī)將名為E-2,即Earth Two,地球的數(shù)字孿生,能夠在虛擬世界模擬引擎Omniverse中以Million-X百萬(wàn)倍的速度運(yùn)行。
01.Jetson AGX Orin:手掌大小,算力堪比服務(wù)器
自2014年推出Jetson TK1至今,NVIDIA Jetson系列已經(jīng)積累了85萬(wàn)名開發(fā)者。
今日,NVIDIA推出全球最小、功能強(qiáng)大、能效最高的新一代AI超級(jí)計(jì)算機(jī)NVIDIA Jetson AGX Orin,用于機(jī)器人、自主機(jī)器、醫(yī)療器械和其他形式的邊緣嵌入式計(jì)算。
Jetson AGX Orin保持了與前代機(jī)型Jetson AGX Xavier相同的外形尺寸和引腳兼容性,處理能力提升6倍,每秒算力達(dá)200TOPS,可與內(nèi)置GPU的服務(wù)器相媲美,而尺寸只有手掌那么大。
它采用NVIDIA Ampere架構(gòu)GPU、Arm Cortex-A78AE CPU以及新一代深度學(xué)習(xí)和視覺(jué)加速器。高速接口、更快的存儲(chǔ)帶寬和對(duì)多模態(tài)傳感器的支持,為多個(gè)并行AI應(yīng)用流水線輸送數(shù)據(jù)。
與歷代Jetson計(jì)算機(jī)一樣,使用Jetson AGX Orin的客戶可以運(yùn)用NVIDIA CUDA-X加速計(jì)算棧、NVIDIA JetPack SDK和最新NVIDIA工具進(jìn)行應(yīng)用開發(fā)和優(yōu)化,包括云原生開發(fā)工作流程。
來(lái)自NVIDIA NGC目錄的預(yù)訓(xùn)練模型已經(jīng)過(guò)優(yōu)化,并可以使用NVIDIA TAO工具套件和客戶數(shù)據(jù)集進(jìn)行微調(diào)。這減少了生產(chǎn)級(jí)AI的部署時(shí)間和成本,而云原生技術(shù)實(shí)現(xiàn)了產(chǎn)品整個(gè)生命周期內(nèi)的無(wú)縫更新。
DRIVE AGX Orin同樣由Jetson AGX Orin等 NVIDIA Ampere架構(gòu)提供支持,它是新發(fā)布的NVIDIA DRIVE Concierge和DRIVE Chauffeur背后的先進(jìn)處理器,這兩個(gè)AI平臺(tái)分別為安全的自動(dòng)駕駛提供動(dòng)力。
針對(duì)特定用例的軟件框架包括用于機(jī)器人技術(shù)的NVIDIA Isaac Sim,用于自動(dòng)駕駛的NVIDIA DRIVE,用于智慧城市的NVIDIA Metropolis。最新的Isaac版本包括對(duì)機(jī)器人操作系統(tǒng)(ROS)開發(fā)人員社區(qū)的重要支持。
NVIDIA還發(fā)布了用于Isaac Sim的全新NVIDIA Omniverse Replicator,用于為機(jī)器人生成合成訓(xùn)練數(shù)據(jù)。這些硬件加速軟件包使ROS開發(fā)者更容易在Jetson平臺(tái)上構(gòu)建高性能AI機(jī)器人。
NVIDIA Jetson AGX Orin模塊和開發(fā)者工具包將于2022年第一季度上市。
黃仁勛還在演講中談道:“到2024年,絕大多數(shù)新款電動(dòng)汽車將具備強(qiáng)大的自動(dòng)駕駛能力。”
他展示了一個(gè)新自動(dòng)駕駛平臺(tái)DRIVE Hyperion 8 GA,這是2024年模型的架構(gòu)。其傳感器套件包含12個(gè)攝像頭、9個(gè)毫米波雷達(dá)、12個(gè)超聲波雷達(dá)和1個(gè)前向激光雷達(dá),所有這些都由2顆NVIDIA DRIVE Orin芯片來(lái)進(jìn)行處理。
據(jù)他透露,目前,英偉達(dá)已經(jīng)在全球各地收集到了PB級(jí)的道路數(shù)據(jù),并擁有大約3000名訓(xùn)練有素的標(biāo)記員,創(chuàng)建訓(xùn)練數(shù)據(jù)。盡管如此,合成數(shù)據(jù)仍是NVIDIA數(shù)據(jù)策略的基石。
02.NeMo Megatron:讓企業(yè)開發(fā)自己的大模型
為了方便企業(yè)開發(fā)部署大型語(yǔ)言模型,NVIDIA推出了為訓(xùn)練具有數(shù)萬(wàn)億參數(shù)的語(yǔ)言模型而優(yōu)化的加速框架NeMo Megatron。
NVIDIA NeMo Megatron是Megatron的基礎(chǔ)上發(fā)展起來(lái)的。Megatron是由NVIDIA研究人員主導(dǎo)的開源項(xiàng)目,研究大型Transformer語(yǔ)言模型的高效訓(xùn)練。Megatron 530B是全球最大的可定制語(yǔ)言模型。
利用先進(jìn)的數(shù)據(jù)、張量和管道并行化技術(shù),它能使大型語(yǔ)言模型的訓(xùn)練有效地分布在成千上萬(wàn)的GPU上。
企業(yè)可以通過(guò)NeMo Megatron框架,進(jìn)一步訓(xùn)練它以服務(wù)新的領(lǐng)域和語(yǔ)言。經(jīng)優(yōu)化,該框架可以在NVIDIA DGX SuperPOD的大規(guī)模加速計(jì)算基礎(chǔ)設(shè)施上進(jìn)行擴(kuò)展。
除了NeMo Megatron外,NVIDIA還推出了一個(gè)開發(fā)Physics-ML模型的框架NVIDIA Modulus。
它使用物理原理及源自原理型物理和觀測(cè)結(jié)果的數(shù)據(jù)訓(xùn)練Physics-ML模型,支持多GPU多節(jié)點(diǎn)訓(xùn)練,由此生成的模型,其物理仿真速度比模擬快1000-100,000倍。
科學(xué)家可借助Modulus創(chuàng)建數(shù)字孿生模型,來(lái)解決預(yù)測(cè)氣候變化等重要科學(xué)問(wèn)題。
例如研究人員利用歐洲中期天氣預(yù)報(bào)中心的ERA5大氣數(shù)據(jù)訓(xùn)練Physics-ML模型,該模型在128個(gè)A100 GPU上訓(xùn)練需要4小時(shí),訓(xùn)練后的模型能以30公里的空間分辨率預(yù)測(cè)颶風(fēng)嚴(yán)重程度和路徑。
原本需要7天才能完成的預(yù)測(cè),現(xiàn)在在一個(gè)GPU上只需0.25秒,比模擬快了10萬(wàn)倍。
為了幫助企業(yè)加快AI之旅,NVIDIA宣布在全球范圍內(nèi)擴(kuò)展其LaunchPad計(jì)劃,它允許用戶即時(shí)訪問(wèn)在加速基礎(chǔ)設(shè)施上運(yùn)行的NVIDIA AI軟件。企業(yè)可使用NVIDIA LaunchPad免費(fèi)體驗(yàn)開發(fā)和部署大型語(yǔ)言模型。
LaunchPad計(jì)劃由Equinix服務(wù)支持,包括數(shù)據(jù)中心、連接和裸金屬產(chǎn)品,獲得LaunchPad體驗(yàn)后,企業(yè)可以在全球Equinix地點(diǎn)運(yùn)行其NVIDIA加速的人工智能工作負(fù)載。
03.Riva定制語(yǔ)音:快速創(chuàng)建定制版品牌聲音
NVIDIA的Riva語(yǔ)音AI軟件同樣有了新進(jìn)展,黃仁勛宣布了該軟件一個(gè)新功能——Riva定制語(yǔ)音。
Riva可識(shí)別英語(yǔ)、西班牙語(yǔ)、德語(yǔ)、法語(yǔ)、日語(yǔ)、普通話和俄語(yǔ)等7種語(yǔ)言,可以生成隱藏字幕、翻譯、摘要、回答問(wèn)題并理解意圖。
只需訓(xùn)練30分鐘的音頻數(shù)據(jù),企業(yè)即可構(gòu)建屬于自己品牌大使的聲音,獲得類似人類的表現(xiàn)力。
也就是說(shuō),用戶根據(jù)特定的領(lǐng)域或行業(yè)術(shù)語(yǔ),可以量身定制擁有獨(dú)特聲音的虛擬助理。
不到三年間,NVIDIA的對(duì)話AI軟件已被下載超過(guò)25萬(wàn)次,并被廣泛采用到各個(gè)行業(yè)。
對(duì)于小規(guī)模研發(fā),NVIDIA NGC容器注冊(cè)表免費(fèi)提供NVIDIA Riva,開發(fā)者可加入Riva開放測(cè)試版程序來(lái)試用該軟件。
對(duì)于擁有大規(guī)模部署并尋求NVIDIA專家技術(shù)支持的客戶,NVIDIA宣布了NVIDIA Riva Enterprise計(jì)劃,該計(jì)劃預(yù)計(jì)將于明年初推出。
04.Omniverse Avatar:構(gòu)建生動(dòng)的智能虛擬化身
虛擬助手的下一步,是擁有常識(shí)、推理能力和生動(dòng)的視覺(jué)形象。
在GTC大會(huì)上,黃仁勛宣布推出一個(gè)全方位的虛擬化身平臺(tái)——Omniverse Avatar。
它是NVIDIA一系列先進(jìn)AI技術(shù)的集大成者,將Metropolis的感知能力、Riva的語(yǔ)音識(shí)別能力、Merlin的推薦能力、Omniverse的動(dòng)畫渲染能力等交匯于一體。
這使得開發(fā)者能構(gòu)建出一個(gè)完全交互式的虛擬化身,它足夠生動(dòng),能對(duì)語(yǔ)音和面部提示做出反應(yīng),能理解多種語(yǔ)言,能給出智能的建議。
黃仁勛展示了一些例子。
比如,其玩偶復(fù)制品可以跟人對(duì)答如流。
Metropolis工程師用Maxine創(chuàng)建了Tokkio智能操作臺(tái)應(yīng)用程序,讓操作臺(tái)具有高度交互性,可快速做出對(duì)話響應(yīng)。
在餐廳,兩名顧客點(diǎn)餐時(shí),一個(gè)客戶服務(wù)虛擬化身可以跟他們交談和理解他們的需求。
這些演示由NVIDIA AI軟件和Megatron 530B提供支持,Megatron 530B是目前世界上最大的可定制語(yǔ)言模型。
在DRIVE Concierge AI平臺(tái)的演示中,中央儀表板屏幕上的數(shù)字助理,可幫助司機(jī)選擇最佳駕駛模式,使其按時(shí)到達(dá)目的地,然后在汽車?yán)m(xù)航里程下降到100英里以下時(shí),按他的請(qǐng)求設(shè)置提醒。
Maxine項(xiàng)目更強(qiáng)調(diào)多種語(yǔ)言的實(shí)時(shí)翻譯和轉(zhuǎn)錄。
借助Maxine,這個(gè)人的話不僅被轉(zhuǎn)錄,還能以相同的聲音和語(yǔ)調(diào)被實(shí)時(shí)轉(zhuǎn)換成德語(yǔ)、法語(yǔ)等多種語(yǔ)言。
Maxine使用計(jì)算機(jī)視覺(jué)來(lái)追蹤人的面部,并識(shí)別其表情,3D動(dòng)畫可為其制作虛擬而逼真的頭像。
可以想象,在企業(yè)和開發(fā)人員中,每個(gè)行業(yè)都需要某種形式的虛擬化身。
使用Omniverse Avatar平臺(tái),你可以為視頻會(huì)議和協(xié)作平臺(tái)、客戶支持平臺(tái)、內(nèi)容創(chuàng)建、應(yīng)用收益和數(shù)字孿生、機(jī)器人應(yīng)用等等構(gòu)建定制的AI助理。
NVIDIA的虛擬世界模擬Omniverse是打造虛擬世界的關(guān)鍵平臺(tái)。從機(jī)器人、自動(dòng)駕駛車隊(duì)、倉(cāng)庫(kù)、工業(yè)廠房到整個(gè)城市,都能在Omniverse數(shù)字孿生中完成創(chuàng)建、訓(xùn)練和運(yùn)行。
黃仁勛說(shuō),Omniverse面向數(shù)據(jù)中心規(guī)模設(shè)計(jì),有朝一日有望能達(dá)到全球數(shù)據(jù)規(guī)模。
愛(ài)立信正構(gòu)建整個(gè)城市的數(shù)字孿生環(huán)境,幫助確定如何放置和配置每個(gè)站點(diǎn)以獲得最佳覆蓋范圍和網(wǎng)絡(luò)性能,可對(duì)整個(gè)5G網(wǎng)絡(luò)執(zhí)行逼真遠(yuǎn)程仿真。
05.AI推理:Triton推理服務(wù)器助力實(shí)時(shí)大模型推理
目前微軟、三星、Snap等25000多家客戶都在使用NVIDIA的AI推理平臺(tái)。
今日,NVIDIA推出多節(jié)點(diǎn)分布式推理功能的NVIDIA Triton推理服務(wù)器,以及NVIDIA A2 Tensor Core GPU加速器。
NVIDIA A2 GPU是一個(gè)入門級(jí)、低功耗的緊湊型加速器,適用于邊緣服務(wù)器中的推理和邊緣AI,推理性能比CPU高出20倍。
NVIDIA AI推理平臺(tái)此次更新包括開源NVIDIA Triton推理服務(wù)器軟件的新功能,和對(duì)NVIDIA TensorRT的更新。
最新NVIDIA Triton推理服務(wù)器中的多GPU、多節(jié)點(diǎn)特性,使大型語(yǔ)言模型推理工作負(fù)載能夠?qū)崟r(shí)在多個(gè)GPU和節(jié)點(diǎn)上擴(kuò)展。
借助Triton推理服務(wù)器,Megatron 530B能在兩個(gè)NVIDIA DGX系統(tǒng)上運(yùn)行,將處理時(shí)間從CPU服務(wù)器上的1分鐘以上縮短到0.5秒,令實(shí)時(shí)部署部署大型語(yǔ)言模型成為可能。
在軟件優(yōu)化上,Triton推理服務(wù)器的模型分析器,新工具可以自動(dòng)化地從數(shù)百種組合中為AI模型選擇最佳配置,以實(shí)現(xiàn)最優(yōu)性能,同時(shí)確保應(yīng)用程序所需的服務(wù)質(zhì)量。
RAPIDS FIL是針對(duì)隨機(jī)森林和梯度提升決策樹模型GPU或CPU推理的新后端,為開發(fā)者使用Triton進(jìn)行深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)提供了一個(gè)統(tǒng)一的部署引擎。
Triton與AWS、阿里云等平臺(tái)集成,并支持在各代GPU、x86 CPU和Arm CPU上優(yōu)化AI推理工作負(fù)載。NVIDIA AI Enterprise也集成了Triton。
NVIDIA AI Enterprise是一款經(jīng)NVIDIA優(yōu)化、認(rèn)證和支持的用于開發(fā)和部署AI的端到端軟件套件,客戶可利用它在本地?cái)?shù)據(jù)中心和私有云的主流服務(wù)器上運(yùn)行AI工作負(fù)載。
NVIDIA旗艦TensorRT推理引擎亦進(jìn)行了更新,已原生集成到TensorFlow和PyTorch中,只需1行代碼,就能提供比框架內(nèi)推理快3倍的性能。
NVIDIA TensorRT 8.2是SDK的最新版本,可實(shí)時(shí)運(yùn)行數(shù)十億個(gè)參數(shù)的語(yǔ)言模型。
NVIDIA還宣布微軟會(huì)議軟件Teams采用NVIDIA AI和Azure認(rèn)知服務(wù)。
微軟Azure認(rèn)知服務(wù)為高品質(zhì)AI模型提供基于云的API,以創(chuàng)建智能應(yīng)用程序。他們?cè)谟肨riton運(yùn)行語(yǔ)音轉(zhuǎn)文本模型,為微軟Teams用戶提供準(zhǔn)確的實(shí)時(shí)字幕和轉(zhuǎn)錄。
微軟Teams每月有近2.5億活躍用戶,微軟Azure認(rèn)知服務(wù)上的NVIDIA GPU和 Triton推理服務(wù)器使用28種語(yǔ)言和方言,結(jié)合AI模型幫助提升實(shí)時(shí)字幕和轉(zhuǎn)錄功能的成本效益。
Mavenir宣布由NVIDIA Metropolis AI-on-5G平臺(tái)提供支持的MAVedge-AI智能視頻分析,以加速企業(yè)人工智能,該方案預(yù)計(jì)2022年初提供給客戶。
06.數(shù)據(jù)中心:全新網(wǎng)絡(luò)安全功能
面向數(shù)據(jù)中心,黃仁勛宣布推出BlueField DOCA 1.2來(lái)支持全新網(wǎng)絡(luò)安全功能,希望使BlueField成為業(yè)界構(gòu)建零信任安全平臺(tái)的理想之選。
目前有1400名開發(fā)者正在BlueField上進(jìn)行開發(fā),現(xiàn)在采用BlueField的網(wǎng)絡(luò)安全公司已可提供零信任安全即服務(wù)。
NVIDIA還發(fā)明了一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)安全平臺(tái)Morpheus來(lái)監(jiān)控分析網(wǎng)絡(luò)行為。
它構(gòu)建于NVIDIA RAPIDS和NVIDIA AI之上,其工作流會(huì)為每種應(yīng)用和用戶的組合創(chuàng)建AI模型和數(shù)字指紋,并學(xué)習(xí)其日常的模式和尋找異常操作。這些異常操作將觸發(fā)安全警告,并提醒分析員作出響應(yīng)。
Bluefield、DOCA和Morpheus都是數(shù)據(jù)中心的全堆棧加速AI解決方案的一部分。NVIDIA將為其網(wǎng)絡(luò)安全合作伙伴提供一個(gè)零信任的安全平臺(tái),從而提高安全性和應(yīng)用程序性能。
Bluefield坐在網(wǎng)絡(luò)上,向Morpheus AI平臺(tái)提供數(shù)據(jù)中心發(fā)生的所有活動(dòng)。Morpheus是一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)安全平臺(tái),可以監(jiān)控和分析來(lái)自每個(gè)用戶、機(jī)器和服務(wù)的所有信息。
NVIDIA今日也宣布了Morpheus早期訪問(wèn)2版本。
Morpheus創(chuàng)建了預(yù)訓(xùn)練的用戶活動(dòng)指紋模型。當(dāng)這些指紋發(fā)生變化時(shí),它能夠?qū)崟r(shí)識(shí)別出異常交易正在發(fā)生,創(chuàng)建一個(gè)可疑行為正在發(fā)生的安全警報(bào),并隔離活動(dòng)和加以提醒。
07.醫(yī)療健康:合作癌癥中心,推新機(jī)器人平臺(tái)
在醫(yī)療健康領(lǐng)域,NVIDIA宣布與多家先進(jìn)癌癥中心合作,將AI的力量帶到癌癥治療。這些癌癥中心將采用NVIDIA DGX來(lái)加速開發(fā)AI模型。
許多醫(yī)療設(shè)備公司正在將AI和機(jī)器人技術(shù)融入其中,在機(jī)器人手術(shù)、移動(dòng)CT掃描、支氣管鏡檢中使用NVIDIA加速計(jì)算平臺(tái)。
為加速AI醫(yī)療設(shè)備的應(yīng)用,NVIDIA推出一個(gè)面向醫(yī)療健康行業(yè)的新計(jì)算平臺(tái)NVIDIA Clara Holoscan。
Holoscan是繼Isaac和Drive后,NVIDIA的第三個(gè)機(jī)器人平臺(tái),能為可擴(kuò)展、軟件定義、端到端流媒體數(shù)據(jù)處理的醫(yī)療設(shè)備提供所需的計(jì)算基礎(chǔ)設(shè)施。
該平臺(tái)集成了NVIDIA AGX Orin和ConnectX-7,F(xiàn)P32算力達(dá)5.2TFLOPS,AI算力達(dá)250TOPS,740Gbps高速IO用于連接傳感器。
添加RTX A6000 Ampere GPU后,可獲得另外39TFLOPS(FP32)和超過(guò)600TOPS的AI推理性能。
Clara Holoscan是一個(gè)醫(yī)療設(shè)備與邊緣服務(wù)器無(wú)縫連接的端到端平臺(tái),能助力開發(fā)者創(chuàng)建AI微服務(wù),用以在設(shè)備上運(yùn)行低延遲串流應(yīng)用,同時(shí)將更復(fù)雜的任務(wù)傳至數(shù)據(jù)中心資源。
借助Clara Holoscan,開發(fā)者可以自定義應(yīng)用,按需在其醫(yī)療設(shè)備中充分添加或減少計(jì)算和輸入/輸出功能,從而平衡延遲、成本、空間、性能和帶寬的需求。
Clara Holoscan SDK通過(guò)加速庫(kù)、AI模型和超聲波、數(shù)字病理學(xué)、內(nèi)窺鏡檢查等參考應(yīng)用支持此項(xiàng)工作,以幫助開發(fā)者利用嵌入式和可擴(kuò)展的混合云計(jì)算。
在藥物發(fā)現(xiàn)方面,加拿大AI制藥創(chuàng)企Entos發(fā)明了一種深度學(xué)習(xí)架構(gòu)OrbNet,用物理機(jī)器學(xué)習(xí)方法訓(xùn)練圖神經(jīng)網(wǎng)絡(luò),取代分子模擬中昂貴的原子間作用力,將分子模擬速度提高1000倍。
08.Quantum-2:史上最先進(jìn)端到端網(wǎng)絡(luò)平臺(tái)
此次GTC期間,NVIDIA還宣布了下一代NVIDIA Quantum-2平臺(tái),可進(jìn)行云原生超級(jí)計(jì)算。
該網(wǎng)絡(luò)平臺(tái)由NVIDIA Quantum-2交換機(jī)、ConnectX-7網(wǎng)絡(luò)適配器、BlueField-3數(shù)據(jù)處理單元(DPU)和支持新架構(gòu)的所有軟件組成。ConnectX-7將于明年1月問(wèn)世。
其中,Quantum-2 InfiniBand交換機(jī)基于新的Quantum-2 ASIC,采用臺(tái)積電7N節(jié)點(diǎn),包含570個(gè)晶體管,超過(guò)有540億晶體管的A100。
Quantum-2 InfiniBand擁有400Gbps,網(wǎng)絡(luò)速度翻倍,交換機(jī)吞吐量增加了2倍,集群可擴(kuò)展性增為原來(lái)的6.5倍,同時(shí)降低了數(shù)據(jù)中心的功耗。
其多租戶性能隔離利用先進(jìn)的基于遙測(cè)的擁塞控制系統(tǒng),確保可靠的吞吐量,無(wú)論用戶激增或工作量需求激增,都能確??煽康耐掏铝?,從而防止一個(gè)租戶的活動(dòng)干擾其他租戶的活動(dòng)。
相比上一代,第三代SHARPv3TM網(wǎng)絡(luò)計(jì)算技術(shù)的交換機(jī)計(jì)算能力比原來(lái)高32倍,用于加速AI訓(xùn)練。
09.新加速庫(kù):優(yōu)化路線規(guī)劃,加速量子模擬
最后,我們來(lái)看看NVIDIA推出的3個(gè)新加速庫(kù)。
首先是NVIDIA ReOpt,這是一款針對(duì)運(yùn)籌優(yōu)化問(wèn)題的加速求解器,可實(shí)現(xiàn)實(shí)時(shí)路線規(guī)劃優(yōu)化。
以與NVIDIA合作的達(dá)美樂(lè)披薩為例,配送14個(gè)披薩的路徑有870億種,這意味達(dá)美樂(lè)要在30分鐘內(nèi)將披薩送達(dá)絕非易事。
運(yùn)籌優(yōu)化對(duì)“最后一英里”配送是必需的,路線規(guī)劃是個(gè)極為棘手的物流問(wèn)題,如果應(yīng)用到行業(yè)中,即使是小規(guī)模的路線優(yōu)化也能節(jié)省數(shù)十億美元。
黃仁勛展示了一個(gè)用NVIDIA Omniverse虛擬倉(cāng)庫(kù)來(lái)展示優(yōu)化路線在自動(dòng)訂單揀選場(chǎng)景中的影響,優(yōu)化后的規(guī)劃能使訂單揀選節(jié)省一半的時(shí)間和路程。
當(dāng)前路線優(yōu)化求解器收到新訂單后,需要數(shù)小時(shí)來(lái)重新運(yùn)行和響應(yīng),而ReOpt能持續(xù)運(yùn)行并實(shí)時(shí)動(dòng)態(tài)地進(jìn)行重新優(yōu)化,在短短幾秒鐘內(nèi)響應(yīng)并擴(kuò)展至數(shù)千個(gè)位置。
第二個(gè)是cuQuantum DGX設(shè)備,配備有針對(duì)量子計(jì)算工作流的加速庫(kù),可用態(tài)矢量和張量網(wǎng)絡(luò)的方法來(lái)加速量子電路模擬。
谷歌Cirq將成第一個(gè)得到加速的量子模擬器。
借助該設(shè)備,曾經(jīng)需要耗費(fèi)幾個(gè)月的模擬,現(xiàn)在幾天就能完成。
NVIDIA研究部門在量子算法模擬方面取得了重要里程碑,用1688個(gè)量子位為3375個(gè)頂點(diǎn)集求解MaxCut問(wèn)題。
這是有史以來(lái)最大的精確量子電路模擬,比以往模擬的量子位多8倍。
cuQuantum DGX設(shè)備將在第一季度推出。
第三個(gè)加速庫(kù)是在PyData和NumPy生態(tài)系統(tǒng)的大規(guī)模加速計(jì)算cuNumeric,它允許用戶用Python代碼在超級(jí)計(jì)算機(jī)上透明加速和擴(kuò)展NumPy工作流,并無(wú)需更改代碼。
它屬于NVIDIA RAPIDS開源Python數(shù)據(jù)科學(xué)套件,RAPIDS今年的下載量超過(guò)50萬(wàn)次,比去年增長(zhǎng)了4倍多。NumPy在過(guò)去5年下載量達(dá)到了1.22億次,別用于GitHub上近80萬(wàn)個(gè)項(xiàng)目。
在著名的CFD Python教學(xué)代碼中,cuNumeric能擴(kuò)展至1000個(gè)GPU,而擴(kuò)展效率僅比線性擴(kuò)展效率損失了20%。
10.結(jié)語(yǔ)
乘著AI、高性能計(jì)算和元宇宙的東風(fēng),NVIDIA今年過(guò)得可謂風(fēng)生水起,市值一路扶搖直上,突破7700億美元。其Omniverse平臺(tái)更是被分析機(jī)構(gòu)視作NVIDIA一項(xiàng)重要的平臺(tái)擴(kuò)張戰(zhàn)略。
在這表面風(fēng)光的背后,NVIDIA的遠(yuǎn)見(jiàn)和前瞻性不容小覷。無(wú)論是如火如荼的AI,還是方興未艾的虛擬世界,NVIDIA能成為科技熱潮的直接受益者,都離不開過(guò)去多年對(duì)其軟硬件產(chǎn)品的打磨。
此次NVIDIA GTC大會(huì)期間,我們還將看到更多覆蓋深度學(xué)習(xí)、數(shù)據(jù)科學(xué)、高性能計(jì)算、機(jī)器人等領(lǐng)域的最新進(jìn)展,而始于NVIDIA CUDA的加速計(jì)算正在這些領(lǐng)域催化效率提升,推動(dòng)現(xiàn)代科技快速進(jìn)化、走向未來(lái)。
本文來(lái)自微信公眾號(hào)“芯東西”(ID:aichip001),作者:ZeR0,36氪經(jīng)授權(quán)發(fā)布。
- 濕地之美|廣州海珠濕地
- (熱點(diǎn)觀察 漫評(píng))美國(guó)對(duì)歐洲盟友“下狠手”
- 全球微動(dòng)態(tài)丨德媒文章:政治極化愈演愈烈,美國(guó)民主面臨墮落
- 每日觀察!海河觀津丨百萬(wàn)候鳥來(lái)“息”,它們?yōu)楹纹珢?ài)北大港?
- 焦點(diǎn)!一起來(lái)拍中國(guó)空間站!
- 焦點(diǎn)播報(bào):北京新增本土感染者16例 詳情公布
- 天天快看點(diǎn)丨遼寧匯聚高校校友資源 引青年人才在遼創(chuàng)新創(chuàng)業(yè)
- 每日熱文:夢(mèng)天成功發(fā)射!天空飄來(lái)一個(gè)字:6
- 環(huán)球最資訊丨長(zhǎng)圖丨“院士天團(tuán)”做優(yōu)“湖南飯”,該是什么味?
- 常益懷等5市州明早有大霧 出行請(qǐng)注意安全
- 環(huán)球動(dòng)態(tài):11月全省溫高干旱持續(xù)發(fā)展
- 【全球獨(dú)家】10月制造業(yè)PMI為49.2% 建筑業(yè)景氣水平較高
- 環(huán)球今日訊!亞馬遜營(yíng)業(yè)利潤(rùn)率下降至2% 國(guó)內(nèi)頭部電商或進(jìn)一步搶占海外市場(chǎng)
- 國(guó)家藥監(jiān)局:促進(jìn)彩色隱形眼鏡生產(chǎn)經(jīng)營(yíng)企業(yè)規(guī)范化發(fā)展
- 即時(shí)焦點(diǎn):智慧芽升級(jí)科創(chuàng)力評(píng)估平臺(tái) 累計(jì)上線12條產(chǎn)業(yè)技術(shù)鏈
- 【世界熱聞】?jī)?nèi)蒙古啟動(dòng)人力資源誠(chéng)信服務(wù)示范機(jī)構(gòu)評(píng)選
- 環(huán)球觀焦點(diǎn):內(nèi)蒙古:這5項(xiàng)職業(yè)資格考試暫停
- 全球熱門:飛天圓夢(mèng)|靜待夢(mèng)天,中國(guó)空間站在軌建造收官在即
- 飛天圓夢(mèng)|“夢(mèng)天”已就位!楊利偉動(dòng)情講述“初代”航天人故事
- 對(duì)標(biāo)保時(shí)捷Taycan?大眾中國(guó)功勛蘇偉銘親自下場(chǎng)造車
- 1 濕地之美|廣州海珠濕地
- 2 (熱點(diǎn)觀察 漫評(píng))美國(guó)對(duì)歐洲盟友“下狠手”
- 3 全球微動(dòng)態(tài)丨德媒文章:政治極化愈演愈烈,美國(guó)民主
- 4 每日觀察!海河觀津丨百萬(wàn)候鳥來(lái)“息”,它們?yōu)楹纹?/a>
- 5 焦點(diǎn)!一起來(lái)拍中國(guó)空間站!
- 6 焦點(diǎn)播報(bào):北京新增本土感染者16例 詳情公布
- 7 天天快看點(diǎn)丨遼寧匯聚高校校友資源 引青年人才在遼
- 8 每日熱文:夢(mèng)天成功發(fā)射!天空飄來(lái)一個(gè)字:6
- 9 環(huán)球最資訊丨長(zhǎng)圖丨“院士天團(tuán)”做優(yōu)“湖南飯”,該
- 10 常益懷等5市州明早有大霧 出行請(qǐng)注意安全