波多野结衣三区,亚洲另类色欧美日韩,国产一级a爱做片免费看

全球快報:萬字長文講透AI藝術：緣起、意義和未來（上篇） 2022-11-25 17:48:51　　來源：36氪

前言

(資料圖)

今年 AI 藝術熱潮源于海外 AI 技術在圖像生成領域的革命性進步，以 Disco Diffusion、Stable Diffusion、Midjourney 等為頭部代表的擴散模型（Diffusion Model）開始在數(shù)字藝術領域大放異彩！以其驚人的藝術效果和可繪制“萬事萬物”的無限性，在短短半年時間里，吸引了來自全世界數(shù)千萬注冊用戶的實際參與、以及數(shù)億人的關注與談資。

時代洪流再度來襲，只不過這次的主角給予了 AI 技術。我們可以去質疑一種新的商業(yè)模式或者消費場景的市場有限性，但卻無法不去敬畏一種新技術革新所帶來的未來無限性，那是一場絕對的“無限游戲”！

緣起：細數(shù)幾大模型

2022 年初，由獨立開發(fā)者 Somnai 開發(fā)的 Disco Diffusion（簡稱 DD）在谷歌 Colab 云服務上正式對世界開放使用，4 月份開始在國內經很多設計與開源領域的大 V 傳播至熱，引發(fā)全民參與熱潮，不限于如何使用這種 AI 生產力工具、AI 藝術與人類藝術之爭、版權問題，乃至對現(xiàn)有各種視覺相關行業(yè)的沖擊幾何，紛繁復雜，不一而足，好不熱鬧。

緊隨其后的是一個更為強大的 AI 藝術工具 Midjourney（簡稱 MJ）開始在 Discord 上建立全球第一個集中式的 AI 創(chuàng)作者社區(qū)，在短短兩三個月內，僅靠這種自發(fā)的人人傳播，社區(qū)規(guī)模便突破了一百萬人，成為 Discord 有史以來規(guī)模最大的社區(qū)頻道，蔚為壯觀。

2022 年夏天，眾多科技巨頭紛紛涉足 AI 藝術領域，以 OpenAI、谷歌、微軟、百度最為積極，分別推出了 Dall·E 2、Imagen、Nuwa、文心一格。巨頭成？還是社區(qū)成？成為這個夏天 AI 藝術發(fā)展進程中最矚目的商業(yè)鏖戰(zhàn)。

但這些都尚不足以將 AI 藝術帶入到一個千億乃至萬億級的消費市場中，一種技術只有具備建立超級大生態(tài)的能力才會被歷史所輔證、被當下所青睞、被未來所銘記，就像曾經的 Linux、云計算、安卓、以太坊等在用生態(tài)來承載人類數(shù)字技術發(fā)展的 30 多年征途。而它們的繼承者今天也逐漸嶄露頭角——Stable Diffusion（簡稱 SD）。

SD 自今年 8 月份面世以來，秉承“大開源”的精神和宗旨，不僅在短短兩個月時間內讓其背后公司實體一躍成為市值高達十幾億美金的獨角獸，更吸引了全球數(shù)百萬乃至上千萬人積極參與其生態(tài)的建設，這場如火如荼的“去中心化運動”引爆了海內外的創(chuàng)業(yè)與投資熱潮，因此其意義之深遠遠超對自身的影響，其福澤被于世界與萬民。

而所謂的“大開源”，包括開放核心 AI 算法模型（Latent）、開放核心訓練數(shù)據(jù)集（LAION）、開放 AI 生成圖片的版權（CC0）。這種三位一體的開源模式，讓全世界所有普通人、極客、創(chuàng)業(yè)者、商業(yè)團體可以隨心所欲地完成對 SD 的部署、運行、改進和商業(yè)化，且大膽使用全世界人利用 SD 所無私貢獻的 AI 生成式圖片，而不必受制于版權的束縛，大膽地去創(chuàng)新，讓 AI 技術在視覺生成領域能夠零摩擦地大跨步向前，不必受制于商業(yè)的條條框框而固步自封。

風靡國內外的 AI 藝術工具

時至今日，DD 雖然在商業(yè)化上無法體現(xiàn)效率、邊際成本、規(guī)模效應的優(yōu)勢，但其對 AI 藝術開源運動的引領地位被廣泛認可，依然是更多新人入場所能夠首先免費享受到的 AI 藝術體驗，對于教學與用戶教育的意義依然存在且無法被替代。

在美學角度，DD 對于色彩的大膽繪制往往令人“心馳神往”，但其并不注重邏輯性，具有極為強烈的“AI 風格”，這種純粹追求對視覺的沖擊效果也經常被壁紙類創(chuàng)作者所青睞，因此在抖音、小紅書等社交媒體上經常會看到由 DD 所創(chuàng)作的“色彩美學”作品。幾乎所有的國產 AI 藝術產品和工具都會首先集成 DD，是對開創(chuàng)者的致敬，也是對其獨特美學體驗的認可，這種風格不因技術的進化而過時，也許會歷久而彌新，傳承為 AI 藝術最初始的模樣，愈發(fā)不可替代，則彌足珍貴！

DD繪制的中國二十四節(jié)氣

AI 藝術領域并非由開源獨撐，時至今日商業(yè)化最為成功的當屬 MJ。而 MJ 不僅完全閉源，還倡導付費模式。這種底氣當然來自其核心可控的技術、強大的產品、頂級的算法、不斷進化的數(shù)據(jù)集，使得 MJ 的出圖已經進入“大成之境”，不論從邏輯性還是細節(jié)都幾乎與人類藝術家難解難分。迄今為止，MJ 共發(fā)布了四個版本，而每個版本都有其“致命性”的革新，如 v2 版的“美學”、v3 版的“邏輯”、v4 版的“無可挑剔”。每次的新版本發(fā)布都無不讓全世界為之歡呼和追捧，這種場面不禁令人想到了當初 iPhone 從初代開始的每一場發(fā)布。有人戲稱，DD 是塞班，SD 是安卓，MJ 則是蘋果。戲謔之中，暗藏著歷史的重演，未來已在此處，只是分布不均。

靠著不斷進化的“深度”，MJ 全年都處于興盛不衰的狀態(tài)，是所有 AI 藝術創(chuàng)作者都頂禮膜拜的“岡仁波齊峰”。雖然 MJ 并沒有進駐中國消費市場，但憑借著大模型（Big Model）之“大力出奇跡”的精髓，加上 MJ 每天都在擴充自己的訓練數(shù)據(jù)集，這個扎根于海外的產物竟也十分理解中國元素。很多國內用戶用它刻畫古風、武俠、神獸、古建筑等系列，并燃爆了整個抖音和小紅書的公域流量，好的作品點贊量都高達一百多萬，比很多粉絲數(shù)上億的頭部主播發(fā)布的日常狀態(tài)都高。也許在七八月份的時候，很多用戶還能挑出 MJ 出圖的各種問題和瑕疵，但今天更多的是折服與認可，隨之而來的便是持續(xù)的商業(yè)化輸出。MJ 的創(chuàng)作者群體已經逐漸從一開始的純興趣愛好慢慢擴展至使用 MJ 進行商業(yè)設計與變現(xiàn)的職業(yè)群體，涉及影視制作、游戲設計、UI 設計、原畫、插畫、壁紙、數(shù)字藝術、數(shù)字藏品、元宇宙視覺等多個領域數(shù)百萬人的輻射。

MJ 目前將社群構建在海外社交軟件 Discord 之上，從 0 到 100 萬人僅僅不到半年時間，而更是在隨后的兩個月時間內從 100 萬干到了近 400 萬左右的規(guī)模。

可以說 MJ 社群的規(guī)模增長速度恰如其分地反映了整個 AI 藝術行業(yè) 2022 年的發(fā)展軌跡和無盡潛力。作為 AI 藝術皇冠上的明珠，MJ 的存在無疑給了從事這個行業(yè)的創(chuàng)作者和創(chuàng)業(yè)者更多的信心和鼓舞，因為它在不斷證明——AI 藝術的進化是永無止境的！

AI藝術家AIBEN使用MJ創(chuàng)作的科幻作品

在技術基因上，SD 跟 MJ 有著太多相似、相比、相拼之處。比如出圖時間都在 1 分鐘以內，甚至秒級，這得益于像 SD 利用潛空間（latent space）極大地提升了擴散模型的繪制效率，將原本二維的像素空間畫布降維至一維的潛空間，這不僅僅是壓縮了時間，更讓圖像匹配人類描述的精準度大大提升，因此這類模型相比于初代的擴散模型更具商業(yè)落地可行性，可滿足千萬乃至上億人參與的新消費場景。

時至今日，由 MJ 和 SD 領銜的 AI 藝術消費市場已經在全球突破了一千萬用戶的大關，并在瘋狂地向一億全球用戶的新征程邁進。但 SD 目前在輸出圖像的藝術水準上相比于 MJ 還存在一些進步的空間，這與我們接下來要講得息息相關，也是 SD 生態(tài)正在努力的方向。

目前 SD 生態(tài)由公司實體 StabilityAI 和 RunwayML 共同領銜推進，與此同時一些第三方社區(qū)力量也舉足輕重，諸如 SD webui 項目、眾多二次元改進項目、可用于訓練 SD 新模型的 dreambooth 生態(tài)、可用于精準控制 SD 畫面輸出的交叉注意力技術方向等等。百花齊放，生態(tài)猶如熱帶雨林一般，可能每天都有生與死，但生生不息！

更值得注意的是，擴散模型技術大廈的構建更離不開眾多上游大技術的鼎力配合，尤其指更精準理解人類語義的大模型技術、文本與圖像多模態(tài)預訓練模型（CLIP）、AI 藝術輸出質量最為依賴的大規(guī)模訓練數(shù)據(jù)集等。

SD 今天的成就離不開當初對 LAION 數(shù)據(jù)集的全力支持，其中大名鼎鼎的 LAION-5B 是用于訓練下一代圖像文本模型的開放式大規(guī)模數(shù)據(jù)集，高達 58.5 億個圖像-文本對，共 80T 數(shù)據(jù)，是世界第一大規(guī)模、多模態(tài)的文本圖像數(shù)據(jù)集。

這個數(shù)據(jù)集的建立并非一朝一夕的工作，它是對互聯(lián)網發(fā)展近 30 年的縮影，要對海量的互聯(lián)網圖片做大量的工作，諸如提供了色情圖片過濾、水印圖片過濾、高分辨率圖片、美學圖片等子集和模型，以供不同方向研究。這就是互聯(lián)網的視覺 DNA！時至今日則由 CLIP、擴散模型等新一代 AI 技術進行編碼演繹，去勾勒出互聯(lián)網未來的模樣——元宇宙時代。隨著 LAION 的持續(xù)進化，SD 也會輸出更加高質量的 AI 藝術作品，就像 MJ 那樣。

誠如 StabilityAI 創(chuàng)始人 Emad 所言：“很高興支持創(chuàng)建這個為下一代模型奠定基礎的數(shù)據(jù)集。甚至更好的數(shù)據(jù)集正在開發(fā)中，它被設計為廣泛的、可擴展的?，F(xiàn)在我們將向著多樣化、專業(yè)化和不斷提高質量前進?！?/p>

SD繪制的“萬事萬物”

如今人類有了眾多開源與閉源的 AI 藝術生產力，這其中有的可以直接進入商業(yè)生產，而有的則停留在娛樂體驗，因此就產生了付費與免費的用戶行為。對于極致水準的圖像生成，用戶付費的意愿也隨之強烈，這便是 AI 藝術這個行業(yè)極為明確的發(fā)展方向，進化是永恒的使命！

（注：全文超萬字，共分三篇，上篇以幾大 AI 藝術模型講述“緣起”，中篇以打破“十二道邊界”講述“意義”，下篇從最新技術動向的角度講明 AI 藝術尚存在的進化空間，暢想“未來”）

關鍵詞：模型技術生成圖片