首頁>資訊 >
世界關(guān)注:百度文心一言潛藏風險,AI視頻素材來源不明,創(chuàng)作者或陷版權(quán)風暴 2023-03-27 12:54:14  來源:36氪

3月16日,李彥宏攜百度文心一言亮相,并宣布開放邀請測試。

雖然文心一言的能力受到了質(zhì)疑,但毋庸置疑的是,百度是全球第一個挑戰(zhàn)ChatGPT的大廠。李彥宏也已經(jīng)預見,文心一言在與ChatGPT正面比較時會令大眾失望,但百度認為,文心一言有兩大優(yōu)勢:一是,畫圖、寫長文、文字轉(zhuǎn)視頻等多模態(tài)生態(tài)能力是ChatGPT所不具備的;二是,文心一言具備中文理解能力優(yōu)勢。

但是,百度自詡的優(yōu)勢也許會成為文心一言所面臨的大問題。近日,有網(wǎng)友在對百度文心一言AI作畫功能進行大量測試后產(chǎn)生懷疑,認為其可能只是一個套殼的AI模型,先將用戶的中文指令翻譯成英文,然后用國外開源的AI模型生成作品。百度方面針對此回應表示,文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態(tài)大模型ERNIE-ViLG。


(相關(guān)資料圖)

不過《IT時報》記者發(fā)現(xiàn),百度低調(diào)向百家號入駐作者開放的AI圖文轉(zhuǎn)視頻功能存在版權(quán)風險:百度視頻素材來源不明。但這一風險被轉(zhuǎn)嫁至媒體及其他百家號作者,若被告侵權(quán),作者將承擔巨大的版權(quán)風險。截至發(fā)稿,百度沒有對文心一言版權(quán)問題進行回復。

百度即將在今天(3月27日)上線文心一言云服務(wù),屆時,AI寫作、AI作圖、AI文字生成視頻等功能都有可能對外開放,這些危險的AI生成作品,也許會把百度席卷至版權(quán)風暴之中。

AI視頻潛藏版權(quán)風險

《IT時報》記者實測比較百度文心一言和微軟必應ChatGPT后發(fā)現(xiàn),文心一言在文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算方面仍有較大的追趕空間。但正如李彥宏所言,百度文心一言的優(yōu)勢在中文理解和多模態(tài)生成能力。

李彥宏表示,文心一言目前版本已經(jīng)能生成文字、圖片和語音。生成視頻因為成本比較高,還沒有對所有用戶開放,未來百度會逐步接入。但熟悉百家號創(chuàng)作的用戶,不少都已經(jīng)體驗過這個功能,每天有幾萬篇文章通過這個能力轉(zhuǎn)成視頻內(nèi)容在百度平臺分發(fā)。

但是,巨大的版權(quán)風險正潛藏在這每天幾萬條根據(jù)文字自動生成的視頻中。

百度AI文字轉(zhuǎn)視頻功能早在2022年3月就已在百家號低調(diào)上線,百家號作者鮮少第一時間發(fā)現(xiàn),是因為這一功能是在發(fā)布文章時默認勾選。在默認勾選狀態(tài)下,百度AI會自動根據(jù)文字內(nèi)容尋找合適的視頻素材,生成視頻后并自動發(fā)布,其中文章配圖只占10%以內(nèi)的占比,其他視頻素材均來自百度視頻庫。

這是屬于文心一言AIGC(人工智能自主生成內(nèi)容)的TTV(文本內(nèi)容情感化分析)功能。危險的是,百度并未公開其AI視頻素材來源。多位百家號工作人員向《IT時報》記者表示,的確存在版權(quán)風險,至于其視頻素材來源,一部分由百度進行版權(quán)采買,一部分是公開CC0(放棄版權(quán))素材,建議不發(fā)到百度站外,或關(guān)閉該功能。

目前,這些AI視頻主要自動發(fā)布在百家號及百度好看視頻平臺,但可以下載。“如果在百度平臺內(nèi),可能由百度來處理版權(quán)糾紛,但目前還沒了解到有什么版權(quán)侵權(quán)的案例。”百度百家號工作人員向《IT時報》記者透露。

但在社交平臺上,多名百家號作者表示,AI根據(jù)其文章自動生成的視頻被投訴侵權(quán),其賬號信用分被扣至0分而被封禁。還有百家號作者表示,AI自動生成視頻中疑似含有版權(quán)水印。

《IT時報》記者發(fā)現(xiàn),百度AI視頻庫里還有不少電視臺等媒體拍攝視頻,但無處查詢視頻素材出處。

百家號只在圖文轉(zhuǎn)視頻的相關(guān)權(quán)益說明中提到,“如果您是原創(chuàng)視頻作者,那么您發(fā)布的圖文為原創(chuàng)時,轉(zhuǎn)出的視頻會自動聲明該視頻為原創(chuàng)視頻,并且視頻的閱讀收益歸您所有?!?/p>

截至發(fā)稿,百度沒有對文心一言AI視頻來源等問題做出回復。

風險轉(zhuǎn)嫁至作者

更不合理的是,百度可以無償使用百家號作者上傳的內(nèi)容,又將版權(quán)風險轉(zhuǎn)嫁給百家號作者。

百家號在平臺服務(wù)協(xié)議9.7條中提到:“您使用百家號平臺服務(wù)上傳、發(fā)布或傳輸內(nèi)容即代表了您有權(quán)且同意在全世界范圍內(nèi),永久性地、不可撤銷地、免費地授予百度及其關(guān)聯(lián)方對該內(nèi)容的存儲、使用、發(fā)布、復制、修改、改編、出版、翻譯、據(jù)以創(chuàng)作衍生作品、傳播、表演和展示等權(quán)利;將內(nèi)容的全部或部分編入其他任何形式的作品、媒體、技術(shù)中的權(quán)利;對您的上傳、發(fā)布的內(nèi)容進行商業(yè)開發(fā)的權(quán)利……以及再授權(quán)給其他第三方以上述方式使用的權(quán)利。

據(jù)此協(xié)議理解,百度有權(quán)使用百家號A作者上傳的文字、圖片、視頻等內(nèi)容,編入B作者的作品中,甚至用于商業(yè)用途,完全不需要得到A作者的授權(quán),也不需要付費給A作者。

《IT時報》記者查詢抖音及其他新聞媒體平臺與作者簽訂的協(xié)議發(fā)現(xiàn),并沒有存在如百度百家號這般不合理的條款。

上海大邦律師事務(wù)所高級合伙人、知識產(chǎn)權(quán)律師游云庭解讀認為,如果上述條款有效,那百度就可以使用這些視頻素材,不構(gòu)成侵權(quán)也無須支付對價,如果該條款被法院認定為無效,則百度對外使用就構(gòu)成侵權(quán)。

而當該條款遇上AI生成內(nèi)容,潛藏的版權(quán)風險將對百家號作者更加不利。游云庭認為,文字內(nèi)容是媒體創(chuàng)作的,百度只是提供了技術(shù)服務(wù),因為AI生成的視頻是無權(quán)享受著作權(quán)的,所以知識產(chǎn)權(quán)應該歸媒體所有。媒體發(fā)布的視頻,對外應該由媒體承擔責任,如果權(quán)利人起訴媒體就是媒體承擔責任,如果權(quán)利人起訴雙方共同侵權(quán),則構(gòu)成連帶侵權(quán)責任。

“由百度提供模型,素材庫按照百度的合同規(guī)則使用的情況下,發(fā)生侵權(quán)可能責任是百度的。這當中任何一個節(jié)點發(fā)生變化,可能就是使用者的責任或者共同責任。這里面變量很多,要看具體細節(jié)。判斷依據(jù)是人工智能生成品是不是侵權(quán),模型數(shù)據(jù)提供者和使用者有沒有過錯等?!鄙虾6魏投温蓭熓聞?wù)所合伙人劉春泉認為,人工智能生成品有沒有版權(quán)?與責任風險由誰承擔?應該按照權(quán)利義務(wù)相一致原則來處理。純粹人工智能生成品與動物按快門拍照片和大象畫畫一樣沒有版權(quán)。但是人利用AI作為工具制作的產(chǎn)品,符合法律規(guī)定的構(gòu)成作品,可以受保護。

制作1條AI視頻最低9.99元

《IT時報》記者發(fā)現(xiàn),百度已經(jīng)在進行文心一言的商業(yè)化嘗試,而上述AI文字轉(zhuǎn)視頻的服務(wù)正是文心一言云服務(wù)的主要盈利點。

目前,百度大腦智能創(chuàng)作平臺推出了兩種會員套餐,視頻創(chuàng)作會員1698元/月,智能寫作會員198元/月。其中,視頻創(chuàng)作會員的權(quán)益就包括每月50次圖文轉(zhuǎn)視頻等。此外,圖文轉(zhuǎn)視頻200條的報價是1998元,50條的報價是698元,20條的報價是298元,也就是說,1條圖文轉(zhuǎn)視頻的價格最低是9.99元

“目前不管是API還是線上售賣的套餐,我們都沒接入素材庫?!卑俣仍瓶蛻艚?jīng)理沒有正面回答文字轉(zhuǎn)視頻素材來源的問題,但就AI生成圖片的版權(quán)問題回復表示:“AI生成內(nèi)容的可版權(quán)性在法律上仍處于不確定狀態(tài),百度不限制您將生成圖片用于商業(yè)用途,但您應確保自身使用行為的合法合規(guī)性,在享有生成圖片使用權(quán)益的同時,自行承擔使用生成圖片的一切后果。

截至3月27日,百度大腦智能創(chuàng)作平臺顯示,其自動創(chuàng)作文章已超200萬篇,自動創(chuàng)作短視頻已超15萬條。

風口上的百度急了

“現(xiàn)在百度最卷的部門已經(jīng)不是自動駕駛了,而是文心一言?!币晃话俣茸詣玉{駛部門的員工說道。

基于20多年搜索業(yè)務(wù)的積累,百度建立起世界上最大的知識圖譜,包含50億實體、5500億級事實,每天調(diào)用量超過400億次。受益于百度知識圖譜,文心大模型也成為全球首個知識增強千億級大模型。研究表明,數(shù)據(jù)達到千億級,大模型就可能發(fā)生“智能涌現(xiàn)”,但最快跑出ChatGPT的為什么不是百度?

過去10年,百度在AI領(lǐng)域投入超1100億元的研發(fā)費用,2019年就推出了文心大模型ERNIE 1.0。論起步時間,文心一言并不比ChatGPT晚,但論專注度,百度沒有OpenAI聚焦。此前百度之前一直將最大的精力投向了自動駕駛,以及一系列的AI風口追逐,當初希壤也讓百度爭得了國內(nèi)元宇宙“頭號玩家”等名號。

百度的主要收入還是搜索廣告,這也是百度為什么著急做文心一言的原因之一。”一位百度昆侖芯的員工認為。

ChatGPT焦慮已經(jīng)是業(yè)內(nèi)的常態(tài)。

國內(nèi)ChatGPT模型跟OpenAI的差距到底在哪里?“算法上還有細節(jié)要打磨,其次,高質(zhì)量的文本數(shù)據(jù)還需要多積累。”一家研發(fā)GPT模型公司CEO對《IT時報》記者道出了多數(shù)國內(nèi)ChatGPT從業(yè)者的現(xiàn)實和心態(tài),“類ChatGPT的產(chǎn)品可能有版權(quán)上的顧慮,但先把技術(shù)用起來,以后再想辦法更好地規(guī)范。

不過,也有一家國內(nèi)AI大廠的相關(guān)人士對《IT時報》記者表示,目前已跑出AI作圖等ChatGPT大模型,但是主要考慮到版權(quán)等風險,沒有快速上線。

AI版權(quán)風暴即將來襲

最近,網(wǎng)易旗下輕博客社區(qū)LOFTER上的大量創(chuàng)作者刪檔銷號,退出平臺,用行動抵制AI作畫。起因是網(wǎng)易LOFTER上線AI作畫功能“老福鴿畫畫機”,部分創(chuàng)作者認為該功能可能用到原創(chuàng)作者的畫作,有侵犯版權(quán)之嫌。

對此,網(wǎng)易LOFTER強調(diào)“該功能訓練集來自于開源,沒有使用LOFTER用戶的作品數(shù)據(jù),并明確注明不得用于商業(yè)用途”。3月16日,網(wǎng)易LOFTER官微向創(chuàng)作者發(fā)出一份公開致歉信,為傷害了很多創(chuàng)作者而表達歉意。該AI作畫功能已于3月8日下線,網(wǎng)易LOFTER單獨設(shè)立的“AI內(nèi)容冒充原創(chuàng)”反侵權(quán)投訴渠道,截至3月25日收到1148條舉報投訴。

在國外,AI侵權(quán)問題已經(jīng)引起社會關(guān)注。近日,《華爾街日報》等多家國外主流新聞媒體指控OpenAI及其聊天機器人模型ChatGPT未經(jīng)許可使用新聞來源進行訓練,并拒絕向媒體支付相關(guān)費用。

早在2022年,一名程序員起訴GitHub、微軟和OpenAI,指控GitHub Copilot的AI編程工具抄襲代碼。今年1月,一群藝術(shù)家起訴AI繪畫Stability AI Ltd.、Midjourney Inc.和DeviantArt Inc.,聲稱這些公司下載并使用了數(shù)十億張受版權(quán)保護的圖像,但沒有獲得藝術(shù)家的授權(quán)并對其進行補償。

一場AIGC的版權(quán)風暴正在來襲。

2月15日,愛奇藝宣布將全面接入百度文心一言,雙方將共同探索AIGC在內(nèi)容搜索、內(nèi)容宣發(fā)、內(nèi)容創(chuàng)作工具、小說創(chuàng)作等業(yè)務(wù)上的應用。近期,文心一言開發(fā)的AI文檔寫作助手也將上線百度文庫,作者只要輸入主題及內(nèi)容要求,AI寫作助手就能幫助搜集資料、搭建框架、填充內(nèi)容、理順文檔、制造亮點,最終生成范文。

李彥宏認為,多模態(tài)生成能力是ChatGPT不具備的能力,這是文心一言的優(yōu)勢。但是,百度一旦開放AI寫作、AI作圖、AI文字生成視頻等,受到的版權(quán)類指控并不會比ChatGPT少。訓練數(shù)據(jù)是否得到授權(quán),AI生成作品是否涉嫌侵權(quán)等問題會接踵而至。

關(guān)于AI生成內(nèi)容的版權(quán)問題正在業(yè)內(nèi)掀起大討論。

知識產(chǎn)權(quán)界絕大多數(shù)專家都認為,AI生成內(nèi)容是不受版權(quán)保護的。中國社會科學院知識產(chǎn)權(quán)中心主任李明德認為,《著作權(quán)法》只保護人的作品,AI生成的內(nèi)容不是作品,沒有版權(quán)。只有個人使用存在免責情況,公司拿媒體的作品去訓練AI,但沒有拿到媒體的授權(quán),就構(gòu)成侵權(quán),文字三四行就能構(gòu)成作品,視頻每一幀都是作品。

關(guān)鍵詞:

相關(guān)閱讀:
熱點
圖片