一文看懂 AIGC 的版權(quán)問(wèn)題
隨著AIGC技術(shù)的出現(xiàn),相關(guān)的版權(quán)問(wèn)題也被擺上了臺(tái)面,并引發(fā)了不少行業(yè)的關(guān)注。那么我們要如何理解當(dāng)前的AIGC作品版權(quán)問(wèn)題?我們要如何更合理地使用AIGC技術(shù),降低并避免侵權(quán)風(fēng)險(xiǎn)的發(fā)生?一起來(lái)看看作者的解讀。
伴隨著 AIGC 技術(shù)的強(qiáng)勢(shì)出圈,大家在驚嘆 AI 技術(shù)強(qiáng)大的同時(shí),也有越來(lái)越多的人開(kāi)始討論關(guān)于由此帶來(lái)的版權(quán)問(wèn)題:我們通過(guò) AI 生成的圖像屬于平臺(tái)還是個(gè)人?目前 AI 作品版權(quán)在法律上是如何界定的?又該如何避免引起 AI 版權(quán)的糾紛?
今天我想和大家聊聊關(guān)于當(dāng)前 AIGC 作品版權(quán)的問(wèn)題,希望能給大家?guī)?lái)一點(diǎn)思考。
一、AI作品的版權(quán)如何界定?
目前關(guān)于 AI 版權(quán)歸屬問(wèn)題主要有2 種看法:持保守觀點(diǎn)的認(rèn)為 AIGC 只是從海量數(shù)據(jù)庫(kù)中選擇元素進(jìn)行拼接,初始的創(chuàng)意和付出都源自原藝術(shù)家,因此版權(quán)應(yīng)該屬于數(shù)據(jù)庫(kù)中的原作者和開(kāi)發(fā) AI 技術(shù)的平臺(tái)。而另一種觀點(diǎn)認(rèn)為,在 AI 作品生成過(guò)程中創(chuàng)作者也經(jīng)過(guò)調(diào)試編輯,通過(guò)多次迭代才生成最終圖像,所以AI 創(chuàng)作者同樣持有作品的版權(quán)。
實(shí)際情況是怎樣的呢?我們?cè)賮?lái)看看平臺(tái)方在這方面的規(guī)定。根據(jù) Midjourney 在平臺(tái)規(guī)則手冊(cè)中標(biāo)注的信息中,明確標(biāo)注了除非是高收入的公司用戶,正常情況下付費(fèi)會(huì)員制作的 AI 圖像是擁有完全所有權(quán)的,可以自由使用創(chuàng)作的圖片。這表明了Midjourney作為開(kāi)發(fā)者方自主放棄了生成圖像的所有權(quán)。
圖像來(lái)源:Midjourney 服務(wù)條款-用戶權(quán)益
從平臺(tái)聲明來(lái)看,似乎創(chuàng)作者可以完全放心的使用 Midjourney 生成的 AI 作品,但是事實(shí)真的如此嗎?
近期就有 3 位藝術(shù)家代表美國(guó)加州藝術(shù)家群體起訴Stability AI、Midjourney及DeviantArt公司的 AIGC 技術(shù),控訴他們未經(jīng)原創(chuàng)作家許可,便貿(mào)然使用網(wǎng)絡(luò)上的 50 億張圖像進(jìn)行 AI 訓(xùn)練。
藝術(shù)家 Karla Ortiz 在評(píng)論中說(shuō)到:我很自豪能成為這起集體訴訟的原告之一。我很自豪能與同行一起做這件事,我們將為可能受到影響的數(shù)千名藝術(shù)家發(fā)聲。我很自豪在公共領(lǐng)域而且在法庭上為我們的權(quán)利而戰(zhàn)!
二、AI可能導(dǎo)致的侵權(quán)風(fēng)險(xiǎn)
想要真正理解事情的發(fā)展緣由,需要了解 AI 繪圖創(chuàng)作過(guò)程中可能會(huì)產(chǎn)生侵權(quán)問(wèn)題的行為,目前主要有 2 個(gè)階段會(huì)引起版權(quán)爭(zhēng)議的問(wèn)題:分別是模型訓(xùn)練階段和圖像輸出階段。
首先,AI 技術(shù)想要發(fā)展和提升必須有體量極度龐大的數(shù)據(jù)庫(kù)進(jìn)行模型訓(xùn)練,這個(gè)過(guò)程中數(shù)據(jù)庫(kù)會(huì)不可避免的包含很多受版權(quán)保護(hù)的作品??赡艽蠹覍?duì)數(shù)據(jù)在 AI 領(lǐng)域的重要性并不太清楚?可以這么說(shuō),數(shù)據(jù)是一切人工智能的基礎(chǔ)。體現(xiàn)在很多行業(yè)中,數(shù)據(jù)都是影響企業(yè)競(jìng)爭(zhēng)的重要壁壘之一,比如特斯拉在自動(dòng)駕駛領(lǐng)域的數(shù)據(jù)積累和科大訊飛在智慧教育領(lǐng)域的題庫(kù)積累等。
以 ChatGPT 為例,根據(jù) OpenAI 公司的透露,他們?cè)谟?xùn)練過(guò)程中使用45TB的數(shù)據(jù),包含近1萬(wàn)億個(gè)單詞,這個(gè)數(shù)字差不多抵得上牛津詞典單詞量的 1300 倍。根據(jù)麻省理工大學(xué)的Pablo Villalobos等6位計(jì)算機(jī)科學(xué)家就預(yù)測(cè),到2026年,ChatGPT等大型語(yǔ)言模型的訓(xùn)練就將耗盡互聯(lián)網(wǎng)上的可用文本數(shù)據(jù),屆時(shí)將沒(méi)有新的訓(xùn)練數(shù)據(jù)可供使用。
圖片來(lái)源:OpenAI 官網(wǎng) ChatGPT訓(xùn)練模型
而目前AI模型的數(shù)據(jù)來(lái)源包括以下幾類:公共數(shù)據(jù)集、公共網(wǎng)站、自有數(shù)據(jù)、眾包數(shù)據(jù)、合成數(shù)據(jù)等。除了合成數(shù)據(jù)沒(méi)有版權(quán)爭(zhēng)議外,其他數(shù)據(jù)都是通過(guò)采集互聯(lián)網(wǎng)獲得,而合成數(shù)據(jù)目前還處于初步發(fā)展階段,沒(méi)辦法大規(guī)模應(yīng)用到當(dāng)前市場(chǎng)中。
比如著名的 AI繪圖工具Stable Diffusion,它的模型訓(xùn)練數(shù)據(jù)源是包含了上億圖像的LAION-5B數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)本身并不儲(chǔ)存網(wǎng)絡(luò)圖像本體,而是作為各類版權(quán)作品的在線索引,在訓(xùn)練模型時(shí)需要先將作品下載到本地儲(chǔ)存為副本,那這個(gè)下載過(guò)程本身就包含了對(duì)版權(quán)作品的使用。
圖像來(lái)源:LAION-5B 官網(wǎng)《開(kāi)放大規(guī)模多模態(tài)數(shù)據(jù)集的新時(shí)代》,作者 Romain Beaumont
接著在圖像輸出階段, AI 模型會(huì)將數(shù)據(jù)庫(kù)中的資源進(jìn)行算法解析,組合生成新的圖像。目前 AI生成繪畫圖像 主要有 3 種方式:圖片濾鏡、筆觸臨摹和關(guān)鍵詞模態(tài)轉(zhuǎn)化。
- 圖片濾鏡:將參考畫作和目標(biāo)圖片進(jìn)行分層比對(duì),并不斷的疊加融合,最終得到帶有參考畫作風(fēng)格的目標(biāo)圖片。
- 筆觸臨摹:通過(guò)算法模擬參考畫作的筆觸,和真人作畫過(guò)程類似,將其分解為一系列真實(shí)的筆觸序列,再組合成新的目標(biāo)畫像。
- 關(guān)鍵詞模態(tài)轉(zhuǎn)化:將文本關(guān)鍵詞和數(shù)據(jù)庫(kù)中的圖像進(jìn)行關(guān)聯(lián),組合生成最符合的圖像。
但是不管是通過(guò)哪種方式生成的 AI 圖像,必然會(huì)包含數(shù)據(jù)庫(kù)中版權(quán)作品的部分特征,考慮到最終生成圖像和原版權(quán)作品的相似性,是有可能對(duì)原創(chuàng)作品產(chǎn)生抄襲嫌疑的。
這時(shí)候有人可能會(huì)說(shuō),AI 的訓(xùn)練數(shù)據(jù)數(shù)以億計(jì),擔(dān)心最終生成的圖像和其中幾張相似也太過(guò)于杞人憂天了。然而在最新一項(xiàng)以Stable Diffusion等AI擴(kuò)散生成模型為研究對(duì)象的實(shí)驗(yàn)中,馬里蘭大學(xué)和紐約大學(xué)的聯(lián)合研究團(tuán)隊(duì)指出:利用Stable Diffusion模型生成的內(nèi)容與數(shù)據(jù)集作品相似度超過(guò)50%的可能性達(dá)到了1.88%。此外,考慮到實(shí)驗(yàn)中樣本量只使用了 1200 萬(wàn)張圖片和全世界龐大的用戶使用量,AIGC 作品的侵權(quán)行為很可能比我們想象中要大得多。(信息來(lái)源:騰訊研究院)
去年年底,國(guó)外藝術(shù)作品平臺(tái) ArtStation 上的畫師們發(fā)起了聯(lián)合抵制 AI作品的活動(dòng),集體在官網(wǎng)打出“NO TO AI GENERATED IMAGES” 的標(biāo)語(yǔ)。作為職業(yè)畫師社交網(wǎng)站,它的存在本身就是為了展示繪畫創(chuàng)作者的創(chuàng)意和技法,提升自己的行業(yè)影響力,但是 AI 作品的出現(xiàn)打破了這種行業(yè)平衡。
三、AI侵權(quán)行為的判定標(biāo)準(zhǔn)
去年,紐約藝術(shù)家 Kashtanova 利用 Midjourney 創(chuàng)作了一份有 18 頁(yè)組成的漫畫書《Zarya of the Dawn》,并在 9 月為此申請(qǐng)了版權(quán)。然而到今年 2 月份的時(shí)候,美國(guó)版權(quán)局在了解到 K女士詳細(xì)的制作過(guò)程后進(jìn)行了回信并進(jìn)行了詳細(xì)說(shuō)明,回信中的內(nèi)容總結(jié)來(lái)說(shuō)就是:由 Midjourney 生成的作品并不由人類直接創(chuàng)作,所以不受版權(quán)保護(hù)。但是創(chuàng)作過(guò)程中的文字、收集的素材、元素排版、整理等工作內(nèi)容受版權(quán)的保護(hù)。
在回信中,美國(guó)版權(quán)局為此還進(jìn)行了詳細(xì)說(shuō)明:首先 AI 生成圖像是隨機(jī)的,整個(gè)過(guò)程不像傳統(tǒng)創(chuàng)作那樣完全被創(chuàng)作者掌控。在創(chuàng)作過(guò)程中人類只是從AI生成的圖像中選擇了一個(gè)最合適的,期間并沒(méi)有人類主體創(chuàng)作的過(guò)程,雖然最后 K 女士有使用 Phootoshop 進(jìn)行修正,但是修改的內(nèi)容太少,也不屬于版權(quán)保護(hù)的范圍。此外用來(lái)生成圖像的關(guān)鍵詞本身也不具備版權(quán)保護(hù)。
在這個(gè)案例中我們可以發(fā)現(xiàn)目前來(lái)看國(guó)外官方對(duì)于 AI 版權(quán)的態(tài)度并不是全盤否定的,對(duì)于人類參與創(chuàng)作的部分還是保持肯定的。那我國(guó)目前在 AI 作品上是如何判定版權(quán)的呢?
根據(jù)李宗輝老師(南京航空航天大學(xué)網(wǎng)絡(luò)與人工智能法治研究院副院長(zhǎng))刊登在2022年第3期《版權(quán)理論與實(shí)務(wù)》的雜志文章《論人工智能繪畫中版權(quán)侵權(quán)的法律規(guī)制》中所述,目前我國(guó)版權(quán)法采用的是“思想與表達(dá)二分法”的基本原則,來(lái)作為判斷 AI 繪畫是否構(gòu)成侵權(quán)的指導(dǎo)依據(jù)。
打個(gè)比方,前面我們提到 AI 繪畫的 3 種方式時(shí),其中對(duì)繪畫特征的提取、筆觸序列的提煉或者作品表達(dá)的情感這些還未落實(shí)成圖像的算法內(nèi)容,還是屬于作品的思想階段,并不會(huì)被判定為歸原作者版權(quán)所有。但是當(dāng)實(shí)際的圖像生成時(shí),如果判斷AI 畫作是否與某一部作品構(gòu)成實(shí)質(zhì)性相似適宜采用部分比對(duì)法,與多部作品進(jìn)行判斷時(shí)則應(yīng)當(dāng)采納整體觀感法。而一旦比對(duì)結(jié)果構(gòu)成實(shí)質(zhì)性相似,即應(yīng)被認(rèn)為構(gòu)成復(fù)制侵權(quán)行為。
此外在生成圖像的使用用途上,也會(huì)檢測(cè)是否造成侵權(quán)。比如是完全商用還是適度飲用,是否會(huì)和原作品正常使用造成沖突,有沒(méi)有損害原作者的合法權(quán)益等。
我們綜合國(guó)內(nèi)外的解釋來(lái)看,目前的法律條文對(duì)于 AI 作品的版權(quán)界定主要停留在對(duì)創(chuàng)作者參與創(chuàng)作的比例以及相似度的主觀判斷上,對(duì)于參與多少可以受版權(quán)保護(hù)、相似度差異達(dá)到多少閾值的時(shí)候會(huì)判定為不侵權(quán)等問(wèn)題還沒(méi)有非常具體的判斷條例。
這種情況也很正常,畢竟 AI 技術(shù)的發(fā)展過(guò)于迅速,當(dāng)前的法律條文還未來(lái)得及覆蓋人工智能領(lǐng)域的作品。但是我們作為 AIGC 技術(shù)的使用者需要意識(shí)到,在未來(lái)這段時(shí)間內(nèi)通過(guò) AIGC 生產(chǎn)的內(nèi)容都存在對(duì)其他作品侵權(quán)的可能,同時(shí)自己的 AI 作品也不受版權(quán)保護(hù),隨時(shí)可能被其他人拿去使用。
不過(guò)我們也大可不必忽視 AIGC 的價(jià)值,完全抵制 AI 技術(shù)帶來(lái)的生產(chǎn)力革新,我們更應(yīng)該思考的是如何避免自己的 AI 作品產(chǎn)生侵權(quán)風(fēng)險(xiǎn),以及保障自己作品的合法權(quán)益。
四、如何合理使用AIGC
考慮到前面對(duì)侵權(quán)行為的判定標(biāo)準(zhǔn),未來(lái)我們?cè)谑褂?AIGC 的過(guò)程中可以注意以下幾點(diǎn):在工作中如果需要對(duì) AI 作品商業(yè)化,需提前了解AI 工具平臺(tái)方相關(guān)的使用手冊(cè)或用戶協(xié)議等文件,明確產(chǎn)出內(nèi)容的所有權(quán)范圍和用途,避免后期產(chǎn)生法律糾紛。
此外不要直接的將 AI作品 作為自己的最終成果,而是將 AIGC 技術(shù)作為實(shí)現(xiàn)目的工具,在其中盡可能增加自己的創(chuàng)作痕跡和想法,比如先用Midjourney 等 AI 工具生成眾多風(fēng)格的效果圖,快速驗(yàn)證自己的靈感和產(chǎn)品方向,再以此為參考進(jìn)行設(shè)計(jì)。這樣既保證了作品的原創(chuàng)比例,同時(shí)也是體現(xiàn)設(shè)計(jì)師作為設(shè)計(jì)主體的核心價(jià)值。
此外,如果想徹底杜絕被原作者舉證 AI 創(chuàng)作侵權(quán)的可能性,可以提前了解創(chuàng)作AI 模型的采集數(shù)據(jù)源,在使用參考圖創(chuàng)作后標(biāo)注原作來(lái)源或提前獲得原作者的授權(quán)。
以上是我們作為 AI 技術(shù)的使用者需要了解的一些事項(xiàng)。而 AI 技術(shù)的開(kāi)發(fā)者和平臺(tái)方作為 AIGC 的最大受益者,更是需要擔(dān)負(fù)起人工智能侵權(quán)行為的主要責(zé)任。他們是 AI 技術(shù)控制權(quán)的主體,應(yīng)該主動(dòng)公開(kāi)說(shuō)明使用過(guò)程中可能產(chǎn)生侵權(quán)風(fēng)險(xiǎn)的行為,并對(duì)產(chǎn)生侵權(quán)行為的算法漏洞及時(shí)維護(hù)和修補(bǔ),只有這樣才能真正保證 AIGC 技術(shù)做到互惠互利,持久發(fā)展。
五、總結(jié)
以上就是關(guān)于 AI 作品版權(quán)問(wèn)題的現(xiàn)狀和給大家的一些建議。雖然目前 AI 侵權(quán)相關(guān)的法律條文還不成熟,需要經(jīng)過(guò)多方考量和求證,但是未來(lái)針對(duì) AIGC 作品的具體規(guī)范文件出臺(tái)是大勢(shì)所趨。我們既要肯定 AIGC 技術(shù)帶來(lái)生產(chǎn)效率上的巨大提升,同時(shí)我們也要保證創(chuàng)作者的合法權(quán)益,畢竟版權(quán)保護(hù)的是每一位原創(chuàng)作者的勞動(dòng)成果和智慧結(jié)晶,而不是人工智能本身。
本文由 @樂(lè)伊ROY 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
留言支持一下,感謝分享。