閱讀提示:本文大約23000字,認(rèn)真讀完至少需要50分鐘,請(qǐng)合理安排閱讀時(shí)間。
論著概要 生成式人工智能(GAI)機(jī)器學(xué)習(xí)的版權(quán)合法性問(wèn)題是人工智能時(shí)代亟待解決的重要議題,引發(fā)了諸多爭(zhēng)議。多數(shù)學(xué)者主張采用合理使用制度予以規(guī)制,少數(shù)學(xué)者則認(rèn)為應(yīng)當(dāng)適用法定許可制度。經(jīng)“四要素測(cè)試法”分析可得,不同場(chǎng)景下的 GAI 機(jī)器學(xué)習(xí)構(gòu)成合理使用的可能性不同,需要在個(gè)案中予以判定,不能為市場(chǎng)主體提供明確的免責(zé)信號(hào)。為了維系版權(quán)保護(hù)和技術(shù)創(chuàng)新的平衡,應(yīng)構(gòu)建多層次、體系化的規(guī)制方案:一是增設(shè)非營(yíng)利性 GAI 機(jī)器學(xué)習(xí)的合理使用情形,并引入開(kāi)放、靈活的兜底條款;二是設(shè)置營(yíng)利性 GAI 機(jī)器學(xué)習(xí)的法定許可情形,在保障著作權(quán)人利益的同時(shí),降低作品的交易成本;三是借鑒“避風(fēng)港規(guī)則”為 GAI 服務(wù)提供者設(shè)定適當(dāng)?shù)淖⒁饬x務(wù),以降低生成版權(quán)侵權(quán)內(nèi)容的風(fēng)險(xiǎn);四是探尋商業(yè)實(shí)踐中的自治手段,用戶(hù)協(xié)議、知識(shí)共享協(xié)議、版權(quán)保險(xiǎn)等措施,為構(gòu)建寬松的市場(chǎng)環(huán)境提供更靈活的解決方案。

胡開(kāi)忠簡(jiǎn)介:中南財(cái)經(jīng)政法大學(xué)知識(shí)產(chǎn)權(quán)研究中心二級(jí)教授、博士生導(dǎo)師,中國(guó)人民大學(xué)法學(xué)博士;“全國(guó)知識(shí)產(chǎn)權(quán)領(lǐng)軍人才”、湖北省第二屆“優(yōu)秀中青年法學(xué)家”;國(guó)家版權(quán)局國(guó)際版權(quán)研究基地副主任,國(guó)家社科基金重大項(xiàng)目“支持全面創(chuàng)新的知識(shí)產(chǎn)權(quán)制度體系構(gòu)建研究”首席專(zhuān)家。
一、問(wèn)題的提出
與互聯(lián)網(wǎng)技術(shù)早期發(fā)展的歷史邏輯相同,人工智能技術(shù)的發(fā)展也正經(jīng)歷著“非法興起”的階段。[1] 豐富、優(yōu)質(zhì)的版權(quán)作品作為促進(jìn)人工智能發(fā)展的技術(shù)要素,被廣泛地用于數(shù)據(jù)訓(xùn)練。但受制于傳統(tǒng)的“事前授權(quán)”模式,規(guī)?;淖髌肥褂眯袨橐馕吨鴺O高的交易成本,造成了市場(chǎng)失靈的困境,未經(jīng)許可將版權(quán)作品用于機(jī)器學(xué)習(xí)已然成為常態(tài)。
面對(duì)技術(shù)革命引發(fā)的利益失衡格局,全球范圍內(nèi)已發(fā)生多起著作權(quán)人向人工智能技術(shù)研發(fā)者發(fā)起的訴訟,以期法律積極回應(yīng)機(jī)器學(xué)習(xí)場(chǎng)景下的版權(quán)治理需求。在中國(guó),2023年12月,四位繪畫(huà)創(chuàng)作者向 AI 繪畫(huà)軟件Trik的開(kāi)發(fā)運(yùn)營(yíng)者小紅書(shū)發(fā)起訴訟,主張小紅書(shū)未經(jīng)許可將其作品用于 AI 模型訓(xùn)練并應(yīng)用于商業(yè)用途,生成的圖片在色調(diào)、筆觸、構(gòu)圖等繪畫(huà)風(fēng)格方面與原作品構(gòu)成實(shí)質(zhì)性相似,該行為已經(jīng)遠(yuǎn)超合理使用范疇,侵害了其所享有的合法權(quán)益。[2] 2024年6 月20日,北京互聯(lián)網(wǎng)法院開(kāi)庭審理了該案件。[3] 此外,番茄小說(shuō)平臺(tái)因發(fā)布了一則“AI 訓(xùn)練補(bǔ)充協(xié)議”遭到大量平臺(tái)作家的抵制,迫使其再度發(fā)布了解除 AI 訓(xùn)練條款。[4]
與此同時(shí),在美國(guó),有關(guān)機(jī)器學(xué)習(xí)的版權(quán)糾紛也不斷出現(xiàn)。截至目前,已有約 22 起訴訟正在進(jìn)行。[5] 其中的訴訟主體有作家代表,比如2023年1月13日,美國(guó)三名藝術(shù)家代表其他集體訴訟成員對(duì)Stability AI,Midjourney等四名被告發(fā)起集體訴訟,指控其未經(jīng)用戶(hù)同意擅自爬取了數(shù)十億張具有版權(quán)的圖像用于訓(xùn)練模型。[6] 有大型的圖片運(yùn)營(yíng)商,比如2023年2月3日,全球知名圖片運(yùn)營(yíng)商Getty單獨(dú)針對(duì)Stability AI提起訴訟,指控Stability AI未經(jīng)許可擅自從 Getty 的圖片庫(kù)中復(fù)制了超過(guò)1200萬(wàn)張圖片和元數(shù)據(jù)來(lái)訓(xùn)練其模型。[7] 有新聞媒體機(jī)構(gòu),比如2023年12月27日,《紐約時(shí)報(bào)》起訴微軟和OpenAI,聲稱(chēng)它們未經(jīng)許可利用其創(chuàng)作的數(shù)百萬(wàn)篇文章訓(xùn)練 ChatGPT和Copilot。[8] 還有大型唱片公司,比如2024年6月24日,索尼音樂(lè)娛樂(lè)公司、環(huán)球音樂(lè)集團(tuán)和華納唱片公司等公司對(duì)AI生成音樂(lè)的初創(chuàng)公司 Suno[9] 和Udio[10] 提起訴訟,主張它們未經(jīng)許可大規(guī)模使用其受版權(quán)保護(hù)的音頻資料來(lái)訓(xùn)練 AI 模型。當(dāng)前雖然已有不少的訴訟案件,但法院尚未對(duì)該類(lèi)案件做出有效判決。
就司法實(shí)踐情況來(lái)看,有關(guān)機(jī)器學(xué)習(xí)的版權(quán)侵權(quán)訴訟均聚焦于生成式人工智能(以下簡(jiǎn)稱(chēng)“GAI”)領(lǐng)域。造成這一現(xiàn)象的主要原因在于GAI技術(shù)的兩面性,一方面GAI機(jī)器學(xué)習(xí)涉及對(duì)人類(lèi)作品元素的表達(dá)性使用,其生成內(nèi)容具有廣泛的商業(yè)應(yīng)用場(chǎng)景,存在擠占作品市場(chǎng)并實(shí)質(zhì)損害著作權(quán)人利益的現(xiàn)實(shí)風(fēng)險(xiǎn);另一方面,GAI技術(shù)開(kāi)創(chuàng)了“機(jī)器創(chuàng)作”的新模式,大幅提高了“人機(jī)創(chuàng)作”的效率,實(shí)質(zhì)降低了作品創(chuàng)作的門(mén)檻,具有促進(jìn)作品創(chuàng)作、激發(fā)文化創(chuàng)新的潛力。
在理論界,有關(guān)GAI機(jī)器學(xué)習(xí)版權(quán)合法性的討論主要有兩種觀點(diǎn),分別是“合理使用說(shuō)”[11] 和“法定許可說(shuō)”[12]。如何定性GAI機(jī)器學(xué)習(xí),關(guān)乎著版權(quán)保護(hù)與技術(shù)創(chuàng)新的互動(dòng)關(guān)系,也決定了技術(shù)變革背景下作品市場(chǎng)的利益格局。兩種不同的制度方案體現(xiàn)了不同的價(jià)值取向,也涉及不同的制度成本和責(zé)任分擔(dān)方式。究竟孰優(yōu)孰劣,本文將予以探之。
本文將首先在著作權(quán)法的視域下考察GAI機(jī)器學(xué)習(xí)的技術(shù)原理、主要類(lèi)型與法律特征,其次梳理“合理使用說(shuō)”和“法定許可說(shuō)”的論證理由,明晰不同觀點(diǎn)之間的主要爭(zhēng)點(diǎn),再次以“四要素測(cè)試法”為標(biāo)準(zhǔn),判斷GAI機(jī)器學(xué)習(xí)構(gòu)成合理使用的可能,最后區(qū)分著作權(quán)法的內(nèi)部視角和外部視角,構(gòu)建解決GAI機(jī)器學(xué)習(xí)版權(quán)合法性障礙的規(guī)制框架。
二、生成式人工智能機(jī)器學(xué)習(xí)的法律特征
(一)生成式人工智能機(jī)器學(xué)習(xí)的技術(shù)原理
“法以社會(huì)現(xiàn)實(shí)為調(diào)整對(duì)象,所以,社會(huì)現(xiàn)實(shí)是第一性的,法是第二性的”。[13] 依據(jù)法的第二性原理,理解機(jī)器學(xué)習(xí)的技術(shù)原理應(yīng)當(dāng)以著作權(quán)的規(guī)范目標(biāo)為指引,關(guān)注具有規(guī)范意義的技術(shù)特征,舍棄其他無(wú)意義的技術(shù)細(xì)節(jié)。因此,在著作權(quán)法的視域下,圍繞作品的“復(fù)制”行為,機(jī)器學(xué)習(xí)的技術(shù)原理可以被簡(jiǎn)化為三個(gè)環(huán)節(jié),分別是作品獲取與輸入、作品存儲(chǔ)與分析、結(jié)果生成與輸出。不同環(huán)節(jié)均具有一定的著作權(quán)侵權(quán)風(fēng)險(xiǎn),所涉及的著作權(quán)專(zhuān)有權(quán)也有所不同(如圖 1 所示)。

具體來(lái)說(shuō),在作品獲取與輸入階段,利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取作品的過(guò)程可能會(huì)違反爬蟲(chóng)協(xié)議,存在破壞技術(shù)保護(hù)措施或刪除權(quán)利管理信息等違法行為,此外,將海量作品集合輸入到算法模型的過(guò)程中,也會(huì)涉及對(duì)作品的復(fù)制。在作品存儲(chǔ)與分析階段,將作品轉(zhuǎn)碼為能夠?yàn)橛?jì)算機(jī)所理解的數(shù)據(jù)庫(kù)時(shí),需要對(duì)作品進(jìn)行翻譯、整理、改編、匯總等系列行為,可能侵犯復(fù)制權(quán)、改編權(quán)、匯編權(quán)等演繹權(quán)。在結(jié)果生成與輸出階段,計(jì)算機(jī)能夠根據(jù)輸入的指令自動(dòng)學(xué)習(xí)和決策,生成能夠?yàn)槿祟?lèi)理解、在外觀上與人類(lèi)作品具有一致性的內(nèi)容,并被廣泛地用于各類(lèi)商業(yè)場(chǎng)景,當(dāng)其與現(xiàn)有作品構(gòu)成實(shí)質(zhì)性相似時(shí),可能侵犯復(fù)制權(quán)、信息網(wǎng)絡(luò)傳播權(quán)、改編權(quán)等演繹權(quán)。
(二)生成式人工智能機(jī)器學(xué)習(xí)的主要類(lèi)型
以生成結(jié)果與現(xiàn)有作品構(gòu)成實(shí)質(zhì)性相似的可能性為標(biāo)準(zhǔn),可以將 GAI 機(jī)器學(xué)習(xí)分為通用型和特定作者型兩類(lèi)。
1. 通用型生成式人工智能機(jī)器學(xué)習(xí)
通用型GAI機(jī)器學(xué)習(xí)的目的是以海量的作品為訓(xùn)練語(yǔ)料庫(kù),學(xué)習(xí)、模仿人類(lèi)的通用表達(dá),從而能夠根據(jù)指令生成能夠?yàn)槿祟?lèi)所理解的內(nèi)容。該類(lèi)人工智能的應(yīng)用場(chǎng)景極為廣泛,根據(jù)輸出結(jié)果的類(lèi)型差異,主要分為以下幾類(lèi):一是以O(shè)penAI的GPT系列模型、谷歌的BERT模型為代表的文本生成類(lèi);二是以Midjourney、Stable Diffusion為代表的圖像生成類(lèi);三是以AIVA、Suno為代表的音頻生成類(lèi);四是以Gen-2、Sora 為代表的視頻生成類(lèi)。隨著生成式人工智能技術(shù)的發(fā)展,通用型GAI能夠生成的作品類(lèi)型不斷增加,并在商業(yè)場(chǎng)景中展現(xiàn)出極大的潛力。
通用型GAI機(jī)器學(xué)習(xí)有如下特點(diǎn):第一,從訓(xùn)練過(guò)程來(lái)看,通用型GAI技術(shù)的突破依賴(lài)于對(duì)海量作品的數(shù)據(jù)訓(xùn)練行為,可以說(shuō),訓(xùn)練作品的數(shù)量和質(zhì)量決定了通用型GAI輸出結(jié)果的表現(xiàn),也意味著較高的交易成本和分散的產(chǎn)權(quán)。第二,從輸出結(jié)果來(lái)看,通用型GAI機(jī)器學(xué)習(xí)生成的內(nèi)容對(duì)作品的利用具有低密度性,即單個(gè)作品對(duì)最終生成結(jié)果的貢獻(xiàn)是極小的,[14] 現(xiàn)有作品的元素以碎片化的形式呈現(xiàn)在最終所輸出的結(jié)果之中,難以與現(xiàn)有作品構(gòu)成“實(shí)質(zhì)性相似”。[15]
2. 特定作者型生成式人工智能機(jī)器學(xué)習(xí)
特定作者型GAI機(jī)器學(xué)習(xí)以模仿并輸出具有特定作者風(fēng)格的內(nèi)容為目的的機(jī)器學(xué)習(xí)范式。較為典型的例子便是人工智能“下一個(gè)倫勃朗”,專(zhuān)家們利用大數(shù)據(jù)、3D掃描和機(jī)器學(xué)習(xí)等技術(shù)使計(jì)算機(jī)首先對(duì)168263個(gè)倫勃朗過(guò)往作品的片段進(jìn)行了分析,再將倫勃朗的繪畫(huà)習(xí)慣和作品細(xì)節(jié)轉(zhuǎn)換成數(shù)據(jù)供計(jì)算機(jī)學(xué)習(xí),[16] 最終形成的人工智能系統(tǒng)能夠根據(jù)指令“創(chuàng)作”出具有倫勃朗繪畫(huà)風(fēng)格,但又完全不同于倫勃朗過(guò)往任何作品的全新數(shù)字繪畫(huà)作品。
特定作者型GAI機(jī)器學(xué)習(xí)有如下特點(diǎn):第一,從訓(xùn)練過(guò)程看,特定作者型GAI僅僅將特定作者的作品作為訓(xùn)練語(yǔ)料庫(kù),所使用的作品規(guī)模較小,且權(quán)利分布較為集中;第二,從輸出結(jié)果來(lái)看,特定作者型GAI機(jī)器學(xué)習(xí)所輸出的結(jié)果能夠高效且精準(zhǔn)地把握特定作者的風(fēng)格,與現(xiàn)有作品構(gòu)成“實(shí)質(zhì)性相似”的概率更大。
(三)生成式人工智能機(jī)器學(xué)習(xí)的行為特點(diǎn)
總結(jié)上述內(nèi)容,立足于著作權(quán)法的規(guī)范目標(biāo),可以對(duì) GAI 機(jī)器學(xué)習(xí)的法律特征作出如下總結(jié)。從過(guò)程來(lái)看,主要包括兩個(gè)方面:第一,使用作品的規(guī)?;?,規(guī)模數(shù)據(jù)將會(huì)產(chǎn)生“涌現(xiàn)”現(xiàn)象,即當(dāng)數(shù)據(jù)量較為有限時(shí),模型所生成結(jié)果較為隨機(jī),當(dāng)數(shù)據(jù)量超過(guò)一定的閾值后,模型生成結(jié)果的準(zhǔn)確性和處理復(fù)雜問(wèn)題的能力會(huì)大幅提升。[17] 這意味著若遵循傳統(tǒng)“事前授權(quán)”模式,分散海量的著作權(quán)將產(chǎn)生較高的交易成本;第二,算法黑箱的不可知性,著作權(quán)人未能以可視化的方式獲知其作品用于數(shù)據(jù)訓(xùn)練,導(dǎo)致著作權(quán)侵權(quán)判斷中“接觸”要件的失靈,權(quán)利人在訴訟中面臨舉證難點(diǎn),增加了權(quán)利人事后維權(quán)的成本。
從結(jié)果來(lái)看,有以下三個(gè)特征:第一,生成結(jié)果利用訓(xùn)練作品的低密度性。傳統(tǒng)的作品利用行為具有低頻次、高價(jià)值的特點(diǎn),針對(duì)特定的作品,且單個(gè)作品對(duì)生成結(jié)果的貢獻(xiàn)是可被識(shí)別的。與之對(duì)應(yīng),GAI機(jī)器學(xué)習(xí)對(duì)作品的利用并非針對(duì)特定的作品,單個(gè)作品對(duì)生成結(jié)果的貢獻(xiàn)是微量的,對(duì)作品元素的碎片化利用意味著以“實(shí)質(zhì)性相似”標(biāo)準(zhǔn)認(rèn)定侵權(quán)的難度將大幅提升。第二,生成結(jié)果對(duì)訓(xùn)練作品的依附性。無(wú)論是“Getty 案”[18]、“《紐約時(shí)報(bào)》案”[19] 還是最近的“Suno 案”[20],版權(quán)人均在訴狀中明確列舉了 GAI 生成結(jié)果與其享有版權(quán)的作品構(gòu)成實(shí)質(zhì)性相似的情形,由此來(lái)推知 GAI 技術(shù)研發(fā)者未經(jīng)許可將其作品用于數(shù)據(jù)訓(xùn)練。第三,生成結(jié)果商業(yè)應(yīng)用的廣泛性。隨著 GAI 技術(shù)的商業(yè)模式發(fā)展趨于成熟,其生成結(jié)果被應(yīng)用于商業(yè)實(shí)踐的各個(gè)領(lǐng)域,從新聞生成到內(nèi)容策劃,從廣告營(yíng)銷(xiāo)到文娛產(chǎn)業(yè)的藝術(shù)創(chuàng)作、游戲制作,具有商業(yè)目的的 GAI 機(jī)器學(xué)習(xí)具有“實(shí)質(zhì)損害”著作權(quán)人利益的現(xiàn)實(shí)可能性,從而降低了認(rèn)定該行為構(gòu)成合理使用的可能。
三、生成式人工智能機(jī)器學(xué)習(xí)引發(fā)的著作權(quán)爭(zhēng)議
縱觀著作權(quán)法的演進(jìn)史,可以發(fā)現(xiàn),新技術(shù)的浪潮與著作權(quán)制度的改革有著幾乎相同的步調(diào)。技術(shù)創(chuàng)新沖擊作品市場(chǎng)的利益格局,從而引發(fā)權(quán)利配置的難題是著作權(quán)制度發(fā)展的歷史邏輯。以 ChatGPT 為代表的生成式人工智能作為新一輪技術(shù)革命的起點(diǎn),對(duì)作品市場(chǎng)的影響主要表現(xiàn)在兩個(gè)方面:第一,基礎(chǔ)模型的訓(xùn)練離不開(kāi)海量的作品數(shù)據(jù),機(jī)器學(xué)習(xí)對(duì)作品的規(guī)?;褂檬欠駱?gòu)成著作權(quán)法意義上的作品使用行為,需要取得著作權(quán)人的事前許可;第二,生成式人工智能破解了人類(lèi)語(yǔ)言的密碼,能夠根據(jù)指令生成與人類(lèi)作品在外觀上具有同一性的文本、圖片等內(nèi)容,在內(nèi)容創(chuàng)作等領(lǐng)域具有廣泛的商業(yè)應(yīng)用場(chǎng)景。面對(duì)人工智能生成物對(duì)人類(lèi)創(chuàng)作內(nèi)容的替代效應(yīng),著作權(quán)人是否具有獲得救濟(jì)的正當(dāng)性,如果有,何種制度工具更為適宜。為應(yīng)對(duì)GAI機(jī)器學(xué)習(xí)所造成的利益失衡格局,理論界提出了兩種權(quán)利配置的方案:分別是“合理使用說(shuō)”和“法定許可說(shuō)”,以下將詳細(xì)展開(kāi)論述。
(一)“合理使用說(shuō)”
“合理使用說(shuō)”主張采用更為寬松的監(jiān)管政策,為生成式人工智能技術(shù)的創(chuàng)新發(fā)展提供充分的“喘息空間”,基礎(chǔ)模型的開(kāi)發(fā)者在利用作品進(jìn)行數(shù)據(jù)訓(xùn)練時(shí)無(wú)需經(jīng)過(guò)著作權(quán)人的許可,也無(wú)需支付報(bào)酬。持有“合理使用說(shuō)”的學(xué)者,對(duì)關(guān)于GAI機(jī)器學(xué)習(xí)是否構(gòu)成作品性使用存在兩種不同的看法:一方認(rèn)為該行為構(gòu)成作品性使用,但應(yīng)當(dāng)免于著作權(quán)侵權(quán)責(zé)任;另一方認(rèn)為該行為屬于非作品性使用,無(wú)涉“專(zhuān)有使用”領(lǐng)域。兩者的差異在于規(guī)制方案的不同,前者將機(jī)器學(xué)習(xí)納入“復(fù)制權(quán)”范疇,并通過(guò)合理使用制度免于著作權(quán)侵權(quán)責(zé)任,遵循的是著作權(quán)制度“寬進(jìn)寬出”的靜態(tài)構(gòu)架,[21] 后者則將機(jī)器學(xué)習(xí)排除在著作權(quán)的范疇之外,視其為一種自由使用。兩種方案在規(guī)制機(jī)器學(xué)習(xí)行為方面將產(chǎn)生相同的效果,后者所提出“非作品性使用”規(guī)則能夠被廣泛地適用于其他領(lǐng)域,而不局限于機(jī)器學(xué)習(xí)情形。[22] 以下將梳理上述觀點(diǎn)的具體理由。
1. 作品性使用:構(gòu)成侵權(quán)但免責(zé)
大部分學(xué)者認(rèn)為GAI機(jī)器學(xué)習(xí)屬于作品性使用,但能免于著作權(quán)侵權(quán)責(zé)任,主要有以下四點(diǎn)理由:其一,GAI機(jī)器學(xué)習(xí)行為構(gòu)成“轉(zhuǎn)換性使用”。GAI機(jī)器學(xué)習(xí)通過(guò)對(duì)海量作品進(jìn)行訓(xùn)練,學(xué)習(xí)的是眾多作者表達(dá)中的通用模板,其生成的結(jié)果屬于內(nèi)容轉(zhuǎn)換后的新表達(dá),[23] 通常不會(huì)與原作品構(gòu)成實(shí)質(zhì)性相似,因此也不會(huì)具有明顯的市場(chǎng)替代效應(yīng),可以構(gòu)成合理使用。[24] 其二,GAI機(jī)器學(xué)習(xí)將涉及規(guī)模化的作品利用,一一獲得著作權(quán)人的事前許可將產(chǎn)生極高的交易成本。因?yàn)榛谝馑甲灾蔚漠a(chǎn)權(quán)交易流程冗長(zhǎng),會(huì)隨之帶來(lái)超高的談判成本。[25] 談判過(guò)程不僅要假設(shè)交易主體的真實(shí)意思表示,還要就作品數(shù)據(jù)獲取的價(jià)格和授權(quán)使用的范圍進(jìn)行反復(fù)磋商。海量作品、分散產(chǎn)權(quán)以及作品合理定價(jià)的困難都進(jìn)一步加劇了交易成本。即使產(chǎn)權(quán)較為集中的訓(xùn)練數(shù)據(jù),也會(huì)因規(guī)模化的作品使用而許可成本過(guò)高,從而使具有創(chuàng)新潛力的初創(chuàng)企業(yè)或中小型企業(yè)力不從心。[26] 其三,從社會(huì)公共利益的角度來(lái)看,依賴(lài)于海量作品訓(xùn)練的人工智能模型是人工智能時(shí)代的新型數(shù)字基礎(chǔ)設(shè)施,[27] 在技術(shù)效果上具有普惠性。[28] 一方面,對(duì)一般公眾來(lái)說(shuō),GAI輔助創(chuàng)作實(shí)質(zhì)降低了作品創(chuàng)作的門(mén)檻,提高了作品創(chuàng)作的效率,有助于滿(mǎn)足公眾的創(chuàng)作需求,促進(jìn)表現(xiàn)自由的行動(dòng)。此外,允許作品數(shù)據(jù)訓(xùn)練行為構(gòu)成合理使用可以避免因數(shù)據(jù)數(shù)量與質(zhì)量的不足導(dǎo)致的算法歧視與偏見(jiàn),促進(jìn)民主社會(huì)的建構(gòu)。[29] 另一方面,對(duì)著作權(quán)人來(lái)說(shuō),隨著人工智能技術(shù)的普及,“人工智能 +”成為越來(lái)越多產(chǎn)業(yè)的選擇,這 一趨勢(shì)也會(huì)影響著作品市場(chǎng)中著作權(quán)的激勵(lì)結(jié)構(gòu),[30] 為著作權(quán)人帶來(lái)其他市場(chǎng)收益,[31] 創(chuàng)造多元、新型的激勵(lì)路徑。其四,基于產(chǎn)業(yè)政策的視角,機(jī)器學(xué)習(xí)的合理使用有利于維持人工智能產(chǎn)業(yè)公平競(jìng)爭(zhēng)的市場(chǎng)秩序,促進(jìn)該產(chǎn)業(yè)的良性發(fā)展。在國(guó)內(nèi)層面,“以服務(wù)換數(shù)據(jù)”是當(dāng)前較為普遍的一種商業(yè)模式,大型互聯(lián)網(wǎng)企業(yè)與用戶(hù)簽訂協(xié)議,約定以免費(fèi)的服務(wù)來(lái)?yè)Q取用戶(hù)生成的海量數(shù)據(jù),以此優(yōu)化其開(kāi)發(fā)的人工智能產(chǎn)品。由于數(shù)據(jù)集是推動(dòng)人工智能技術(shù)發(fā)展的關(guān)鍵引擎,大型互聯(lián)網(wǎng)企業(yè)因擔(dān)心喪失競(jìng)爭(zhēng)優(yōu)勢(shì)而缺乏共享數(shù)據(jù)的意愿,中小型企業(yè)又因?yàn)槿鄙傧鄳?yīng)的用戶(hù),未能獲取足量的數(shù)據(jù)用于訓(xùn)練,從而導(dǎo)致高科技領(lǐng)域的不公平競(jìng)爭(zhēng)。[32]在國(guó)際層面,有關(guān)機(jī)器學(xué)習(xí)的不同規(guī)定塑造了不同的競(jìng)爭(zhēng)環(huán)境,若世界上主要國(guó)家和地區(qū)為機(jī)器學(xué)習(xí)提供侵權(quán)豁免時(shí),過(guò)于嚴(yán)苛的監(jiān)管政策,會(huì)導(dǎo)致生成式人工智能的技術(shù)開(kāi)發(fā)者向監(jiān)管政策更為寬松的司法管轄區(qū)轉(zhuǎn)移,[33]將阻滯我國(guó)在人工智能領(lǐng)域的技術(shù)發(fā)展,使得我國(guó)在該輪技術(shù)革命中處于被動(dòng)境地。[34]
2. 非作品性使用:不構(gòu)成侵權(quán)屬于自由使用
有部分學(xué)者認(rèn)為,GAI 機(jī)器學(xué)習(xí)僅涉及對(duì)作品的“非作品性使用”,不構(gòu)成著作權(quán)侵權(quán),有以下三點(diǎn)理由:首先,GAI 機(jī)器學(xué)習(xí)對(duì)作品的使用具有明顯的“非特定性”,單個(gè)作品在被用于數(shù)據(jù)訓(xùn)練時(shí)難以體現(xiàn)其獨(dú)立的價(jià)值,[35] 因此該類(lèi)對(duì)作品的使用未能兼容著作權(quán)法基于單個(gè)作品所設(shè)立的激勵(lì)機(jī)制,不構(gòu)成需要兼具特定性和表達(dá)性的作品性使用。[36] 其次,機(jī)器學(xué)習(xí)對(duì)作品的使用本質(zhì)上是將作品作為事實(shí)信息,從而提取文本、圖像等表達(dá)中的“一般規(guī)律”,[37] 并非著作權(quán)法意義上的“交流性使用”(communicative act),而是技術(shù)性的使用(technical use)。[38] 最后,機(jī)器學(xué)習(xí)過(guò)程中對(duì)作品的使用具有非公開(kāi)性,是一種“中間復(fù)制”,訓(xùn)練后作品的表達(dá)不會(huì)存儲(chǔ)于大模型之中,也不會(huì)復(fù)制或抄襲給第三方使用。[39]
(二)“法定許可說(shuō)”
相較于“合理使用說(shuō)”,主張使用法定許可制度規(guī)制機(jī)器學(xué)習(xí)的學(xué)者占比較少,主要理由如下。
第一,認(rèn)定 GAI 機(jī)器學(xué)習(xí)構(gòu)成合理使用將會(huì)使得版權(quán)市場(chǎng)的利益關(guān)系嚴(yán)重失衡,合理使用制度淪為服務(wù)特定利益集團(tuán)商業(yè)目標(biāo)的工具,進(jìn)一步加固了技術(shù)壟斷者的市場(chǎng)地位,而犧牲了分散化的作者利益。[40] 具體來(lái)說(shuō),人工智能技術(shù)的開(kāi)發(fā)者能夠獲得大量免費(fèi)、優(yōu)質(zhì)的版權(quán)內(nèi)容,不斷優(yōu)化其算法,提高內(nèi)容生成的質(zhì)量,進(jìn)而從技術(shù)市場(chǎng)中獲取更豐厚的利益。與之對(duì)應(yīng),作者雖然提供了豐富的版權(quán)內(nèi)容,但卻未能從中獲取任何利益,甚至可能因?yàn)樯蓛?nèi)容在作品市場(chǎng)具有代替效應(yīng)而影響其原本所具有的收益。這不僅會(huì)對(duì)作者的原作品市場(chǎng)造成損害,長(zhǎng)此以往還會(huì)進(jìn)一步損害公共利益。[41]
第二,法定許可制度作為一項(xiàng)“折中”的制度,在簡(jiǎn)化作品獲取和使用程序的同時(shí),保證了作品權(quán)利人的經(jīng)濟(jì)利益,兼顧了版權(quán)保護(hù)與技術(shù)發(fā)展的雙重目標(biāo)。[42] 一方面,生成式人工智能能夠以極低的成本生成海量的符合市場(chǎng)需求的作品,必然會(huì)擠壓人類(lèi)作者的作品市場(chǎng),使得相對(duì)低效的人類(lèi)作者因作品的不稀缺而獲得更少的收入,損害著作權(quán)的激勵(lì)機(jī)制。[43] 對(duì)藝術(shù)家來(lái)說(shuō)即使人工智能生成物僅與其作品構(gòu)成風(fēng)格上的相似性,也會(huì)影響其藝術(shù)和個(gè)人生活。[44] 另一方面,技術(shù)創(chuàng)新對(duì)市場(chǎng)經(jīng)濟(jì)的積極影響是顯而易見(jiàn)的,其不僅能夠發(fā)展出新的技術(shù)市場(chǎng),有力地促進(jìn)經(jīng)濟(jì)增長(zhǎng),或開(kāi)拓出先前沒(méi)有任何版權(quán)實(shí)踐的新興市場(chǎng),為公共福祉帶來(lái)增益。[45]
第三,過(guò)于將政策向人工智能技術(shù)開(kāi)發(fā)者傾斜,可能會(huì)引發(fā)對(duì)生成式人工智能的過(guò)度使用,“劣幣驅(qū)逐良幣”的效應(yīng)會(huì)使作品市場(chǎng)充滿(mǎn)同質(zhì)、平庸的作品,[46] 從而損害文化的多樣性。隨著人類(lèi)創(chuàng)作作品的進(jìn)一步稀缺,可能會(huì)導(dǎo)致人工智能只能使用其生成的內(nèi)容進(jìn)行數(shù)據(jù)訓(xùn)練,將會(huì)造成大型語(yǔ)言模型的崩潰效應(yīng)(model collapse),從而阻礙人工智能生成技術(shù)的創(chuàng)新發(fā)展。[47]
第四,GAI機(jī)器學(xué)習(xí)未能契合合理使用的價(jià)值追求,更符合法定許可制度的規(guī)范目標(biāo)。合理使用制度與法定許可制度所追求的價(jià)值目標(biāo)不同,前者意在追求“公平”價(jià)值,促進(jìn)文化繁榮等公共利益,后者則追求“效率”價(jià)值,以實(shí)現(xiàn)作品的商業(yè)化利用,數(shù)據(jù)訓(xùn)練問(wèn)題的癥結(jié)在于交易成本過(guò)高,而非是某一方的不公平。[48] 況且,GAI生成內(nèi)容本質(zhì)上是微機(jī)方程計(jì)算的結(jié)果,與人類(lèi)創(chuàng)作基于思想和靈感的迸發(fā)有本質(zhì)的不同 [49],可以說(shuō),其生成的內(nèi)容仍然受到訓(xùn)練語(yǔ)料庫(kù)和算法模型的限制,是對(duì)現(xiàn)有素材的重新組合,難以提高自然人的知識(shí)水平,促進(jìn)文化繁榮。[50]
第五,算法黑箱的不可知性使得人工智能生成結(jié)果的因果關(guān)系難以被厘清,從而使著作權(quán)人難以在事后進(jìn)行有效救濟(jì),法定許可制度則是一種事前規(guī)制,要求技術(shù)研發(fā)者在收集作品時(shí)向著作權(quán)人支付報(bào)酬,能夠促進(jìn)技術(shù)研發(fā)者在技術(shù)開(kāi)發(fā)的早期階段就將著作權(quán)人的利益予以考慮,并督促其采取相應(yīng)的技術(shù)手段,評(píng)估并減少GAI機(jī)器學(xué)習(xí)所產(chǎn)生的負(fù)外部性。[51]
由上可知,“合理使用說(shuō)”和“法定許可說(shuō)” 均有其充分的理由。由于較多的學(xué)者贊同“合理使用說(shuō)”,本文在下文中將首先以“四要素測(cè)試法”為標(biāo)準(zhǔn),檢視GAI機(jī)器學(xué)習(xí)構(gòu)成合理使用的可能,再評(píng)估法定許可制度的正當(dāng)性和可行性,在優(yōu)劣比較中選擇最為適宜的規(guī)制方案。
四、生成式人工智能機(jī)器學(xué)習(xí)的合法性分析
與著作權(quán)侵權(quán)認(rèn)定不同,對(duì)合理使用的考察應(yīng)關(guān)注系列行為所產(chǎn)生的整體效果,[52]因此在判斷 GAI 機(jī)器學(xué)習(xí)是否構(gòu)成合理使用時(shí),應(yīng)當(dāng)將數(shù)據(jù)訓(xùn)練過(guò)程和人工智能結(jié)果輸出階段結(jié)合起來(lái),不能僅關(guān)注行為過(guò)程,而忽視行為所產(chǎn)生的后果。由于語(yǔ)料庫(kù)和算法模型的差異,不同的GAI所輸出的結(jié)果會(huì)有所不同,生成結(jié)果對(duì)作品市場(chǎng)的影響也就存在差異,應(yīng)當(dāng)在個(gè)案中結(jié)合特定事實(shí)進(jìn)行因素分析,逐一認(rèn)定GAI機(jī)器學(xué)習(xí)是否構(gòu)成合理使用。
(一)使用作品的目的和性質(zhì)
“四要素測(cè)試法”中的第一個(gè)因素是“使用作品的目的和性質(zhì),包括使用行為是否具有商業(yè)性質(zhì)或非營(yíng)利性的教育用途”。[53] 在美國(guó)的司法實(shí)踐中,該因素判定尤為重要,對(duì)案件的裁判結(jié)果有著決定性的影響。[54] 具體來(lái)說(shuō),對(duì)該因素的考察可以分為以下三個(gè)層次:第一,是否構(gòu)成“轉(zhuǎn)換性使用”。轉(zhuǎn)換性使用是指在原作品的基礎(chǔ)上增加了新理念、新風(fēng)格、新表達(dá)等,從而使得原作在使用過(guò)程中產(chǎn)生新價(jià)值、新特點(diǎn)或新功能。轉(zhuǎn)換性使用為著作權(quán)領(lǐng)域保留了一定的“喘息空間(breathing work)”,[55] 意在考察特定作品使用行為是否具有新的或價(jià)值增值的目的,以此來(lái)增進(jìn)社會(huì)公共利益,可以說(shuō),對(duì)公共利益的考察是判斷轉(zhuǎn)換性程度的顯性指標(biāo)。在技術(shù)性合理使用案件中,作品使用行為所涉及的技術(shù)環(huán)節(jié)與轉(zhuǎn)換性使用的程度具有緊密的內(nèi)在聯(lián)系。具體來(lái)說(shuō),一項(xiàng)技術(shù)發(fā)展的全流程包括技術(shù)開(kāi)發(fā)、技術(shù)運(yùn)行和結(jié)果輸出三個(gè)環(huán)節(jié),在不同的技術(shù)環(huán)節(jié)作品使用的方式存在差異,轉(zhuǎn)換性程度逐級(jí)遞減。[56]
首先,一般來(lái)說(shuō),技術(shù)開(kāi)發(fā)階段對(duì)作品的使用均會(huì)涉及對(duì)作品的全面復(fù)制,具有非公開(kāi)性和非感知性的特點(diǎn),是服務(wù)于特定技術(shù)開(kāi)發(fā)的“功能性使用”,轉(zhuǎn)換性程度最高,也最有可能構(gòu)成合理使用。其次,技術(shù)運(yùn)行階段的作品使用行為在某些情形下具有公開(kāi)性,比如臨時(shí)復(fù)制行為,需要進(jìn)一步考察該作品使用行為對(duì)傳統(tǒng)作品市場(chǎng)和社會(huì)公共福祉的影響,構(gòu)成合理使用的可能位于光譜的中端。最后,結(jié)果輸出環(huán)節(jié)的作品使用行為通常會(huì)涉及對(duì)版權(quán)作品的發(fā)行、展示或表演,容易在原作品市場(chǎng)產(chǎn)生替代效應(yīng),對(duì)著作權(quán)人造成實(shí)質(zhì)損害,轉(zhuǎn)換性程度最低,構(gòu)成合理使用的可能性最小。
GAI機(jī)器學(xué)習(xí)對(duì)作品的使用行為貫穿于技術(shù)發(fā)展的全流程。具體來(lái)說(shuō),無(wú)論是作品輸入的技術(shù)開(kāi)發(fā)階段,還是模型訓(xùn)練的技術(shù)運(yùn)行階段,對(duì)作品的使用均是基于海量作品分析的規(guī)律提取,屬于目的轉(zhuǎn)換的功能性使用。但當(dāng)涉及結(jié)果輸出環(huán)節(jié)時(shí),由于訓(xùn)練數(shù)據(jù)和算法模型的局限性,GAI根據(jù)用戶(hù)指令所輸出的內(nèi)容可能會(huì)與原作品構(gòu)成實(shí)質(zhì)性相似,難以構(gòu)成轉(zhuǎn)換性使用。比如在“奧特曼案”中,涉案GAI生成了與奧特曼形象高度一致的內(nèi)容,被法院認(rèn)定為著作權(quán)侵權(quán)。[57] 正如上文所述,合理使用的判斷關(guān)注的是系列行為的整體效果,因此,結(jié)果輸出環(huán)節(jié)所產(chǎn)生的效果對(duì)其他兩個(gè)環(huán)節(jié)的行為性質(zhì)有著決定性的影響,當(dāng)結(jié)果輸出環(huán)節(jié)的作品使用行為構(gòu)成著作權(quán)侵權(quán)時(shí),技術(shù)開(kāi)發(fā)階段和技術(shù)運(yùn)行階段的作品使用行為也不能滿(mǎn)足合法性的要求,不構(gòu)成合理使用。對(duì)此,需要根據(jù)個(gè)案的具體情形,考察GAI機(jī)器學(xué)習(xí)構(gòu)成合理使用的可能。需要指出的,在 2023 年的“安妮霍爾案”中,美國(guó)最高法院對(duì)“轉(zhuǎn)換性使用”規(guī)則作出闡釋?zhuān)摪概卸ㄕJ(rèn)為,如果二次創(chuàng)作與原作具有相同或相似的目的,且具有商業(yè)目的,在缺乏其他正當(dāng)理由的情況下,傾向于認(rèn)定第一要素不構(gòu)成合理使用。[58]該案標(biāo)志著“轉(zhuǎn)換性使用”的地位有所下降,將會(huì)對(duì)GAI機(jī)器學(xué)習(xí)的合理使用認(rèn)定產(chǎn)生實(shí)質(zhì)的影響,因?yàn)?GAI 機(jī)器學(xué)習(xí)所輸出的結(jié)果是對(duì)原作品的表達(dá)性使用,在多數(shù)情況下與原作品的使用目的具有一定的相似性,可以預(yù)見(jiàn),GAI 技術(shù)研發(fā)者在未來(lái)侵權(quán)訴訟中要證明其使用目的具有轉(zhuǎn)換性的難度將會(huì)進(jìn)一步上升。
第二,是否出于商業(yè)目的或非營(yíng)利的教育目的。在技術(shù)性合理使用案件中,作品使用行為是否是商業(yè)性使用并非決定性的考量要素,除非與作品使用行為有關(guān)的新技術(shù)以極高或免費(fèi)的價(jià)格提供給公眾。[59] 事實(shí)上,大多數(shù)以研發(fā)新技術(shù)為目的而使用作品的行為均具有一定的商業(yè)性,在GAI機(jī)器學(xué)習(xí)領(lǐng)域,從事基礎(chǔ)模型開(kāi)發(fā)的主體也均是具有營(yíng)利性的互聯(lián)網(wǎng)企業(yè)或科技公司。依據(jù)該要素,非營(yíng)利性的GAI機(jī)器學(xué)習(xí)行為因其內(nèi)在的公益價(jià)值,與合理使用制度所追求的社會(huì)公益價(jià)值具有一致性,應(yīng)當(dāng)構(gòu)成合理使用。商業(yè)性的GAI機(jī)器學(xué)習(xí)則應(yīng)當(dāng)結(jié)合轉(zhuǎn)換性使用程度、對(duì)原作品市場(chǎng)所產(chǎn)生的影響等其他因素進(jìn)行綜合判斷。使用作品的轉(zhuǎn)換性程度越強(qiáng),其他因素在合理使用認(rèn)定中被予以衡量的比重就越低,即使是商業(yè)性的使用也可能構(gòu)成合理使用。[60] 比如將海量論文用于訓(xùn)練人工智能,最終是為了利用該人工智能判斷其他論文是否存在抄襲,該情形下對(duì)作品的使用便具有較強(qiáng)的轉(zhuǎn)換性,即使利用該人工智能的服務(wù)是收費(fèi)的,也構(gòu)成合理使用。
第三,是否是善意使用。善意使用是指遵循作品使用的慣例而使著作權(quán)人不受損害。在GAI機(jī)器學(xué)習(xí)的情形下,技術(shù)研發(fā)者是否規(guī)避或破壞著作權(quán)人所采取的技術(shù)措施,非法獲取訓(xùn)練數(shù)據(jù)是判定善意使用的具體內(nèi)涵。正如《生成式人工智能服務(wù)管理暫行辦法》第7條第1項(xiàng)所強(qiáng)調(diào)的,開(kāi)展數(shù)據(jù)訓(xùn)練處理活動(dòng)應(yīng)使用具有合法來(lái)源的數(shù)據(jù)和基礎(chǔ)模型。可以說(shuō),數(shù)據(jù)來(lái)源合法性是考察機(jī)器學(xué)習(xí)版權(quán)合法性的前提。當(dāng)前利用“爬蟲(chóng)”技術(shù)獲取互聯(lián)網(wǎng)上的數(shù)據(jù)是獲取訓(xùn)練數(shù)據(jù)最為主要的方式。數(shù)據(jù)抓取的過(guò)程會(huì)受到爬蟲(chóng)協(xié)議的限制,爬蟲(chóng)協(xié)議的實(shí)質(zhì)是一種利用技術(shù)措施所形成的代碼規(guī)制,各網(wǎng)站根據(jù)自身的需求采取技術(shù)措施以規(guī)范廣泛的數(shù)據(jù)獲取行為。[61] 爬蟲(chóng)協(xié)議雖然不具有法律規(guī)范的強(qiáng)制效力,但在互聯(lián)網(wǎng)行業(yè)中卻形成了一種普遍遵循。在著作權(quán)領(lǐng)域,爬蟲(chóng)協(xié)議雖然并不在技術(shù)上設(shè)置數(shù)據(jù)訪問(wèn)的防護(hù)措施,只是羅列出允許訪問(wèn)和禁止訪問(wèn)的數(shù)據(jù)清單,但在司法實(shí)踐中可能被認(rèn)定為控制作品訪問(wèn)的“有效”技術(shù)措施。[62] 因此,當(dāng)開(kāi)展GAI機(jī)器學(xué)習(xí)時(shí),技術(shù)開(kāi)發(fā)者在獲取數(shù)據(jù)時(shí)違反爬蟲(chóng)協(xié)議,或規(guī)避、破壞技術(shù)保護(hù)措施或刪除權(quán)利管理信息,未能滿(mǎn)足數(shù)據(jù)獲取合法性的要求,不是善意的作品使用行為,未能構(gòu)成合理使用。比如,在“《紐約時(shí)報(bào)》案”中,用戶(hù)因《紐約時(shí)報(bào)》所采取的技術(shù)保護(hù)措施“付費(fèi)墻”而無(wú)法閱讀付費(fèi)文章《雪崩:隧道溪的雪崩》(Snow Fall: The Avalanche at Tunnel Creek),于是向ChatGPT發(fā)出指令以獲取被“付費(fèi)墻”遮擋的部分內(nèi)容,ChatGPT最終以逐字復(fù)制了原作品的方式向用戶(hù)提供了被“付費(fèi)墻”遮擋的內(nèi)容。[63] 可見(jiàn),在該案中,ChatGPT的技術(shù)開(kāi)發(fā)者規(guī)避或破壞了《紐約時(shí)報(bào)》所采取的技術(shù)保護(hù)措施,非法獲取了相應(yīng)的訓(xùn)練數(shù)據(jù),具有著作權(quán)侵權(quán)風(fēng)險(xiǎn)。
(二)被使用作品的性質(zhì)
對(duì)被使用作品的性質(zhì)考察主要分為兩個(gè)方面。一方面,被使用作品是虛構(gòu)作品還是事實(shí)作品,虛構(gòu)作品相較于事實(shí)作品會(huì)獲得更充分的著作權(quán)保護(hù),因此,使用該類(lèi)作品構(gòu)成合理使用的可能性更小。GAI機(jī)器學(xué)習(xí)所輸出的結(jié)果取決于基礎(chǔ)模型和訓(xùn)練語(yǔ)料庫(kù),其生成的內(nèi)容可能會(huì)與原作品構(gòu)成實(shí)質(zhì)性相似。比如在“唱片公司訴Suno案”中,當(dāng)向Suno發(fā)出“1950s rock and roll, jerry lee lewis, sun studio”(譯作“20 世紀(jì) 50 年代搖滾樂(lè),杰瑞·李·劉易斯,太陽(yáng)工作室”)的提示詞時(shí),Suno不僅沒(méi)有彈出錯(cuò)誤信息,還生成了一首名為“You shake my nerves and you rattle my brain”的歌曲,這首由 AI Suno 生成的歌曲與 1961 年劉易斯的“Great Balls of Fire”有著相同的歌詞和節(jié)奏。[64] 可見(jiàn),受制于技術(shù)的有限性,當(dāng)前生成式人工智能所輸出的結(jié)果仍然是對(duì)現(xiàn)有作品表達(dá)要素的重新組合,當(dāng)人工智能生成物實(shí)質(zhì)性復(fù)制的作品是獨(dú)創(chuàng)性較高的虛構(gòu)作品或藝術(shù)作品時(shí),則構(gòu)成著作權(quán)侵權(quán)的風(fēng)險(xiǎn)較大,不屬于合理使用。
另一方面,被使用作品是否被發(fā)表。使用已發(fā)表的作品用于數(shù)據(jù)訓(xùn)練更容易構(gòu)成合理使用,反之,則可能侵犯著作權(quán)人的隱私權(quán)和發(fā)表權(quán)。在 GAI 機(jī)器學(xué)習(xí)的場(chǎng)合下,對(duì)該問(wèn)題的考察可以被轉(zhuǎn)化為對(duì)數(shù)據(jù)來(lái)源合法性的評(píng)估,與善意使用的認(rèn)定具有同質(zhì)性。當(dāng)著作權(quán)人采取技術(shù)保護(hù)措施防止公眾獲取其作品時(shí),技術(shù)開(kāi)發(fā)者規(guī)避、破壞技術(shù)保護(hù)措施所獲取的作品便是未發(fā)表的作品,利用該作品進(jìn)行數(shù)據(jù)訓(xùn)練,難以構(gòu)成合理使用。
(三)被使用部分的數(shù)量和質(zhì)量
對(duì)于該要素的評(píng)估需要結(jié)合使用目的進(jìn)行綜合判定,即考察引用作品的比例與其所要實(shí)現(xiàn)的正當(dāng)目的或功能是否相適應(yīng)。[65] 以機(jī)器學(xué)習(xí)為例,在作品輸入和模型優(yōu)化階段,使用作品的目的在于提取海量作品中語(yǔ)言表達(dá)的一般規(guī)律,是一種將作品數(shù)據(jù)的事實(shí)信息進(jìn)行統(tǒng)計(jì)分析的功能性使用,基于這一目的,即使逐字復(fù)制作品仍然能夠被認(rèn)定合理使用。
當(dāng)涉及結(jié)果輸出環(huán)節(jié)時(shí),GAI使用作品的目的是生成符合用戶(hù)需求的內(nèi)容。首先 GAI將根據(jù)用戶(hù)的指令在訓(xùn)練作品語(yǔ)料庫(kù)中搜尋關(guān)聯(lián)作品,其次將用戶(hù)指令和檢索到的關(guān)聯(lián)作品予以結(jié)合,提供上下文,最后由掌握語(yǔ)言規(guī)律的基礎(chǔ)模型根據(jù)用戶(hù)提問(wèn)和關(guān)聯(lián)作品,生成能夠?yàn)槿祟?lèi)所理解的、有意義的內(nèi)容。[66] 這一過(guò)程會(huì)涉及對(duì)作品表達(dá)性要素的排列組合,屬于轉(zhuǎn)換性程度較低的表達(dá)性使用,引用作品的數(shù)量和質(zhì)量需要適當(dāng),否則過(guò)量引用原作品或者引用原作品的核心內(nèi)容都可能影響合理使用的構(gòu)成。比如在“《紐約時(shí)報(bào)》案”中,當(dāng)向ChatGPT輸入“What did Pete Wells think of Guy Fieri’s restaurant ?”(譯作:皮特·威爾斯如何評(píng)價(jià)餐廳 Guy Fieri ?)的提問(wèn)時(shí),ChatGPT直接引用了前《紐約時(shí)報(bào)》餐廳評(píng)論家皮特·威爾斯 2012 年對(duì)Guy Fier餐廳的評(píng)論,從訴訟狀所顯示的證據(jù)來(lái)看,ChatGPT幾乎逐字引用了原文的內(nèi)容。[67] 再比如在“唱 片公司訴Udio案”中,在人工智能Udio中輸入“a 1983 song by an American singer and dancer, electronic, r&b, pop-rock, post-disco, funk”(譯作“一首來(lái)自美國(guó)歌手和舞者的 1983 年的歌,電子,藍(lán)調(diào)節(jié)奏,流行搖滾,后迪斯科,放克音樂(lè)”)的提示詞,并摘錄邁克爾·杰克遜在 1983 年發(fā)表的“Billie Jean” 里的歌詞時(shí),Udio生成了一首名為“Midnight Denial”的歌曲,該歌曲與邁克爾·杰克遜的“Billie Jean”有著相似的節(jié)奏和音高輪廓。[68]
(四)使用對(duì)原作品潛在市場(chǎng)或價(jià)值的影響
該要素關(guān)注作品使用的效果,是四要素考察中較為重要的考量因素之一??疾煸撘氐碾y點(diǎn)在于如何界定“原作品的潛在市場(chǎng)”,在司法實(shí)踐中,著作權(quán)人總是傾向于主張,所有未經(jīng)許可且導(dǎo)致經(jīng)濟(jì)損失的作品使用行為會(huì)對(duì)其潛在市場(chǎng)造成損害,即使該市場(chǎng)是尚未形成且不可預(yù)見(jiàn)的。[69] 為了解決這一困境,第二巡回法院在司法審判中明確指出,版權(quán)人只有在“傳統(tǒng)的、合理的或很有可能發(fā)展”(“traditional, reasonable, or likely to be developed”)市場(chǎng)中享有許可他人使用作品的權(quán)利。[70]
在技術(shù)性合理使用案件中,對(duì)該要素的考察主要分為以下三個(gè)方面:第一,考察作品使用行為是否會(huì)在原作品市場(chǎng)產(chǎn)生替代效應(yīng)。當(dāng)以逐字復(fù)制的方式商業(yè)性地使用原作品時(shí),該作品使用行為必然會(huì)在原作品市場(chǎng)產(chǎn)生替代效應(yīng),實(shí)質(zhì)損害原作品的市場(chǎng)利益。[71] 技術(shù)開(kāi)發(fā)和技術(shù)運(yùn)行階段的作品使用行為屬于功能性使用,并不構(gòu)成著作權(quán)法意義上的“潛在市場(chǎng)”。在結(jié)果輸出環(huán)節(jié),作品使用行為產(chǎn)生替代效應(yīng)的風(fēng)險(xiǎn)較大,需要結(jié)合輸出的形式和生成內(nèi)容的使用場(chǎng)景進(jìn)行綜合判斷。比如以縮略圖形式輸出產(chǎn)生替代效應(yīng)的可能性較小,仍然可能構(gòu)成合理使用,[72] 在GAI機(jī)器學(xué)習(xí)的場(chǎng)合,輸出與原作品構(gòu)成實(shí)質(zhì)性相似的“奧特曼”圖案,則可能會(huì)對(duì)原作品產(chǎn)生實(shí)質(zhì)替代效應(yīng),構(gòu)成著作權(quán)侵權(quán)。[73]
其次,衡量一項(xiàng)新技術(shù)對(duì)潛在作品市場(chǎng)所帶來(lái)的積極和消極影響。由于GAI深刻地改變了作品創(chuàng)作的模式,對(duì)作品市場(chǎng)的影響是顛覆性的。在積極影響方面,生成式人工智能輔助創(chuàng)作將極大降低作品創(chuàng)作的門(mén)檻,不僅藝術(shù)家能夠利用該工具提高工作效率,而且不具有繪畫(huà)、編曲等藝術(shù)創(chuàng)作能力的公眾也能利用該項(xiàng)技術(shù)將靈感、構(gòu)思轉(zhuǎn)化為現(xiàn)實(shí),有利于激發(fā)文化創(chuàng)新的潛力。比如沒(méi)有任何繪畫(huà)基礎(chǔ)的Rootport便利用生成式人工智能Midjourney,在六周的時(shí)間內(nèi)完成了一部100 多頁(yè)的漫畫(huà)《賽博朋克:桃太郎》(Cyberpunk: Peach John),并在出版社出版發(fā)行。[74] 在消極影響方面,廉價(jià)的人工智能生成物可能會(huì)進(jìn)一步擠占人類(lèi)作品的市場(chǎng),在作品市場(chǎng)中產(chǎn)生“寒蟬效應(yīng)”,使得公眾不再愿意為人類(lèi)創(chuàng)作的作品支付更高昂的費(fèi)用,[75] 損害著作權(quán)的激勵(lì)機(jī)制??梢?jiàn),GAI技術(shù)對(duì)作品市場(chǎng)而言是機(jī)遇也是挑戰(zhàn)。規(guī)制GAI機(jī)器學(xué)習(xí)就是要把握利益平衡的理念,不僅要適度限制著作權(quán),為技術(shù)的創(chuàng)新發(fā)展提供“喘息的空間”,而且要防止以過(guò)度犧牲作者利益為代價(jià)來(lái)促進(jìn)技術(shù)產(chǎn)業(yè)的發(fā)展。在個(gè)案中判定GAI機(jī)器學(xué)習(xí)的合理使用性質(zhì)時(shí),要結(jié)合特定的事實(shí)評(píng)估GAI技術(shù)的雙面性,以作出符合利益平衡理念的裁決。
最后,判斷若反對(duì)作品利用行為構(gòu)成合理使用,是否會(huì)對(duì)社會(huì)公共利益產(chǎn)生消極的影響。一方面,GAI技術(shù)的進(jìn)步對(duì)社會(huì)公共利益的促進(jìn)效益顯而易見(jiàn):一是促進(jìn)公眾的表達(dá)自由,互聯(lián)網(wǎng)技術(shù)開(kāi)啟了全民創(chuàng)作的時(shí)代,作品創(chuàng)作已然成為人們進(jìn)行交流溝通的方式,[76] 在生成式人工智能的輔助下,公眾將能夠以更低的成本創(chuàng)作形式多樣的內(nèi)容,豐富表達(dá)自由的形式。二是提升社會(huì)生產(chǎn)力,由于企業(yè)日常工作與語(yǔ)言密不可分,[77] 掌握人類(lèi)語(yǔ)言?shī)W秘的生成式人工智能將極大地提升企業(yè)的工作效率。語(yǔ)言任務(wù)在企業(yè)工作人員總工作時(shí)長(zhǎng)中占比62%,其中65%的時(shí)間可以借助人員強(qiáng)化和自動(dòng)化技術(shù)來(lái)提升生產(chǎn)力,所有行業(yè)中40%的工作時(shí)間都將得到GPT-4等大語(yǔ)言模型的協(xié)助。[78] 但另一方面,GAI 技術(shù)的過(guò)度開(kāi)發(fā)也可能會(huì)實(shí)質(zhì)損害著作權(quán)人的群體利益,阻礙創(chuàng)意產(chǎn)業(yè)的可持續(xù)發(fā)展,導(dǎo)致作品市場(chǎng)充斥著大量平庸、同質(zhì)化的作品,從而損害文化多樣性。該項(xiàng)技術(shù)對(duì)社會(huì)公共利益的雙重影響是GAI機(jī)器學(xué)習(xí)的合理使用定性中需要重點(diǎn)考慮的。
經(jīng)“四要素測(cè)試法”分析可得,GAI機(jī)器學(xué)習(xí)在如下情形中具有較大的侵權(quán)風(fēng)險(xiǎn),未能構(gòu)成合理使用:一是規(guī)避、破壞技術(shù)保護(hù)措施獲取訓(xùn)練作品,不符合善意使用目的,或可能構(gòu)成對(duì)未發(fā)表作品的使用;二是輸出結(jié)果與原作品構(gòu)成實(shí)質(zhì)性相似,在未能構(gòu)成轉(zhuǎn)換性使用的情形下,使用作品的數(shù)量和質(zhì)量都超過(guò)了適度的范圍,會(huì)在原作品市場(chǎng)產(chǎn)生替代效應(yīng);三是海量輸出結(jié)果涉及對(duì)原作品的表達(dá)性使用,對(duì)著作權(quán)人的潛在作品市場(chǎng)造成了具有現(xiàn)實(shí)可能性的實(shí)質(zhì)損害。
綜上所述,并非所有GAI機(jī)器學(xué)習(xí)都能構(gòu)成合理使用,仍然需要在具體個(gè)案中結(jié)合特定事實(shí)進(jìn)行綜合判斷,只有同時(shí)滿(mǎn)足上述四個(gè)要件的GAI機(jī)器學(xué)習(xí)才能被認(rèn)定為合理使用??梢?jiàn),合理使用并非規(guī)制GAI機(jī)器學(xué)習(xí)的最優(yōu)工具,因?yàn)榧夹g(shù)研發(fā)者會(huì)因個(gè)案判定的不確定性而面臨較大著作權(quán)侵權(quán)風(fēng)險(xiǎn),不明晰的免責(zé)信號(hào)并不利于推進(jìn)生成式人工智能產(chǎn)業(yè)的發(fā)展。那么何為規(guī)制 GAI 機(jī)器學(xué)習(xí)的最優(yōu)路徑呢?下文將展開(kāi)詳細(xì)論述。
五、規(guī)制生成式人工智能機(jī)器學(xué)習(xí)的思路
GAI 機(jī)器學(xué)習(xí)版權(quán)合法性問(wèn)題的實(shí)質(zhì)是版權(quán)保護(hù)與技術(shù)創(chuàng)新的沖突,過(guò)度保護(hù)著作權(quán)人的利益會(huì)阻礙技術(shù)產(chǎn)業(yè)的創(chuàng)新發(fā)展,反之,過(guò)度傾向于技術(shù)產(chǎn)業(yè)的政策也會(huì)損害作品市場(chǎng)中的激勵(lì)機(jī)制和文化多樣性。因此,規(guī)制GAI機(jī)器學(xué)習(xí)需要以利益平衡為理念,不僅內(nèi)觀著作權(quán)制度的治理工具,而且要向外尋找彌補(bǔ)著作權(quán)制度缺陷的其他措施,多元化的治理路徑更利于在版權(quán)保護(hù)和技術(shù)創(chuàng)新這兩種價(jià)值之間找到平衡的支點(diǎn),促進(jìn)版權(quán)產(chǎn)業(yè)和人工智能產(chǎn)業(yè)的協(xié)同發(fā)展。
對(duì)此,本文將以不同類(lèi)型GAI機(jī)器學(xué)習(xí)構(gòu)成合理使用的可能性光譜為指引,試圖構(gòu)建有層次的治理框架,以期為市場(chǎng)主體提供明晰的合規(guī)方案,為技術(shù)創(chuàng)新和投資活動(dòng)的開(kāi)展提供穩(wěn)定的預(yù)期。
(一)完善利于開(kāi)展機(jī)器學(xué)習(xí)的合理使用制度
以海量作品訓(xùn)練為依托的基礎(chǔ)模型作為促進(jìn)生成式人工智能技術(shù)發(fā)展的重要引擎,是堪比互聯(lián)網(wǎng)的發(fā)明。在這一技術(shù)變革的關(guān)鍵節(jié)點(diǎn),各國(guó)著作權(quán)法為適應(yīng)機(jī)器學(xué)習(xí)對(duì)海量作品的使用需求都進(jìn)行了一定程度的調(diào)整,以合理使用政策的改革居多。日本著作權(quán)法對(duì)機(jī)器學(xué)習(xí)采取了較為寬松的監(jiān)管政策,[79] 被稱(chēng)為“機(jī)器學(xué)習(xí)的天堂”,而歐盟則對(duì)機(jī)器學(xué)習(xí)采取了較為嚴(yán)格的監(jiān)管政策,[80] 僅允許以科學(xué)研究為目的機(jī)器學(xué)習(xí)行為,在商業(yè)性質(zhì)的機(jī)器學(xué)習(xí)情形下為著作權(quán)人設(shè)置了“退出—選擇”機(jī)制。美國(guó)采取的是“先產(chǎn)業(yè)后司法”的政策,司法實(shí)踐并未及時(shí)對(duì)該類(lèi)案件作出判決,而是依賴(lài)于企業(yè)自治、行業(yè)規(guī)范或政府回應(yīng)等方式治理GAI機(jī)器學(xué)習(xí)。
由于我國(guó)著作權(quán)法的修改周期較長(zhǎng),著作權(quán)法尚未對(duì)該問(wèn)題及時(shí)作出回應(yīng)。2023 年7月國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門(mén)聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》第7條 [81],以及《人工智能法(學(xué)者建議稿)》第23條第1款 [82] 均對(duì)機(jī)器學(xué)習(xí)的知識(shí)產(chǎn)權(quán)合規(guī)提出了要求,但相應(yīng)的知識(shí)產(chǎn)權(quán)保護(hù)規(guī)則尚未予以完善。
我國(guó)的合理使用制度采取的是“一般條款 + 法定情形”的封閉立法模式,一方面,“三步檢驗(yàn)法”是對(duì)法定情形的再限定,而不是具有擴(kuò)張可能性的兜底條款;另一方面,在12種法定情形中,與機(jī)器學(xué)習(xí)關(guān)系較為密切的分別是《著作權(quán)法》第24條第1項(xiàng)“個(gè)人使用”、第24條第2項(xiàng)“適當(dāng)引用”以及第24條第6項(xiàng)“在課堂教學(xué)和科學(xué)研究中使用”,但上述條款在使用主體、使用數(shù)量、使用范圍和使用目的等方面未能有效適應(yīng)GAI 機(jī)器學(xué)習(xí)行為。[83] 綜上,有必要對(duì)我國(guó)的合理使用制度予以完善,以滿(mǎn)足GAI機(jī)器學(xué)習(xí)對(duì)作品使用的需求。
首先,建議引入美國(guó)的四要素測(cè)試法,構(gòu)建開(kāi)放型的合理使用條款,允許法官在個(gè)案中認(rèn)定 GAI 機(jī)器學(xué)習(xí)是否構(gòu)成合理使用。開(kāi)放性的制度構(gòu)造更能滿(mǎn)足人工智能時(shí)代的現(xiàn)實(shí)需求,一方面,規(guī)?;淖髌酚?xùn)練是推動(dòng)生成式人工智能技術(shù)發(fā)展的關(guān)鍵,當(dāng)特定的作品利用行為并不會(huì)實(shí)質(zhì)損害作者利益時(shí),應(yīng)當(dāng)將該行為納入合理使用的范疇;另一方面,人工智能輔助創(chuàng)作在權(quán)利界定、創(chuàng)作成本以及傳播效率上都更具競(jìng)爭(zhēng)優(yōu)勢(shì),[84]利用生成式人工智能輔助創(chuàng)作的私人用途將會(huì)進(jìn)一步擴(kuò)張,由于搜尋該行為的成本較高,加之侵權(quán)主體的賠付能力有限,即使該行為生成了版權(quán)侵權(quán)內(nèi)容,也不會(huì)對(duì)著作權(quán)人造成實(shí)質(zhì)損害,應(yīng)當(dāng)構(gòu)成合理使用。
其次,建議為非營(yíng)利性的GAI機(jī)器學(xué)習(xí)行為創(chuàng)設(shè)法定的合理使用情形。合理使用制度的規(guī)范價(jià)值在于調(diào)和多元價(jià)值沖突,以增進(jìn)社會(huì)公共福祉。非營(yíng)利性GAI機(jī)器學(xué)習(xí)能夠使公眾免費(fèi)利用生成式人工智能技術(shù),享受技術(shù)進(jìn)步所帶來(lái)的諸多好處,而且因?yàn)樵擃?lèi)情形在GAI機(jī)器學(xué)習(xí)中占比較少,對(duì)著作權(quán)的利益并不會(huì)造成實(shí)質(zhì)性損害,能夠滿(mǎn)足“三步檢驗(yàn)法”中對(duì)作品使用行為的限制性要求。有學(xué)者認(rèn)為應(yīng)當(dāng)將第24條第1項(xiàng)中的“為個(gè)人學(xué)習(xí)、研究或欣賞”改為“為私人學(xué)習(xí)、研究或欣賞”,更好地涵攝人工智能企業(yè)的非營(yíng)利科研活動(dòng),[85] 但本文認(rèn)為,該改革方案雖然擺脫了對(duì)主體的限定,仍然未能充分涵攝非營(yíng)利性GAI機(jī)器學(xué)習(xí),“私人”意味著作品使用的非公開(kāi)性,而非營(yíng)利性則是一種面向公眾的免費(fèi)使用,因此本文主張應(yīng)為非營(yíng)利性 GAI機(jī)器學(xué)習(xí)單獨(dú)構(gòu)造合理使用情形。
(二)構(gòu)建符合利益平衡原則的法定許可機(jī)制
與非營(yíng)利性GAI機(jī)器學(xué)習(xí)構(gòu)成合理使用的確定性不同,商業(yè)性GAI機(jī)器學(xué)習(xí)是否構(gòu)成合理使用仍然需要在個(gè)案中結(jié)合特定事實(shí)予以判斷,不明確的市場(chǎng)信號(hào)加之合理使用判定因素的重合性,決定了合理使用并不是在GAI機(jī)器學(xué)習(xí)場(chǎng)景下協(xié)調(diào)著作權(quán)人、技術(shù)開(kāi)發(fā)者以及公眾之間利益平衡的最佳政策工具。[86]
法定許可制度作為同樣限制著作權(quán)的責(zé)任規(guī)則,[87] 在GAI機(jī)器學(xué)習(xí)場(chǎng)景下展現(xiàn)出諸多優(yōu)勢(shì):一是平衡版權(quán)保護(hù)與技術(shù)進(jìn)步的折中方案。法定許可制度不僅保障了著作權(quán)人的利益,以鼓勵(lì)形成高質(zhì)量創(chuàng)作的文化生態(tài),而且促進(jìn)了作品的利用,以推動(dòng)生成式人工智能技術(shù)的發(fā)展。人工智能輔助創(chuàng)作內(nèi)容在權(quán)利界定、創(chuàng)作成本、傳播效應(yīng)等方面更具競(jìng)爭(zhēng)優(yōu)勢(shì),在著作權(quán)激勵(lì)機(jī)制的強(qiáng)化下,作品市場(chǎng)可能產(chǎn)生“劣幣驅(qū)逐良幣”的效應(yīng),即同質(zhì)化的人工智能生成物將代替人類(lèi)作品占據(jù)市場(chǎng)主導(dǎo)地位。在被稱(chēng)為“機(jī)器學(xué)習(xí)天堂”的日本,數(shù)千名插畫(huà)師、藝術(shù)家和音樂(lè)家都在反對(duì)目前對(duì)著作權(quán)人保護(hù)不足的現(xiàn)狀,并期望日本能夠最終構(gòu)建相應(yīng)的法律體系,以保護(hù)創(chuàng)意產(chǎn)業(yè)和著作權(quán)人的權(quán)益。[88] 可見(jiàn),雖然通用型GAI生成版權(quán)侵權(quán)內(nèi)容的概率較低,不會(huì)對(duì)特定作者的利益造成實(shí)質(zhì)性損害,但其對(duì)作者群體利益所造成的傷害是現(xiàn)實(shí)可見(jiàn)的。因此,若允許廣泛開(kāi)展GAI機(jī)器學(xué)習(xí)而不給予作者群體任何補(bǔ)償,將不利于構(gòu)建可持續(xù)發(fā)展的作品市場(chǎng)。合理使用是不經(jīng)著作權(quán)人許可的免費(fèi)使用,在GAI機(jī)器學(xué)習(xí)情形下不給予著作權(quán)人以適當(dāng)?shù)难a(bǔ)償有違著作權(quán)的基本精神。
二是簡(jiǎn)化作品許可程序,降低作品交易成本。創(chuàng)設(shè) GAI 機(jī)器學(xué)習(xí)的法定許可制度,可以使技術(shù)研發(fā)者無(wú)需經(jīng)過(guò)著作人的許可,只要支付法定許可費(fèi)即可使用作品進(jìn)行訓(xùn)練。該制度的落實(shí)可依托于集體管理組織的運(yùn)行,在集體管理的模式下,分散的個(gè)體利益被予以集中,個(gè)體作者的談判地位將得以提升,通過(guò)“一攬子”協(xié)議的集中授權(quán)而省去了單個(gè)作品逐一達(dá)成交易的作品搜尋、來(lái)源識(shí)別、協(xié)商談判等成本,從而促進(jìn)作品的利用和傳播,[89] 也能滿(mǎn)足機(jī)器學(xué)習(xí)場(chǎng)景下對(duì)規(guī)模化作品使用的需求。
三是緩解機(jī)器學(xué)習(xí)場(chǎng)景下日益加劇的技術(shù)壟斷,賦予著作權(quán)人談判籌碼,從而促成市場(chǎng)中協(xié)商談判機(jī)制的形成。法定許可制度最早誕生于“鋼琴卷紙案”,[90] 最早出現(xiàn)在1909年的美國(guó)《版權(quán)法》,該制度的立法目的在于防止壟斷。[91] 在人工智能時(shí)代,技術(shù)研發(fā)者因利用海量作品進(jìn)行數(shù)據(jù)訓(xùn)練在市場(chǎng)中占據(jù)優(yōu)勢(shì)地位,若將GAI機(jī)器學(xué)習(xí)認(rèn)定為合理使用無(wú)疑會(huì)進(jìn)一步加劇技術(shù)壟斷。此外,由于算法黑箱的不可知性和作品利用的碎片化,“接觸 + 實(shí)質(zhì)性相似”的侵權(quán)認(rèn)定規(guī)則在GAI機(jī)器學(xué)習(xí)場(chǎng)景下失效,著作權(quán)人因無(wú)法實(shí)施侵權(quán)救濟(jì)在市場(chǎng)中處于弱勢(shì)地位,難以與技術(shù)開(kāi)發(fā)者達(dá)成作品使用的許可協(xié)議。對(duì)此,法定許可制度作為政府主導(dǎo)型的制度措施,[92] 在機(jī)器學(xué)習(xí)市場(chǎng)尚未形成復(fù)雜的交易環(huán)境前予以介入,增加了著作權(quán)人的談判籌碼,從而迫使技術(shù)研發(fā)者在技術(shù)開(kāi)發(fā)的前期就將著作權(quán)人的利益予以考量,從而通過(guò)自治手段將負(fù)外部性?xún)?nèi)部化,或自愿與著作權(quán)人達(dá)成協(xié)議。
然而,主張合理使用的學(xué)者對(duì)法定許可制度提出了諸多反對(duì)理由,主要包括以下三個(gè)方面:一是付酬方面,政府部門(mén)難以確立適當(dāng)?shù)淖髌防酶冻陿?biāo)準(zhǔn),固定的收費(fèi)標(biāo)準(zhǔn)難以適應(yīng)流動(dòng)的市場(chǎng)環(huán)境,且單一的收費(fèi)模式與GAI機(jī)器學(xué)習(xí)的作品利用邏輯不符。面對(duì)日新月異的技術(shù)和商業(yè)環(huán)境,立法者往往難以全面地收集信息,觀測(cè)市場(chǎng)的真實(shí)狀況并制定一個(gè)合理的費(fèi)率標(biāo)準(zhǔn)。[93] 高于市場(chǎng)定價(jià)的許可費(fèi)率會(huì)促使使用者更傾向于與著作權(quán)人進(jìn)行協(xié)商談判來(lái)確定交易價(jià)格,從而消弭法定許可制度所帶來(lái)的低交易成本優(yōu)勢(shì)。反之若許可費(fèi)率低于市場(chǎng)定價(jià),版權(quán)人沒(méi)有相應(yīng)的籌碼來(lái)提高定價(jià),獲得公平報(bào)酬的定價(jià)權(quán)。[94] 概言之,法定許可制度所確定的版稅標(biāo)準(zhǔn)就是著作權(quán)人能獲得的版稅上限。[95] 況且,機(jī)器學(xué)習(xí)中作品使用的特點(diǎn)在于規(guī)?;淖髌窋?shù)量,單一作品的價(jià)值極為有限,因此在機(jī)器學(xué)習(xí)的場(chǎng)合下更為合理的補(bǔ)償邏輯是針對(duì)作者利益群體的整體性補(bǔ)償,難以將補(bǔ)償費(fèi)用基于個(gè)人權(quán)利“精準(zhǔn)”地劃分給個(gè)人,[96] 而法定許可制度是以單一作品的單次利用為收費(fèi)標(biāo)準(zhǔn),更符合低頻次、高價(jià)值的作品使用情形,兩者在補(bǔ)償邏輯上存在差異。
二是我國(guó)尚未構(gòu)建起完善的低成本的集體授權(quán)機(jī)制,[97] 運(yùn)行集體管理組織將產(chǎn)生較高的制度成本。我國(guó)集體管理組織的發(fā)展仍然在諸多方面存在局限,一方面,規(guī)?;淖髌防靡馕吨鴮⑸婕氨姸鄼?quán)利人和使用人,從而產(chǎn)生較高的交易成本,其中包括與使用者訂立許可合同,收取并轉(zhuǎn)付許可費(fèi),從事訴訟或仲裁等維權(quán)活動(dòng)所產(chǎn)生的成本;[98] 另一方面,當(dāng)前我國(guó)集體管理組織存在授權(quán)模式單一、轉(zhuǎn)授代理等問(wèn)題,部分版權(quán)人和使用者對(duì)集體管理組織缺乏信任,[99] 從而不能積極配合,構(gòu)建有效率的收費(fèi)和分配模式。
三是機(jī)器學(xué)習(xí)作品使用場(chǎng)景廣泛,難以不加區(qū)分地“法定”。[100] 機(jī)器學(xué)習(xí)對(duì)作品的使用包括“公共領(lǐng)域”的自由使用、專(zhuān)有領(lǐng)域的合理使用、侵權(quán)使用等,并非所有的情形都能滿(mǎn)足法定許可的規(guī)范價(jià)值。若GAI機(jī)器學(xué)習(xí)生成版權(quán)侵權(quán)內(nèi)容,善意使用GAI的用戶(hù)不僅要支付法定許可的費(fèi)用,還要因侵權(quán)而支付賠償費(fèi)用,在此情形下的“雙重給付”難言正當(dāng)。[101]
可見(jiàn),上述反對(duì)理由均集中于法定許可制度的可行性問(wèn)題,而非其適用的正當(dāng)性。事實(shí)上,法定許可制度因契合利益平衡理念,被認(rèn)為是解決GAI機(jī)器學(xué)習(xí)版權(quán)合法性問(wèn)題的“理想方案”。[102] 對(duì)此,下文將聚焦于法定許可制度的可行性,論證在GAI機(jī)器學(xué)習(xí)中實(shí)施法定許可制度的“現(xiàn)實(shí)可能性”。首先,立法者可以通過(guò)模擬協(xié)商或參照商業(yè)實(shí)踐領(lǐng)域的現(xiàn)實(shí)情況來(lái)確定可供參考的付酬標(biāo)準(zhǔn),并構(gòu)建付酬標(biāo)準(zhǔn)協(xié)商機(jī)制,以保留市場(chǎng)自發(fā)的協(xié)調(diào)功能。關(guān)于法定許可付酬標(biāo)準(zhǔn)的制定,學(xué)界主要有兩種觀點(diǎn):一種觀點(diǎn)認(rèn)為應(yīng)當(dāng)由國(guó)務(wù)院相關(guān)部門(mén)確立,且費(fèi)率標(biāo)準(zhǔn)應(yīng)當(dāng)?shù)陀趨f(xié)商許可的定價(jià),不僅可以降低協(xié)商成本,保留法定許可制度的效用,而且不會(huì)對(duì)技術(shù)研發(fā)者造成過(guò)重的負(fù)擔(dān),損害中小企業(yè)的技術(shù)創(chuàng)新;[103] 另一種觀點(diǎn)認(rèn)為應(yīng)確定付酬協(xié)商機(jī)制,由雙方當(dāng)事人平等協(xié)商,協(xié)商不成的,則通過(guò)仲裁或訴訟確定使用費(fèi)率。[104] 本文認(rèn)為,法定許可制度是政府主導(dǎo)型的市場(chǎng)調(diào)解機(jī)制,在市場(chǎng)尚未能夠形成復(fù)雜的交易機(jī)制之前,立法者可通過(guò)確立法定價(jià)的方式來(lái)擬制市場(chǎng)交易,當(dāng)前多起有關(guān)GAI機(jī)器學(xué)習(xí)的訴訟的出現(xiàn)便反映了市場(chǎng)中尚未形成相對(duì)成熟的交易機(jī)制,此時(shí)立法者有必要及時(shí)介入市場(chǎng),制定付酬標(biāo)準(zhǔn),以緩解市場(chǎng)失靈所帶來(lái)的不良影響。立法者在制定參考的付酬標(biāo)準(zhǔn)時(shí)應(yīng)盡量反映客觀的市場(chǎng)價(jià)格,為促成自發(fā)、成熟的市場(chǎng)交易環(huán)境提供動(dòng)力。對(duì)此,立法者一方面可以通過(guò)組織有代表性的著作權(quán)人和技術(shù)研發(fā)者進(jìn)行模擬談判,以確定能夠反映市場(chǎng)真實(shí)情況的付費(fèi)標(biāo)準(zhǔn),另一方面,可以參照市場(chǎng)中通過(guò)談判達(dá)成的自愿協(xié)議來(lái)確定費(fèi)率標(biāo)準(zhǔn),比如 OpenAI通過(guò)向十余家新聞機(jī)構(gòu)支付約2.5億美元(約合人民幣 18.1 億元)的許可費(fèi)用, 與其達(dá)成了達(dá)成五年的作品使用協(xié)議。[105] 隨著作品交易市場(chǎng)逐漸成熟,有些稿費(fèi)付酬標(biāo)準(zhǔn)應(yīng)當(dāng)予以廢止,而由市場(chǎng)的自由協(xié)商機(jī)制來(lái)確定付費(fèi)標(biāo)準(zhǔn)。
其次,需要從技術(shù)支持、制度保障兩個(gè)方面完善我國(guó)的集體管理制度,從而推動(dòng)法定許可制度的實(shí)施。誠(chéng)然,我國(guó)集體管理制度尚不完備,但這并不意味著就要放棄GAI 機(jī)器學(xué)習(xí)情形下最優(yōu)的制度方案,而是要著眼于制度癥結(jié)并予以完善。在技術(shù)支持方面,區(qū)塊鏈技術(shù)具有去中心化、透明和不可篡改的技術(shù)特征,將其應(yīng)用于集體管理制度,不僅能夠解決使用者和版權(quán)人的信任危機(jī),而且能夠在版權(quán)授權(quán)、版權(quán)交易、版稅收發(fā)以及信息數(shù)據(jù)庫(kù)構(gòu)建等方面降低執(zhí)行合約的成本,使集體管理組織能夠?qū)嵸|(zhì)發(fā)揮降低交易成本的功能。[106] 在制度保障方面,應(yīng)當(dāng)構(gòu)建信息披露制度,由使用者記錄并公開(kāi)其用于數(shù)據(jù)訓(xùn)練的作品信息。歐盟《人工智能法案》第53條就為通用人工智能模型設(shè)立了信息披露義務(wù),要求通用人工智能的開(kāi)發(fā)者必須遵守版權(quán)法,按照相應(yīng)的規(guī)定起草并公開(kāi)用于訓(xùn)練通用人工智能模型的內(nèi)容摘要,以便版權(quán)人根據(jù)《數(shù)字化單一市場(chǎng)版權(quán)指令》為其設(shè)定的“選擇—退出”機(jī)制保留相應(yīng)的權(quán)利。[107] 可見(jiàn),該義務(wù)的設(shè)定打破了數(shù)據(jù)訓(xùn)練環(huán)節(jié)的黑箱狀態(tài),不僅方便集體管理組織查閱作品使用清單,及時(shí)向使用者收取費(fèi)用或維護(hù)權(quán)利人的合法權(quán)益,而且能夠使主管部門(mén)有效行使監(jiān)督管理職能,確保機(jī)器學(xué)習(xí)的版權(quán)合規(guī)。
最后,法定許可制度所適用的范圍應(yīng)當(dāng)被嚴(yán)格地限制在商業(yè)性GAI機(jī)器學(xué)習(xí)領(lǐng)域,換言之,只有以商業(yè)目的開(kāi)發(fā)GAI的技術(shù)研發(fā)者才有義務(wù)向權(quán)利人支付作品使用的許可費(fèi)用,而不是不加區(qū)分地要求所有進(jìn)行作品數(shù)據(jù)訓(xùn)練的主體承擔(dān)法定的付費(fèi)義務(wù)。此外,法定許可制度的引入并不會(huì)導(dǎo)致“雙重給付”的現(xiàn)實(shí),因?yàn)橹Ц读嗽S可使用費(fèi)的主體能在版權(quán)侵權(quán)訴訟中以法定許可提出抗辯,從而免除著作權(quán)侵權(quán)責(zé)任。事實(shí)上,正是因?yàn)榉ǘㄔS可制度在輸入端對(duì)作品使用行為進(jìn)行了規(guī)制,人工智能生成物的版權(quán)侵權(quán)訴訟將大幅減少,減輕司法審判的負(fù)擔(dān)。
(三)借鑒遵循動(dòng)態(tài)規(guī)制邏輯的避風(fēng)港規(guī)則
若GAI機(jī)器學(xué)習(xí)所輸出的結(jié)果與原作品構(gòu)成實(shí)質(zhì)性相似,將會(huì)在原作品市場(chǎng)產(chǎn)生替代效應(yīng),實(shí)質(zhì)損害著作權(quán)人的利益。對(duì)于該類(lèi)構(gòu)成著作權(quán)侵權(quán)的機(jī)器學(xué)習(xí)行為,權(quán)利人往往基于賠付能力、商業(yè)策略以及舉證難易程度等方面的考量,不會(huì)追究私人用戶(hù)的直接侵權(quán)責(zé)任,[108] 轉(zhuǎn)而向GAI服務(wù)平臺(tái)主張侵權(quán)救濟(jì)。
對(duì)此,應(yīng)借鑒互聯(lián)網(wǎng)治理的“避風(fēng)港規(guī)則”, 為GAI服務(wù)平臺(tái)設(shè)定適當(dāng)?shù)淖⒁饬x務(wù),合理地分擔(dān)GAI機(jī)器學(xué)習(xí)場(chǎng)景下的版權(quán)侵權(quán)風(fēng)險(xiǎn)。在法理層面,注意義務(wù)的設(shè)定應(yīng)當(dāng)與其行為所產(chǎn)生的風(fēng)險(xiǎn)相適應(yīng),需結(jié)合產(chǎn)業(yè)和技術(shù)環(huán)境的實(shí)際情況,在兼顧版權(quán)保護(hù)的同時(shí),將技術(shù)創(chuàng)新的政策納入考量。由于人工智能輔助創(chuàng)作物因更符合市場(chǎng)需求而更能適應(yīng)算法推送的技術(shù)邏輯,在作品傳播效果上更為優(yōu)越。[109] 因此,利用生成式人工智能進(jìn)行二次創(chuàng)作生成版權(quán)侵權(quán)內(nèi)容后更容易被廣泛地傳播,對(duì)著作權(quán)造成實(shí)質(zhì)影響的潛在風(fēng)險(xiǎn)較大,有必要為GAI服務(wù)平臺(tái)設(shè)立較高的注意義務(wù)。明晰的責(zé)任邊界有助于為 GAI服務(wù)提供者提供穩(wěn)定的預(yù)期,鼓勵(lì)其在相應(yīng)的風(fēng)險(xiǎn)防范中進(jìn)行合理的投資,平衡版權(quán)保護(hù)與技術(shù)創(chuàng)新的雙重價(jià)值。
一方面,GAI 服務(wù)提供者應(yīng)采取事前阻止措施,防止使用者在使用GAI時(shí)生成侵權(quán)內(nèi)容,或阻止其將生成后的侵權(quán)內(nèi)容發(fā)送給用戶(hù)。具體來(lái)說(shuō),一是可以采用提示詞過(guò)濾的技術(shù)措施,防范侵權(quán)內(nèi)容的繼續(xù)生成。雖然基于自然語(yǔ)言的豐富性,基礎(chǔ)模型的設(shè)計(jì)者無(wú)法鎖定所有可能出現(xiàn)問(wèn)題的“提示詞”及其相關(guān)表達(dá),但其仍有能力過(guò)濾掉明顯違法的提示詞,[110] 以降低生成版權(quán)侵權(quán)內(nèi)容的風(fēng)險(xiǎn)。事實(shí)上,即使基礎(chǔ)模型的訓(xùn)練并未刻意模仿某一作品風(fēng)格,生成式人工智能也會(huì)在以下三種情形下生成版權(quán)侵權(quán)內(nèi)容,分別是涉及奧特曼、米老鼠等與特定文本描述相關(guān)聯(lián)的圖片,訓(xùn)練語(yǔ)料庫(kù)中反復(fù)出現(xiàn)差異較小的圖片、知名度較高的作品。[111] 基于這一技術(shù)特征,GAI服務(wù)提供者可以提前過(guò)濾掉具有較高市場(chǎng)價(jià)值,且知名度較高的作品名稱(chēng)。在“奧特曼案”中,法院要求被告采取關(guān)鍵詞過(guò)濾等措施,防范其服務(wù)繼續(xù)生成與案涉奧特曼作品構(gòu)成實(shí)質(zhì)性相似的圖片,從而達(dá)到停止侵權(quán)的效果。[112] 二是著作權(quán)人應(yīng)與GAI服務(wù)提供者開(kāi)展積極的合作,幫助其構(gòu)建作品數(shù)據(jù)庫(kù),經(jīng)由用戶(hù)指令生成的內(nèi)容應(yīng)與作品數(shù)據(jù)庫(kù)進(jìn)行智能比對(duì),直接屏蔽或過(guò)濾掉構(gòu)成高度實(shí)質(zhì)性相似的內(nèi)容,從而避免侵權(quán)內(nèi)容被持續(xù)不斷地大范圍傳播。[113]
另一方面,GAI服務(wù)提供者還應(yīng)采取事后阻止措施,即防范侵權(quán)內(nèi)容再次生成或侵權(quán)內(nèi)容被廣泛傳播。對(duì)此,GAI服務(wù)提供者應(yīng)設(shè)置投訴舉報(bào)機(jī)制,該機(jī)制在制度構(gòu)造上類(lèi)似于“通知—刪除”規(guī)則,即權(quán)利人向GAI服務(wù)提供者發(fā)出侵權(quán)通知,GAI服務(wù)提供者在判定侵權(quán)成立后,應(yīng)采取必要措施來(lái)停止侵權(quán)。[114] 其中,“必要措施”的外延應(yīng)當(dāng)結(jié)合GAI的技術(shù)特征予以明確,以保障技術(shù)上的可行性,從而避免給技術(shù)研發(fā)者的風(fēng)險(xiǎn)防范造成過(guò)重的負(fù)擔(dān)。由于GAI基礎(chǔ)模型運(yùn)作遵循的是數(shù)據(jù)開(kāi)發(fā)的推理模型,生成結(jié)果具有不可控性,[115] 因此難以采取針對(duì)性的阻止措施,[116] 比如在訓(xùn)練數(shù)據(jù)庫(kù)中刪除侵權(quán)內(nèi)容,則意味著要對(duì)基礎(chǔ)模型進(jìn)行重新訓(xùn)練,將會(huì)產(chǎn)生極其高昂的成本,與其所造成的風(fēng)險(xiǎn)不成正比,不具有經(jīng)濟(jì)理性。因此,仍然可以沿用“提示詞”過(guò)濾技術(shù)來(lái)阻止侵權(quán)內(nèi)容的進(jìn)一步生成。
(四)補(bǔ)充超越著作權(quán)制度的多元治理措施
從互聯(lián)網(wǎng)到人工智能,技術(shù)的發(fā)展推動(dòng)著作品大規(guī)模的數(shù)字化,顛覆了作品使用的方式。在數(shù)字世界里,全民創(chuàng)作的熱潮疊加媒介迭代所帶來(lái)的作品傳播效率大幅提升,使得傳統(tǒng)的著作權(quán)制度難以應(yīng)對(duì)多元場(chǎng)景下的作品使用需求,作品市場(chǎng)由此生發(fā)出諸多基于商業(yè)實(shí)踐的自治手段。因此,本文將超越著作權(quán)內(nèi)部的制度工具,關(guān)注商業(yè)環(huán)境中解決GAI機(jī)器學(xué)習(xí)的版權(quán)合法性障礙的行業(yè)自治規(guī)則,以期構(gòu)建多層次的GAI版權(quán)合規(guī)方案,降低相關(guān)企業(yè)的經(jīng)營(yíng)風(fēng)險(xiǎn),推動(dòng)人工智能產(chǎn)業(yè)的高質(zhì)量發(fā)展。
第一,以用戶(hù)協(xié)議為中介獲得作品授權(quán)、分擔(dān)侵權(quán)風(fēng)險(xiǎn)。在互聯(lián)網(wǎng)環(huán)境中,用戶(hù)在使用相應(yīng)的產(chǎn)品或服務(wù)時(shí),一般都需要簽訂一份用戶(hù)協(xié)議,以明確用戶(hù)和服務(wù)提供者之間的權(quán)利和義務(wù),這是服務(wù)提供商開(kāi)創(chuàng)新型商業(yè)模式、分擔(dān)風(fēng)險(xiǎn)的重要手段。在GAI機(jī)器學(xué)習(xí)場(chǎng)景下,用戶(hù)協(xié)議的功能主要體現(xiàn)如下方面:一是通過(guò)用戶(hù)協(xié)議合法獲取用戶(hù)生成內(nèi)容并用于數(shù)據(jù)訓(xùn)練。用戶(hù)生成內(nèi)容是人工智能數(shù)據(jù)訓(xùn)練的主要材料,[117] 當(dāng)前大型互聯(lián)網(wǎng)企業(yè)存在一種“以服務(wù)換授權(quán)”的商業(yè)模式,即在向用戶(hù)提供服務(wù)的同時(shí)會(huì)以“用戶(hù)協(xié)議”的方式獲取用戶(hù)在服務(wù)過(guò)程中生成的數(shù)據(jù)內(nèi)容。[118] 該類(lèi)協(xié)議有效解決了數(shù)據(jù)來(lái)源合法性的問(wèn)題,在作品輸入的前端規(guī)避了侵權(quán)風(fēng)險(xiǎn),具有一定的經(jīng)濟(jì)效益。二是在用戶(hù)協(xié)議中調(diào)配權(quán)利義務(wù),將生成版權(quán)侵權(quán)內(nèi)容的負(fù)外部性?xún)?nèi)部化。比如OpenAI就在服務(wù)條款中推出了“版權(quán)保護(hù)盾(copyright shield)”,意味著若用戶(hù)因使用 ChatGPT 企業(yè)版和API而面臨版權(quán)侵權(quán)訴訟,OpenAI將介入幫助用戶(hù)應(yīng)訴并承擔(dān)因訴訟產(chǎn)生的相關(guān)費(fèi)用。[119] 這一自發(fā)的舉措有效地將產(chǎn)生版權(quán)侵權(quán)的外部風(fēng)險(xiǎn)內(nèi)化為企業(yè)內(nèi)部的技術(shù)合規(guī)成本,不僅能夠使得用戶(hù)更放心地使用相關(guān)服務(wù),而且將推動(dòng)平臺(tái)不斷改進(jìn)模型降低侵權(quán)風(fēng)險(xiǎn)。
第二,引入知識(shí)共享協(xié)議,推動(dòng)作品數(shù)據(jù)開(kāi)放共享。受到“自由軟件”開(kāi)放源代碼的啟發(fā),以創(chuàng)作共享、使用共享為理念,知識(shí)共享(以下簡(jiǎn)稱(chēng) CC)運(yùn)動(dòng)應(yīng)運(yùn)而生。[120] CC許可協(xié)議誕生于CC運(yùn)動(dòng),是著作權(quán)人向公眾免費(fèi)提供的作品使用許可授權(quán)的聲明,即權(quán)利人可以根據(jù)CC許可條款所設(shè)定的模塊自由組合,在保留部分權(quán)利的情況下使公眾根據(jù)許可協(xié)議條款免費(fèi)使用其作品,在“保留所有權(quán)利”和“無(wú)任何權(quán)利保留”之間開(kāi)創(chuàng)了一條中間道路,即“保留部分權(quán)利”。[121] CC許可協(xié)議在價(jià)值理念和實(shí)踐操作層面均與GAI機(jī)器學(xué)習(xí)的作品使用場(chǎng)景高度契合,在價(jià)值理念方面,CC許可協(xié)議以共享、平等為理念,對(duì)所有使用者一視同仁,并通過(guò)自行設(shè)定條件約束后續(xù)使用者以相同的許可方式和條件促進(jìn)作品的傳播和利用。[122] CC許可協(xié)議對(duì)后續(xù)利用行為的限制條件有利于推動(dòng)共享生態(tài)的形成,此外,平等理念使得中小企業(yè)也能利用“版權(quán)共享池”中的作品進(jìn)行數(shù)據(jù)訓(xùn)練,避免科技領(lǐng)域的不正當(dāng)競(jìng)爭(zhēng),有助于人工智能產(chǎn)業(yè)的技術(shù)創(chuàng)新。在實(shí)踐操作層面,與傳統(tǒng)授權(quán)模式下需要與版權(quán)人協(xié)商獲取授權(quán)不同,CC許可協(xié)議在版權(quán)人意愿的基礎(chǔ)上預(yù)先設(shè)定了作品使用許可條款。使用者無(wú)需與版權(quán)人進(jìn)行協(xié)商即可使用作品,降低了作品的交易成本,滿(mǎn)足了機(jī)器學(xué)習(xí)場(chǎng)景下大規(guī)模作品使用的需求。
第三,發(fā)展版權(quán)保險(xiǎn)制度,應(yīng)對(duì)內(nèi)生性的版權(quán)侵權(quán)風(fēng)險(xiǎn)?;A(chǔ)模型訓(xùn)練所需要的作品數(shù)據(jù)是以?xún)|來(lái)計(jì)算的,面對(duì)海量的作品使用需求,即使通過(guò)購(gòu)買(mǎi)數(shù)據(jù)庫(kù)、使用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)或通過(guò)集體管理組織授權(quán)等多種方式盡可能地合法獲取數(shù)據(jù),仍然可能會(huì)有漏網(wǎng)之魚(yú)??梢哉f(shuō),機(jī)器學(xué)習(xí)中的版權(quán)侵權(quán)風(fēng)險(xiǎn)是內(nèi)生性的。為了有效應(yīng)對(duì)潛在的版權(quán)侵權(quán)風(fēng)險(xiǎn),人工智能研發(fā)企業(yè)可以通過(guò)購(gòu)買(mǎi)版權(quán)保險(xiǎn),引入第三方機(jī)構(gòu)來(lái)分擔(dān)侵權(quán)風(fēng)險(xiǎn),降低版權(quán)的市場(chǎng)交易成本。[123] 在當(dāng)前的版權(quán)保險(xiǎn)類(lèi)別中,版權(quán)侵權(quán)責(zé)任保險(xiǎn)能夠有效地回應(yīng)這一需求,該款保險(xiǎn)模式以被保險(xiǎn)人侵犯他人知識(shí)產(chǎn)權(quán)所應(yīng)當(dāng)承擔(dān)的賠償責(zé)任為保險(xiǎn)標(biāo)的,承保范圍主要是被保險(xiǎn)人因被他人提起知識(shí)產(chǎn)權(quán)侵權(quán)訴訟而需要支出的法律費(fèi)用,包括律師費(fèi)和被判承擔(dān)賠償責(zé)任時(shí)支付的損害賠償金等費(fèi)用。[124] 從我國(guó)知識(shí)產(chǎn)權(quán)保險(xiǎn)開(kāi)展情況來(lái)看,專(zhuān)利領(lǐng)域的保險(xiǎn)種類(lèi)較為豐富,不僅有針對(duì)使用者抵御知識(shí)產(chǎn)權(quán)侵權(quán)風(fēng)險(xiǎn)的知識(shí)產(chǎn)權(quán)侵權(quán)責(zé)任保險(xiǎn),還有為權(quán)利人開(kāi)展知識(shí)產(chǎn)權(quán)維權(quán)活動(dòng)的知識(shí)產(chǎn)權(quán)執(zhí)行保險(xiǎn)。在版權(quán)領(lǐng)域,目前只有為著作權(quán)人設(shè)立的版權(quán)執(zhí)行保險(xiǎn),即在著作權(quán)人的作品遭到侵權(quán)后由保險(xiǎn)公司向其賠償,之后再由保險(xiǎn)公司行使代位求償權(quán)。[125] 未來(lái)應(yīng)當(dāng)大力發(fā)展版權(quán)侵權(quán)責(zé)任保險(xiǎn),解決人工智能企業(yè)從事機(jī)器學(xué)習(xí)活動(dòng)時(shí)所面臨的版權(quán)合法性障礙,激發(fā)人工智能產(chǎn)業(yè)的創(chuàng)新活力。
此外,一些人工智能研發(fā)公司也積極地探索尊重作者權(quán)利,向作者支付報(bào)酬的各種方案。比如 Adobe 創(chuàng)建了內(nèi)容真實(shí)性倡議(Content Authenticity Initiative, CAI)的元數(shù)據(jù)系統(tǒng),創(chuàng)作者可以使用 CAI 技術(shù)在其圖像或數(shù)字文件中加入“不用于訓(xùn)練”的標(biāo)簽,指示AI訓(xùn)練系統(tǒng)將其排除在訓(xùn)練數(shù)據(jù)之外,由此為著作權(quán)人構(gòu)建了權(quán)利保留的“選擇—退出”機(jī)制。[126] 再比如 Shutterstock 在研發(fā)生成式人工智能系統(tǒng)時(shí),推出了貢獻(xiàn)者基金(Contributor Fund)來(lái)補(bǔ)償藝術(shù)家,以確保內(nèi)容創(chuàng)作者得到公平的報(bào)酬。[127]
六、結(jié)語(yǔ)
GAI機(jī)器學(xué)習(xí)的版權(quán)合法性問(wèn)題是著作權(quán)制度迎面技術(shù)變革發(fā)出的時(shí)代之問(wèn),也是如何調(diào)和版權(quán)保護(hù)與技術(shù)進(jìn)步之緊張關(guān)系的歷史之問(wèn)。不同于以往的技術(shù)變革,GAI機(jī)器學(xué)習(xí)會(huì)在輸出端對(duì)作品進(jìn)行碎片化的利用,加之其采用的是數(shù)據(jù)開(kāi)放的推理模型,生成結(jié)果具有不可控性,因此,GAI機(jī)器學(xué)習(xí)對(duì)作品市場(chǎng)的影響具有高度不確定性。對(duì)此,合理使用的認(rèn)定遵循個(gè)案判定的邏輯,未能給市場(chǎng)主體提供明晰的免責(zé)信號(hào),不是規(guī)制 GAI機(jī)器學(xué)習(xí)的最優(yōu)工具。以“四要素測(cè)試法”為標(biāo)準(zhǔn)分析不同場(chǎng)景下的GAI機(jī)器學(xué)習(xí),可以發(fā)現(xiàn),以構(gòu)成合理使用的可能性為標(biāo)準(zhǔn),GAI機(jī)器學(xué)習(xí)可以分為三類(lèi):一是非營(yíng)利性GAI機(jī)器學(xué)習(xí),構(gòu)成合理使用的可能性最大;二是商業(yè)性GAI機(jī)器學(xué)習(xí),通用型GAI 機(jī)器學(xué)習(xí)在其中占比較大,生成版權(quán)侵權(quán)內(nèi)容的概率較低,構(gòu)成合理使用的可能位于光譜中端;三是生成版權(quán)侵權(quán)內(nèi)容GAI機(jī)器學(xué)習(xí),以特定作者型 GAI 機(jī)器學(xué)習(xí)為主,構(gòu)成合理使用的可能性最低。
為了給市場(chǎng)主體提供明晰的版權(quán)合規(guī)方案,本文以上述對(duì) GAI 機(jī)器學(xué)習(xí)的類(lèi)型劃分為參照,結(jié)合著作權(quán)制度工具與商業(yè)實(shí)踐的自治規(guī)則,試圖構(gòu)建多層次、體系化的 GAI 機(jī)器學(xué)習(xí)版權(quán)合規(guī)方案。具體內(nèi)容如下:一是增設(shè)非營(yíng)利性 GAI 機(jī)器學(xué)習(xí)的合理使用情形,以示例的方式為市場(chǎng)主體從事相關(guān)行為提供明確的指引。同時(shí)引入靈活、開(kāi)放的“四要素測(cè)試法”突破合理使用制度的封閉性,以應(yīng)對(duì)司法實(shí)踐中可能出現(xiàn)的GAI機(jī)器學(xué)習(xí)訴訟,由法院在具體司法裁判中平衡版權(quán)保護(hù)與技術(shù)進(jìn)步的利益。二是設(shè)置商業(yè)性GAI機(jī)器學(xué)習(xí)的法定許可情形,并完善集體管理制度。法定許可制度不僅能夠降低交易成本,為技術(shù)研發(fā)者提供明確的市場(chǎng)信號(hào),促使其在技術(shù)開(kāi)發(fā)前期就將版權(quán)風(fēng)險(xiǎn)納入考量,而且改善了著作權(quán)人在機(jī)器學(xué)習(xí)場(chǎng)景下的弱勢(shì)地位,保障其能夠獲得合理的補(bǔ)償,維系作品市場(chǎng)的利益平衡。三是借鑒互聯(lián)網(wǎng)平臺(tái)治理的“避風(fēng)港規(guī)則”,結(jié)合產(chǎn)業(yè)和技術(shù)發(fā)展的實(shí)際情況,在動(dòng)態(tài)中為GAI服務(wù)提供者設(shè)定適當(dāng)?shù)淖⒁饬x務(wù),不僅可以降低GAI生成版權(quán)侵權(quán)的風(fēng)險(xiǎn),也能保障GAI服務(wù)提供者能夠明確預(yù)期侵權(quán)風(fēng)險(xiǎn),更好地開(kāi)展風(fēng)險(xiǎn)合規(guī)、投資等商業(yè)活動(dòng)。此外,在著作權(quán)制度之外,GAI服務(wù)提供者、技術(shù)研發(fā)者等市場(chǎng)主體也在商業(yè)實(shí)踐中積極探索 GAI 機(jī)器學(xué)習(xí)版權(quán)合規(guī)的自治手段。用戶(hù)許可協(xié)議、知識(shí)共享許可協(xié)議、版權(quán)保險(xiǎn)制度等都能夠有效彌補(bǔ)著作權(quán)制度的局限性,為市場(chǎng)交易活動(dòng)的開(kāi)展提供更靈活的解決方案,從而構(gòu)建相對(duì)寬松的市場(chǎng)環(huán)境,有利于在保護(hù)著作權(quán)人利益的同時(shí)推動(dòng)人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展。
[本文系中南財(cái)經(jīng)政法大學(xué)知識(shí)產(chǎn)權(quán)研究中心和知識(shí)產(chǎn)權(quán)學(xué)院師生2024年最新學(xué)術(shù)研究成果,部分內(nèi)容已刊登在最新一期的《版權(quán)理論與實(shí)務(wù)》(2024年第10期)上。為方便閱讀,附注從略,專(zhuān)業(yè)人員及興趣愛(ài)好者請(qǐng)查閱新刊紙質(zhì)版]
