在人工智能專門(mén)立法中,為進(jìn)行機(jī)器學(xué)習(xí)、文本與數(shù)據(jù)挖掘等計(jì)算機(jī)信息處理,使用具有合法來(lái)源并已經(jīng)發(fā)表的作品的,并且不影響該作品的正常使用,也沒(méi)有不合理地?fù)p害著作權(quán)人的合法權(quán)益,則該使用行為屬于合理使用。
以ChatGPT、Sora等為代表的生成式人工智能(GenAI)模型,擁有超強(qiáng)的語(yǔ)言理解和文本圖像生成能力,是新質(zhì)生產(chǎn)力的典型代表,能助力千行百業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展。聚焦GenAI數(shù)據(jù)訓(xùn)練中的著作權(quán)侵權(quán)風(fēng)險(xiǎn),分析合理使用規(guī)則具有的比較優(yōu)勢(shì),探討我國(guó)著作權(quán)合理使用規(guī)則的困境和出路,有助于實(shí)現(xiàn)技術(shù)創(chuàng)新和風(fēng)險(xiǎn)治理的平衡,促進(jìn)我國(guó)GenAI產(chǎn)業(yè)的健康持續(xù)發(fā)展。
數(shù)據(jù)訓(xùn)練著作權(quán)侵權(quán)風(fēng)險(xiǎn)
GenAI具有強(qiáng)大的“閱讀”和“創(chuàng)作”能力,離不開(kāi)海量數(shù)據(jù)的“投喂”。而具有高質(zhì)量和良好價(jià)值觀的數(shù)據(jù),往往是處在著作權(quán)保護(hù)期內(nèi)的作品。在GenAI“輸入端”,無(wú)論是數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理還是模型訓(xùn)練,均會(huì)涉及對(duì)作品的復(fù)制、匯編以及改編等,這有可能落入著作權(quán)人復(fù)制權(quán)、匯編權(quán)以及改編權(quán)等專有權(quán)利的控制范圍。然而,使用作品進(jìn)行數(shù)據(jù)訓(xùn)練的行為,既不符合《中華人民共和國(guó)著作權(quán)法》(以下簡(jiǎn)稱《著作權(quán)法》)第二十四條規(guī)定的合理使用條款,也不符合現(xiàn)有的法定許可條款。所以,在當(dāng)前的《著作權(quán)法》框架下,使用處于著作權(quán)保護(hù)期內(nèi)的作品進(jìn)行數(shù)據(jù)訓(xùn)練,應(yīng)當(dāng)取得著作權(quán)人的許可并支付報(bào)酬。
但是,訓(xùn)練數(shù)據(jù)集往往具有突出的規(guī)?;卣鳎热?,GPT4就包含超過(guò)1.8萬(wàn)億參數(shù)和13萬(wàn)億token的訓(xùn)練數(shù)據(jù)。在這種情形下,傳統(tǒng)的授權(quán)許可的交易模式根本無(wú)法實(shí)施。同時(shí),我國(guó)發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》(以下簡(jiǎn)稱《辦法》)第7條要求訓(xùn)練數(shù)據(jù)必須具有合法來(lái)源,且不得侵犯他人的知識(shí)產(chǎn)權(quán)。全國(guó)網(wǎng)絡(luò)安全標(biāo)準(zhǔn)化技術(shù)委員會(huì)發(fā)布的《生成式人工智能服務(wù)安全基本要求》第5.2條規(guī)定的“語(yǔ)料內(nèi)容安全要求”,也要求應(yīng)當(dāng)注意語(yǔ)料使用情況以及相關(guān)知識(shí)產(chǎn)權(quán)情況,不得使用存在侵權(quán)風(fēng)險(xiǎn)的語(yǔ)料。由此,GenAI開(kāi)發(fā)者在獲取和使用作品數(shù)據(jù)時(shí),極易背負(fù)著作權(quán)侵權(quán)的“原罪”。
當(dāng)前,在國(guó)外,因使用作品進(jìn)行數(shù)據(jù)訓(xùn)練已經(jīng)產(chǎn)生大量的糾紛,比如:Alter訴OpenAI、Andersen訴Stability AI、Huckabee訴Meta Platforms等案件。在國(guó)內(nèi),2023年6月,網(wǎng)絡(luò)教培行業(yè)也發(fā)生過(guò),學(xué)而思未經(jīng)授權(quán)爬取筆神作文的作文素材,用以訓(xùn)練其智能產(chǎn)品“作文AI助手”,引起雙方紛爭(zhēng)。2024年6月,北京互聯(lián)網(wǎng)法院也開(kāi)庭審理了我國(guó)“首例AI繪畫(huà)大模型訓(xùn)練著作權(quán)侵權(quán)案”,目前仍未作出一審判決。在這些案件中,原告幾乎均主張,被告未經(jīng)授權(quán),使用其作品用于數(shù)據(jù)訓(xùn)練,侵犯了原告享有的著作權(quán);而被告基本上援引著作權(quán)合理使用規(guī)則進(jìn)行抗辯。
針對(duì)數(shù)據(jù)訓(xùn)練中的作品使用行為,不少國(guó)家或地區(qū)已經(jīng)進(jìn)行了著作權(quán)合理使用規(guī)則的探索和調(diào)適。歐盟《單一數(shù)字市場(chǎng)版權(quán)指令》就“文本與數(shù)據(jù)挖掘”規(guī)定了限制和例外;美國(guó)往往通過(guò)運(yùn)用“四要素標(biāo)準(zhǔn)”和“轉(zhuǎn)換性使用”,靈活解釋合理使用規(guī)則,從而為AI技術(shù)的發(fā)展開(kāi)辟空間;日本《著作權(quán)法》更是直接引入“非享受性使用”條款,將“計(jì)算機(jī)信息處理行為”納入合理使用。在此背景下,我國(guó)也應(yīng)及時(shí)作出立法回應(yīng),重塑人工智能時(shí)代的合理使用規(guī)則,以保障GenAI產(chǎn)業(yè)對(duì)數(shù)據(jù)獲取和使用的現(xiàn)實(shí)需求。
合理使用方案的比較優(yōu)勢(shì)及其適用困境
1. 數(shù)據(jù)訓(xùn)練著作權(quán)侵權(quán)風(fēng)險(xiǎn)解決方案的梳理
我國(guó)《著作權(quán)法》第十條規(guī)定了4項(xiàng)人身權(quán)和13項(xiàng)財(cái)產(chǎn)權(quán),即為著作權(quán)人享有的專有權(quán)利,每一項(xiàng)專有權(quán)利均控制著一類特定行為。比如,復(fù)制權(quán)控制著以印刷、復(fù)印、數(shù)字化等方式將作品制作一份或者多份的行為。通俗而言,專有權(quán)利劃定了一個(gè)只有著作權(quán)人才能進(jìn)入的“專屬領(lǐng)地”。同時(shí),著作權(quán)法
基于社會(huì)政策的考量,在賦予著作權(quán)人專有權(quán)利的同時(shí),也要滿足社會(huì)對(duì)知識(shí)和信息傳播的需求。
所以,在一定條件下,著作權(quán)法又允許其他主體不經(jīng)許可,有償使用甚至無(wú)償使用作品。為此,我國(guó)《著作權(quán)法》規(guī)定了對(duì)“著作權(quán)的限制”:法定許可和合理使用。因此,如果未經(jīng)著作權(quán)人許可,又缺乏“著作權(quán)的限制”作為侵權(quán)抗辯事由,實(shí)施了受專有權(quán)利控制的行為,就是擅自“闖入”這一“專屬領(lǐng)地”,構(gòu)成著作權(quán)直接侵權(quán)。此時(shí),不管行為人是否具有主觀過(guò)錯(cuò),至少應(yīng)當(dāng)承擔(dān)停止侵害的民事責(zé)任。簡(jiǎn)言之,著作權(quán)侵權(quán)判定的法律邏輯為:未經(jīng)許可實(shí)施受控行為——不存在“著作權(quán)的限制”——構(gòu)成著作權(quán)侵權(quán)。
基于我國(guó)《著作權(quán)法》的侵權(quán)判定的法律邏輯,在理論和實(shí)踐中,出現(xiàn)的數(shù)據(jù)訓(xùn)練著作權(quán)侵權(quán)風(fēng)險(xiǎn)的解決方案,大體上可以分為以下三類:著作權(quán)的限縮、事前授權(quán)許可、著作權(quán)的限制(法定許可和合理使用)。
“著作權(quán)的限縮”方案主張,對(duì)著作權(quán)人的專有權(quán)利的控制范圍加以限縮,從而認(rèn)定相關(guān)作品使用行為不是受控行為,也就無(wú)需再判斷是否存在“著作權(quán)的限制”,即可化解數(shù)據(jù)訓(xùn)練面臨的著作權(quán)風(fēng)險(xiǎn)。
“事前授權(quán)許可”方案主張,按照當(dāng)前的《著作權(quán)法》的規(guī)定,使用處于著作權(quán)保護(hù)期內(nèi)的作品進(jìn)行數(shù)據(jù)訓(xùn)練,受專有權(quán)利控制,應(yīng)當(dāng)取得權(quán)利人的使用許可并支付報(bào)酬。
“著作權(quán)的限制”方案則在承認(rèn)作品使用行為受著作權(quán)人專有權(quán)利的控制的前提下,判斷作品使用行為能否適用“著作權(quán)的限制”,即法定許可或者合理使用,以實(shí)現(xiàn)責(zé)任豁免。
2. 合理使用方案的比較優(yōu)勢(shì)的分析
(1)著作權(quán)的限縮:重塑著作權(quán)法不具有現(xiàn)實(shí)性
“著作權(quán)的限縮”方案的提出,源于對(duì)“非表達(dá)性使用”理論運(yùn)用的深化和批判。所謂“非表達(dá)性使用”指的是,不以閱讀、欣賞作品的獨(dú)創(chuàng)性表達(dá)為目的的作品使用行為。“非表達(dá)性使用”理論最先由薩格提出,他認(rèn)為“非表達(dá)性使用”仍受專有權(quán)利控制,但可以被認(rèn)定為合理使用。在我國(guó)理論界,起初只是運(yùn)用“非表達(dá)性使用”理論,對(duì)機(jī)器學(xué)習(xí)進(jìn)行類型化分析,認(rèn)為“非表達(dá)型機(jī)器學(xué)習(xí)”屬于“非表達(dá)性使用”,不落入專有權(quán)利的控制范圍,不構(gòu)成侵權(quán);“大眾表達(dá)型機(jī)器學(xué)習(xí)”屬于“表達(dá)性使用”,可以構(gòu)成合理使用;個(gè)人表達(dá)型機(jī)器學(xué)習(xí)由于會(huì)對(duì)作品市場(chǎng)產(chǎn)生替代效果,則排除在合理使用之外。后來(lái),有觀點(diǎn)進(jìn)一步認(rèn)為,所有的機(jī)器學(xué)習(xí)或者模型訓(xùn)練行為都屬于“非表達(dá)性使用”。理由是,其沒(méi)有對(duì)作品中的表達(dá)進(jìn)行理解和欣賞,只是將其作為數(shù)據(jù)而不是作品進(jìn)行使用。因此,不應(yīng)受專有權(quán)利的控制,也就無(wú)需進(jìn)行合理使用分析。更有甚者,再后來(lái),有研究指出“非法表達(dá)性使用”理論依舊沒(méi)有擺脫“實(shí)施復(fù)制即侵權(quán)”的立場(chǎng),應(yīng)當(dāng)在解釋論層面重構(gòu)侵權(quán)判定規(guī)則,將使用作品進(jìn)行數(shù)據(jù)訓(xùn)練的行為排除到“法定利用行為”之外,以實(shí)現(xiàn)GenAI數(shù)據(jù)訓(xùn)練的合法性,而無(wú)需訴諸合理使用判斷。
但是,“著作權(quán)的限縮”方案的落地,需付出巨大的法律成本,不具有現(xiàn)實(shí)可行性。因?yàn)?,要將?shù)據(jù)訓(xùn)練中所涉及的復(fù)制、改編等作品使用行為均排除到著作權(quán)法調(diào)整范圍之外,需要對(duì)著作權(quán)制度原理和分析框架進(jìn)行重塑,這無(wú)法在短時(shí)間內(nèi)形成多數(shù)意見(jiàn),進(jìn)而轉(zhuǎn)化為法律規(guī)則或者裁判思路,用以指導(dǎo)司法實(shí)踐。而且,法官也需要對(duì)此付出大量的認(rèn)知資源,重構(gòu)本應(yīng)由著作權(quán)分析框架提供的結(jié)構(gòu)化背景知識(shí)。
因此,不如依舊承認(rèn),數(shù)據(jù)訓(xùn)練涉及的非傳統(tǒng)的作品使用行為,屬于著作權(quán)法的調(diào)整范疇,受專有權(quán)利的控制,再通過(guò)合理使用規(guī)則豁免其責(zé)任,充分發(fā)揮著作權(quán)法分析框架的認(rèn)知優(yōu)勢(shì),以便為立法和司法提供明確的指導(dǎo)。
(2)事前授權(quán)許可和法定許可:交易成本過(guò)高導(dǎo)致市場(chǎng)失靈
著作權(quán)人大都強(qiáng)烈要求,GenAI開(kāi)發(fā)者應(yīng)當(dāng)事先取得授權(quán)并支付報(bào)酬,方可使用作品進(jìn)行數(shù)據(jù)訓(xùn)練。比如,中國(guó)電子商會(huì)發(fā)布的《生成式人工智能
數(shù)據(jù)應(yīng)用合規(guī)指南》就明確規(guī)定,為防止數(shù)據(jù)用于模型訓(xùn)練引發(fā)著作權(quán)侵權(quán)風(fēng)險(xiǎn),對(duì)處在著作權(quán)保護(hù)期內(nèi)的作品,GenAI開(kāi)發(fā)者應(yīng)主動(dòng)采取措施獲取著作權(quán)人的授權(quán)。再如,中文在線等26家單位于2023年6月共同發(fā)布的有關(guān)GenAI訓(xùn)練數(shù)據(jù)著作權(quán)的倡議書(shū)也強(qiáng)調(diào),GenAI開(kāi)發(fā)者在抓取數(shù)據(jù)時(shí),應(yīng)獲得著作權(quán)人許可。同時(shí),也有不少學(xué)者主張,通過(guò)改良法定許可制度,來(lái)化解數(shù)據(jù)訓(xùn)練的
著作權(quán)風(fēng)險(xiǎn)。相較于事前授權(quán)許可,法定許可的制度優(yōu)勢(shì)在于節(jié)約了取得著作權(quán)人許可的交易成本,但著作權(quán)人仍享有法定的報(bào)酬請(qǐng)求權(quán)。
但是,由于許可和報(bào)酬機(jī)制存在障礙,無(wú)論是事前授權(quán)許可還是法定許可,都存在無(wú)法克服的實(shí)施困境,存在市場(chǎng)失靈現(xiàn)象。具體而言,如果要求事前獲得授權(quán)許可,GenAI開(kāi)發(fā)者就必須與不計(jì)其數(shù)且高度分散的著作權(quán)人挨個(gè)進(jìn)行協(xié)商。在GenAI數(shù)據(jù)訓(xùn)練場(chǎng)景下,這種交易模式存在很大的弊端:一是交易流程的繁瑣導(dǎo)致數(shù)據(jù)獲取的效率低下,無(wú)法滿足GenAI及時(shí)獲取海量作品的需求,從而造成產(chǎn)業(yè)發(fā)展的遲滯;二是海量作品數(shù)據(jù)疊加形成的交易成本畸高,造成“反公地悲劇”。即便采取“法定許可”方案,也無(wú)法克服事前授權(quán)許可存在的交易障礙。理由在于:訓(xùn)練數(shù)據(jù)集往往兼有處于著作權(quán)保護(hù)期內(nèi)的作品和公共領(lǐng)域的素材,GenAI開(kāi)發(fā)者難以確定支付報(bào)酬的數(shù)額以及支付主體;GenAI數(shù)據(jù)訓(xùn)練使用的是海量作品,單個(gè)作品的價(jià)值很低,法定許可的運(yùn)行成本可能遠(yuǎn)高于著作權(quán)人可以取得的報(bào)酬。
綜上所述,基于授權(quán)許可和法定許可獲取作品,均會(huì)使GenAI開(kāi)發(fā)者負(fù)擔(dān)高昂的交易成本,作品交易市場(chǎng)實(shí)際上處于失靈狀態(tài)。而克服市場(chǎng)失靈是合理使用的目標(biāo)。從經(jīng)濟(jì)分析的視角看,如果交易成本足夠低,作品的使用人與著作權(quán)人通過(guò)市場(chǎng)機(jī)制即可實(shí)現(xiàn)雙贏,合理使用就沒(méi)必要存在。只有在出現(xiàn)市場(chǎng)失靈的情況下,才能將特定的受控行為認(rèn)定為合理使用?;诒容^優(yōu)勢(shì)分析,適用合理使用規(guī)則,既無(wú)須取得許可,也無(wú)須支付報(bào)酬,授權(quán)許可和法定許可存在的許可難題和報(bào)酬支付難題被消滅了。因此,可以考慮運(yùn)用著作權(quán)合理使用規(guī)則,消除數(shù)據(jù)訓(xùn)練面臨的著作權(quán)法障礙。
3. 合理使用規(guī)則:存在適用困境但有調(diào)適空間
我國(guó)的著作權(quán)合理使用規(guī)則規(guī)定于現(xiàn)行《著作權(quán)法》第二十四條,經(jīng)過(guò)2020年修訂后,該條吸納了“三步檢驗(yàn)法”。因此,構(gòu)成合理使用須具備三個(gè)要件:“在下列情況下使用作品”;“不得影響該作品的正常使用”;“不
得不合理地?fù)p害著作權(quán)人的合法權(quán)益”。同時(shí),該條還列舉了12種合理使用的“類型化條款”,并且非常謹(jǐn)慎地增設(shè)了“兜底條款”。由此,我國(guó)著作權(quán)合理使用規(guī)則形成了“一般條款+類型化條款+兜底條款”的立法構(gòu)造。按照《著作權(quán)法》第二十四條的文字表述,“在下列情況下使用作品”指的是,法條所列舉的十二項(xiàng)“類型化條款”和“兜底條款”。
但是,由于我國(guó)著作權(quán)合理使用規(guī)則并無(wú)關(guān)于GenAI數(shù)據(jù)訓(xùn)練的“類型化條款”,因此,只能先嘗試通過(guò)解釋論路徑,將其解釋進(jìn)目前的“類型化條款”之中去。與GenAI數(shù)據(jù)訓(xùn)練相關(guān)聯(lián)的“類型化條款”,可能包括“個(gè)人使用”“適當(dāng)引用”“教學(xué)或研究使用”三類。其中,對(duì)于“個(gè)人使用”,其適用主體和適用目的均存在嚴(yán)格限制,而目前從事GenAI數(shù)據(jù)訓(xùn)練的主體,通常不僅限于“自然人”。數(shù)據(jù)訓(xùn)練的目的通常也不屬于“個(gè)人學(xué)習(xí)、研究或者欣賞”的范疇;對(duì)于“適當(dāng)引用”,其目的要件是“為介紹、評(píng)論說(shuō)明某一作品”或者“說(shuō)明某一問(wèn)題”,而GenAI的數(shù)據(jù)訓(xùn)練顯然不符合“適當(dāng)引用”合理使用類型的目的要件;對(duì)于“教學(xué)或科學(xué)研究適用”,其將作品的使用限定在“學(xué)校課堂教學(xué)或者科學(xué)研究”領(lǐng)域,同時(shí)僅允許“少量復(fù)制”。但是,GenAI海量復(fù)制與使用作品的現(xiàn)狀顯然無(wú)法滿足該項(xiàng)要求。因此,我國(guó)著作權(quán)合理使用規(guī)則的“類型化條款”無(wú)法囊括絕大部分的數(shù)據(jù)訓(xùn)練行為。
至于“兜底條款”的適用,從“兜底條款”的文字表述來(lái)看,合理使用的“其他情形”僅限于法律、行政法規(guī)規(guī)定。因此,我國(guó)合理使用規(guī)則的立法構(gòu)造其實(shí)仍采取的是“封閉式”的立法模式,只是將合理使用的開(kāi)放性留給了立法者,而將封閉性留給了法官。如此一來(lái),何謂“特定的特殊情況”,法官一般只能“找法”,而不能“造法”,也就是法官無(wú)權(quán)根據(jù)《著作權(quán)法》第二十四條規(guī)定的“兜底條款”創(chuàng)設(shè)新的合理使用情形。但是,這也表明,合理使用規(guī)則對(duì)使用作品進(jìn)行數(shù)據(jù)訓(xùn)練有適法空間,只不過(guò)必須通過(guò)立法予以明確。
數(shù)據(jù)訓(xùn)練構(gòu)成合理使用的正當(dāng)性
在立法論上,“三步檢驗(yàn)法”是創(chuàng)設(shè)新的合理使用規(guī)則的標(biāo)準(zhǔn)和“過(guò)濾器”。也就是說(shuō),受專有權(quán)利控制的行為,是否具有構(gòu)成合理使用的正當(dāng)性,最終的判斷標(biāo)準(zhǔn),并不是它是否被列舉在《著作權(quán)法》合理使用條款之中,而是能否通過(guò)“三步檢驗(yàn)法”的檢驗(yàn)。基于此,需分析和論證利用作品進(jìn)行數(shù)據(jù)
訓(xùn)練能否通過(guò)“三步檢驗(yàn)法”的檢驗(yàn)。
1. 數(shù)據(jù)訓(xùn)練符合“特定的特殊情況”
“三步檢驗(yàn)法”中的第一步是,應(yīng)當(dāng)將對(duì)合理使用規(guī)則的適用限定在“特定的特殊情況”。“特定的”是指,著作權(quán)法必須明確界定任何一種合理使用情形,也就是通過(guò)立法將合理使用規(guī)則的適用范圍特定化,并為人所知悉。“特殊”則是指“適用范圍或目的是有限的和個(gè)別性的”,不能變成“常態(tài)或
通常情況”。
我國(guó)《著作權(quán)法》第二十四條并未使用“特定的特殊情況”的表述,根據(jù)法條的用語(yǔ),“特定”“特殊”應(yīng)該指的是,法條所列舉的12項(xiàng)“類型化條款”和“兜底條款”。此外,有學(xué)者指出,“特定的特殊情況”是對(duì)作品使用行為目的正當(dāng)性的判斷,即特定的作品使用行為須符合著作權(quán)法的規(guī)范目的。而化解GenAI數(shù)據(jù)訓(xùn)練的著作權(quán)困境,對(duì)于AI產(chǎn)業(yè)發(fā)展、更新內(nèi)容生產(chǎn)模式以及促進(jìn)社會(huì)整體的知識(shí)增值而言,均至關(guān)重要,符合著作權(quán)法的規(guī)范目的。因此,在我國(guó),只要在相關(guān)法律和行政法規(guī)中,增設(shè)具體的數(shù)據(jù)訓(xùn)練合理使用規(guī)則,就可以符合第一步的要求。
2. 數(shù)據(jù)訓(xùn)練與作品的正常利用不相沖突
(1)數(shù)據(jù)訓(xùn)練具有非表達(dá)性
所謂“利用”,指的是著作權(quán)人從行使專有權(quán)利中獲得經(jīng)濟(jì)利益的行為。并且,“利用”必須是著作權(quán)法規(guī)定的法定使用行為。但是,并不是說(shuō)只要能夠獲得經(jīng)濟(jì)利益,并為專有權(quán)利所控制的使用行為,都必然與作品的正常利用相沖突。正確的理解應(yīng)當(dāng)是:只有當(dāng)一種作品使用行為與著作權(quán)人通常從行
使專有權(quán)利中獲取經(jīng)濟(jì)價(jià)值的行為相競(jìng)爭(zhēng),并且致使著作權(quán)人喪失大量的經(jīng)濟(jì)利益時(shí),才達(dá)到了“與作品的正常利用相沖突”的程度。
一般而言,個(gè)性化的表達(dá)構(gòu)成作品的形式和具體內(nèi)容,是作品的主要價(jià)值所在。只有為了欣賞作品的表達(dá)而使用作品,才可能與作品的正常利用相沖突,才能從作品的獨(dú)創(chuàng)性中直接獲益。但是,與傳統(tǒng)的作品使用行為截然不同,使用作品進(jìn)行數(shù)據(jù)訓(xùn)練的行為具有典型的非表達(dá)性,其并不是為了欣賞和理解作品中的獨(dú)創(chuàng)性表達(dá),而是為了挖掘海量作品中的思想、事實(shí)、方法和原則等,從而理解和掌握人類進(jìn)行表達(dá)的規(guī)律和方式,以獲得生成審美價(jià)值的內(nèi)容的能力。審判實(shí)踐中,GenAI開(kāi)發(fā)者也經(jīng)常基于數(shù)據(jù)訓(xùn)練具有的典型的非表達(dá)性,提出合理使用抗辯。比如,Concord Music Group, Inc. v. Anthropic PBC案中,Anthropic公司就認(rèn)為,數(shù)據(jù)訓(xùn)練并不是為了使用歌曲中的表達(dá)性要素,而是為了讓GenAI識(shí)別和理解歌曲中的語(yǔ)言模式,因此其使用的目的具有高度的“轉(zhuǎn)換性”。
(2)數(shù)據(jù)訓(xùn)練具有非傳播性
傳統(tǒng)著作權(quán)法賦予著作權(quán)人諸多專有權(quán)利,其目的并不是使作者絕對(duì)壟斷對(duì)作品的使用,其原則上只限于壟斷“與公眾接觸”的使用。正所謂“無(wú)
傳播也就無(wú)權(quán)利”,通常,只有在作品被公開(kāi)傳播,才能構(gòu)成對(duì)著作權(quán)人作品的市場(chǎng)替代和利益侵害。而GenAI整個(gè)數(shù)據(jù)訓(xùn)練流程對(duì)作品數(shù)據(jù)的使用,是內(nèi)在的、隱含的、非感知的,原則上不與公眾發(fā)生接觸,GenAI開(kāi)發(fā)者既無(wú)動(dòng)機(jī)也沒(méi)必要向公眾傳播和分享原作品的獨(dú)創(chuàng)性表達(dá)。在此情況下,GenAI數(shù)據(jù)訓(xùn)練中的作品使用行為,不追求占據(jù)原作品的市場(chǎng),不會(huì)與作品的正常利用相沖突。在UMG Recordings, Inc. et al v. Uncharted Labs, Inc. et al中,被告就提出抗辯,在公眾不可見(jiàn)的技術(shù)流程中復(fù)制作品應(yīng)當(dāng)屬于合理使用。與此類似,在Andersen v. Stability AI Ltd.中,被告DeviantArt也認(rèn)為,其沒(méi)有以任何方式向公眾傳播用于數(shù)據(jù)訓(xùn)練的作品的表達(dá)。
3. 數(shù)據(jù)訓(xùn)練不會(huì)不合理地?fù)p害著作權(quán)人的合法權(quán)益
(1)不會(huì)損害傳統(tǒng)作品市場(chǎng)中的利益
所謂“不會(huì)不合理地?fù)p害著作權(quán)人的合法權(quán)益”,指的是對(duì)著作權(quán)人的經(jīng)濟(jì)利益影響,是否達(dá)到了“不合理”的程度。如今,作品的市場(chǎng)可區(qū)分為傳統(tǒng)市場(chǎng)和數(shù)據(jù)市場(chǎng)。傳統(tǒng)市場(chǎng)以閱讀作品為核心,以作品所體現(xiàn)出來(lái)的文學(xué)和藝術(shù)等價(jià)值為基礎(chǔ)。而數(shù)據(jù)市場(chǎng)則是把作品作為數(shù)據(jù)要素建立起的數(shù)據(jù)市場(chǎng)。傳統(tǒng)的作品市場(chǎng)以閱讀和欣賞作品為核心,而GenAI訓(xùn)練的過(guò)程具有非公開(kāi)數(shù)據(jù)訓(xùn)練構(gòu)成合理使用的正當(dāng)性。在立法論上,“三步檢驗(yàn)法”是創(chuàng)設(shè)新的合理使用規(guī)則的標(biāo)準(zhǔn)和“過(guò)濾器”。也就是說(shuō),受專有權(quán)利控制的行為,是否具有構(gòu)成合理使用的正當(dāng)性,最終的判斷標(biāo)準(zhǔn),并不是它是否被列舉在《著作權(quán)法》合理使用條款之中,而是能否通過(guò)“三步檢驗(yàn)法”的檢驗(yàn)?;诖?,需分析和論證利用作品進(jìn)行數(shù)據(jù)訓(xùn)練能否通過(guò)“三步檢驗(yàn)法”的檢驗(yàn)。
1. 數(shù)據(jù)訓(xùn)練符合“特定的特殊情況”
“三步檢驗(yàn)法”中的第一步是,應(yīng)當(dāng)將對(duì)合理使用規(guī)則的適用限定在“特定的特殊情況”。“特定的”是指,著作權(quán)法必須明確界定任何一種合理使用情形,也就是通過(guò)立法將合理使用規(guī)則的適用范圍特定化,并為人所知悉。“特殊”則是指“適用范圍或目的是有限的和個(gè)別性的”,不能變成“常態(tài)或
通常情況”。我國(guó)《著作權(quán)法》第二十四條并未使用“特定的特殊情況”的表述,根據(jù)法條的用語(yǔ),“特定”“特殊”應(yīng)該指的是,法條所列舉的12項(xiàng)“類型化條款”和“兜底條款”。此外,有學(xué)者指出,“特定的特殊情況”是對(duì)作品使用行為目的正當(dāng)性的判斷,即特定的作品使用行為須符合著作權(quán)法的規(guī)范目的。而化解GenAI數(shù)據(jù)訓(xùn)練的著作權(quán)困境,對(duì)于AI產(chǎn)業(yè)發(fā)展、更新內(nèi)容生產(chǎn)模式以及促進(jìn)社會(huì)整體的知識(shí)增值而言,均至關(guān)重要,符合著作權(quán)法的規(guī)范目的。因此,在我國(guó),只要在相關(guān)法律和行政法規(guī)中,增設(shè)具體的數(shù)據(jù)訓(xùn)練合理使用規(guī)則,就可以符合第一步的要求。
2. 數(shù)據(jù)訓(xùn)練與作品的正常利用不相沖突
(1)數(shù)據(jù)訓(xùn)練具有非表達(dá)性
所謂“利用”,指的是著作權(quán)人從行使專有權(quán)利中獲得經(jīng)濟(jì)利益的行為。并且,“利用”必須是著作權(quán)法規(guī)定的法定使用行為。但是,并不是說(shuō)只要能夠獲得經(jīng)濟(jì)利益,并為專有權(quán)利所控制的使用行為,都必然與作品的正常利用相沖突。正確的理解應(yīng)當(dāng)是:只有當(dāng)一種作品使用行為與著作權(quán)人通常從行使專有權(quán)利中獲取經(jīng)濟(jì)價(jià)值的行為相競(jìng)爭(zhēng),并且致使著作權(quán)人喪失大量的經(jīng)濟(jì)利益時(shí),才達(dá)到了“與作品的正常利用相沖突”的程度。
一般而言,個(gè)性化的表達(dá)構(gòu)成作品的形式和具體內(nèi)容,是作品的主要價(jià)值所在。只有為了欣賞作品的表達(dá)而使用作品,才可能與作品的正常利用相沖突,才能從作品的獨(dú)創(chuàng)性中直接獲益。但是,與傳統(tǒng)的作品使用行為截然不同,使用作品進(jìn)行數(shù)據(jù)訓(xùn)練的行為具有典型的非表達(dá)性,其并不是為了欣賞和理解作品中的獨(dú)創(chuàng)性表達(dá),而是為了挖掘海量作品中的思想、事實(shí)、方法和原則等,從而理解和掌握人類進(jìn)行表達(dá)的規(guī)律和方式,以獲得生成審美價(jià)值的內(nèi)容的能力。審判實(shí)踐中,GenAI開(kāi)發(fā)者也經(jīng)常基于數(shù)據(jù)訓(xùn)練具有的典型的非表達(dá)性,提出合理使用抗辯。比如,Concord Music Group, Inc. v. Anthropic PBC案中,Anthropic公司就認(rèn)為,數(shù)據(jù)訓(xùn)練并不是為了使用歌曲中的表達(dá)性要素,而是為了讓GenAI識(shí)別和理解歌曲中的語(yǔ)言模式,因此其使用的目的具有高度的“轉(zhuǎn)換性”。
(2)數(shù)據(jù)訓(xùn)練具有非傳播性
傳統(tǒng)著作權(quán)法賦予著作權(quán)人諸多專有權(quán)利,其目的并不是使作者絕對(duì)壟斷對(duì)作品的使用,其原則上只限于壟斷“與公眾接觸”的使用。正所謂“無(wú)
傳播也就無(wú)權(quán)利”,通常,只有在作品被公開(kāi)傳播,才能構(gòu)成對(duì)著作權(quán)人作品的市場(chǎng)替代和利益侵害。而GenAI整個(gè)數(shù)據(jù)訓(xùn)練流程對(duì)作品數(shù)據(jù)的使用,是內(nèi)在的、隱含的、非感知的,原則上不與公眾發(fā)生接觸,GenAI開(kāi)發(fā)者既無(wú)動(dòng)機(jī)也沒(méi)必要向公眾傳播和分享原作品的獨(dú)創(chuàng)性表達(dá)。在此情況下,GenAI數(shù)據(jù)訓(xùn)練中的作品使用行為,不追求占據(jù)原作品的市場(chǎng),不會(huì)與作品的正常利用相沖突。在UMG Recordings, Inc. et al v. Uncharted Labs, Inc. et al中,被告就提出抗辯,在公眾不可見(jiàn)的技術(shù)流程中復(fù)制作品應(yīng)當(dāng)屬于合理使用。與此類似,在Andersen v. Stability AI Ltd.中,被告DeviantArt也認(rèn)為,其沒(méi)有以任何方式向公眾傳播用于數(shù)據(jù)訓(xùn)練的作品的表達(dá)。
3. 數(shù)據(jù)訓(xùn)練不會(huì)不合理地?fù)p害著作權(quán)人的合法權(quán)益
(1)不會(huì)損害傳統(tǒng)作品市場(chǎng)中的利益
所謂“不會(huì)不合理地?fù)p害著作權(quán)人的合法權(quán)益”,指的是對(duì)著作權(quán)人的經(jīng)濟(jì)利益影響,是否達(dá)到了“不合理”的程度。如今,作品的市場(chǎng)可區(qū)分為傳統(tǒng)市場(chǎng)和數(shù)據(jù)市場(chǎng)。傳統(tǒng)市場(chǎng)以閱讀作品為核心,以作品所體現(xiàn)出來(lái)的文學(xué)和藝術(shù)等價(jià)值為基礎(chǔ)。而數(shù)據(jù)市場(chǎng)則是把作品作為數(shù)據(jù)要素建立起的數(shù)據(jù)市場(chǎng)。傳統(tǒng)的作品市場(chǎng)以閱讀和欣賞作品為核心,而GenAI訓(xùn)練的過(guò)程具有非公開(kāi)都主張放開(kāi)對(duì)“三步檢驗(yàn)法”的限制,采用開(kāi)放式立法的模式,賦予法官在個(gè)案中創(chuàng)設(shè)新的合理使用情形的裁判權(quán)。但是,我國(guó)負(fù)有遵守“三步檢驗(yàn)法”的國(guó)際義務(wù),必須嚴(yán)格限制著作權(quán)合理使用規(guī)則的適用。并且,我國(guó)并非判例法國(guó)家,在過(guò)去封閉式立法模式之下,我國(guó)司法實(shí)踐并未積累足夠的依據(jù)個(gè)案認(rèn)定“合理使用”的經(jīng)驗(yàn)。
因此,為數(shù)據(jù)訓(xùn)練設(shè)置著作權(quán)合理使用規(guī)則,應(yīng)當(dāng)專門(mén)增設(shè)一個(gè)“類型化條款”,明確數(shù)據(jù)訓(xùn)練合理使用規(guī)則的構(gòu)成要件,保證法官在認(rèn)定數(shù)據(jù)訓(xùn)練構(gòu)成合理使用時(shí),有明確的法律依據(jù)。
(2)在AI專門(mén)立法中增設(shè)數(shù)據(jù)訓(xùn)練合理使用規(guī)則
關(guān)于如何增設(shè)合理使用規(guī)則,我國(guó)學(xué)者多主張,應(yīng)以我國(guó)《著作權(quán)法》第二十四條規(guī)定的“兜底條款”為制度接口,通過(guò)修改《中華人民共和國(guó)著作權(quán)法實(shí)施條例》來(lái)進(jìn)行。而本文認(rèn)為,在AI相關(guān)立法中構(gòu)建合理使用規(guī)則可能更為適宜。理由在于:
一是該合理使用規(guī)則本就是為因應(yīng)人工智能產(chǎn)業(yè)發(fā)展而設(shè)置的,制度建構(gòu)不應(yīng)局限于傳統(tǒng)部門(mén)法的固有理念和調(diào)整思路,而應(yīng)當(dāng)從個(gè)體權(quán)利保護(hù)思路轉(zhuǎn)向數(shù)據(jù)要素利用思路。
二是諸如著作權(quán)、個(gè)人信息權(quán)益以及隱私權(quán)等諸多在先權(quán)利交織疊加在訓(xùn)練數(shù)據(jù)集上,規(guī)則的設(shè)計(jì)必須考慮到著作權(quán)、個(gè)人信息權(quán)益等各項(xiàng)權(quán)利內(nèi)容數(shù)字化后的共性,進(jìn)行統(tǒng)一建構(gòu),以避免部門(mén)法“各自為政”的缺陷。
2. 數(shù)據(jù)訓(xùn)練著作權(quán)合理使用規(guī)則的設(shè)計(jì)
(1)適用條件:可以適用于營(yíng)利性行為
為了給AI產(chǎn)業(yè)創(chuàng)造寬松的制度環(huán)境,在建立數(shù)據(jù)訓(xùn)練合理使用規(guī)則時(shí),不應(yīng)將之限制在科學(xué)研究機(jī)構(gòu)的非營(yíng)利的科研活動(dòng)中。因?yàn)?,基于?dāng)前我國(guó)GenAI開(kāi)發(fā)的產(chǎn)業(yè)實(shí)踐,除了由國(guó)家財(cái)政扶持的科學(xué)研究機(jī)構(gòu)有海量數(shù)據(jù)的需
求外,其他營(yíng)利性機(jī)構(gòu)也有使用海量數(shù)據(jù)的需求,它們也會(huì)承擔(dān)服務(wù)國(guó)家需求的AI技術(shù)的研發(fā)和應(yīng)用任務(wù)。比如,科技部主導(dǎo)下的“新一代AI開(kāi)放創(chuàng)新平臺(tái)”,依托的均為諸如百度、阿里云、商湯等商業(yè)性互聯(lián)網(wǎng)公司,如果將其排除在合理使用之外,肯定不符合我國(guó)AI發(fā)展現(xiàn)狀和布局。另外,如果將營(yíng)利機(jī)構(gòu)和企業(yè)排除在外,這些營(yíng)利機(jī)構(gòu)和企業(yè)就有可能將相關(guān)產(chǎn)業(yè)轉(zhuǎn)移至法律制度寬松的國(guó)家和地區(qū),例如被稱為“機(jī)器學(xué)習(xí)和文本數(shù)據(jù)挖掘天堂”的日本,這勢(shì)必會(huì)遲滯我國(guó)GenAI產(chǎn)業(yè)的發(fā)展。
(2)適用行為:合理界定應(yīng)包括的作品使用行為
GenAI的“輸入端”,可能涉及對(duì)作品的復(fù)制、改編等諸多著作權(quán)法意義上的行為,對(duì)“輸入端”的作品使用行為應(yīng)當(dāng)進(jìn)行整體考察,側(cè)重一系列作品使用行為的整體效果。所以,針對(duì)數(shù)據(jù)訓(xùn)練的合理使用是涵蓋多項(xiàng)權(quán)利的
一攬子侵權(quán)豁免,而不是僅指復(fù)制權(quán)等單項(xiàng)權(quán)利的侵權(quán)豁免。歐盟的《單一數(shù)字市場(chǎng)版權(quán)指令》僅將“文本與數(shù)據(jù)挖掘例外”的適用行為規(guī)定為“復(fù)制和提取”,顯然無(wú)法囊括GenAI數(shù)據(jù)訓(xùn)練所涉及的所有作品使用行為。我國(guó)不應(yīng)效仿歐盟對(duì)使用行為進(jìn)行過(guò)度的限定,而應(yīng)盡可能囊括GenAI數(shù)據(jù)訓(xùn)練過(guò)程中涉及的作品使用行為。
因此,建議應(yīng)采取概括性的表述,僅強(qiáng)調(diào),在機(jī)器學(xué)習(xí)、文本數(shù)據(jù)挖掘等計(jì)算機(jī)分析過(guò)程中,使用他人已經(jīng)發(fā)表的作品的,構(gòu)成合理使用。但是,應(yīng)將傳播行為排除在外。
(3)限制要件:強(qiáng)調(diào)數(shù)據(jù)來(lái)源的合法性
關(guān)于作品數(shù)據(jù)是否應(yīng)當(dāng)具有合法來(lái)源,境外立法均持肯定態(tài)度。《辦法》第七條也要求,應(yīng)當(dāng)“使用具有合法來(lái)源的數(shù)據(jù)”。但是,何謂“具有合法來(lái)源的數(shù)據(jù)”,《辦法》并沒(méi)有明確的規(guī)定。本文認(rèn)為,數(shù)據(jù)來(lái)源的合法
性并不等同于必須獲得權(quán)利人的明確授權(quán),而是強(qiáng)調(diào)作品數(shù)據(jù)的“合法獲取”,即需要合法購(gòu)買(mǎi)作品復(fù)制件或者至少取得合法接觸作品的權(quán)利。
引入“合法獲取”概念,有助于實(shí)現(xiàn)著作權(quán)人對(duì)作品的控制,使非法的作品抓取和收集行為的責(zé)任不再被豁免。同時(shí),也可以為著作權(quán)人與GenAI開(kāi)發(fā)者保留一定的自由協(xié)商的制度空間,為AI時(shí)代著作權(quán)利益分配機(jī)制的構(gòu)建留有余地,這對(duì)于平衡著作權(quán)人利益和GenAI產(chǎn)業(yè)的發(fā)展至關(guān)重要。
(4)不宜設(shè)置著作權(quán)人的聲明退出機(jī)制
歐盟《單一數(shù)字市場(chǎng)版權(quán)指令》針對(duì)“非科研目的的使用”,規(guī)定了著作權(quán)人享有聲明退出的權(quán)利。并且,歐盟《人工智能法案》又在“鑒于”部分的第105條、第106條、第107條以及第108條中,反復(fù)強(qiáng)調(diào)設(shè)置著作權(quán)人聲明退出機(jī)制的重要性。為緩解著作權(quán)人對(duì)該合理使用規(guī)則的抵觸情緒,我國(guó)也有學(xué)者主張借鑒歐盟的做法,為數(shù)據(jù)訓(xùn)練的合理使用規(guī)則設(shè)置一個(gè)“附加退出機(jī)
制”。但是,“聲明退出機(jī)制”存在被著作權(quán)人濫用的風(fēng)險(xiǎn),這相當(dāng)于賦予了著作權(quán)人排除合理使用規(guī)則適用的權(quán)利,由此可能導(dǎo)致合理使用規(guī)則的實(shí)施效果大打折扣。并且,強(qiáng)調(diào)作品數(shù)據(jù)來(lái)源的合法性或者“合法獲取”,足以讓著作權(quán)人從作品的使用中獲益。因此,我國(guó)的GenAI數(shù)據(jù)訓(xùn)練合理使用規(guī)則,不宜設(shè)置著作權(quán)人的聲明退出機(jī)制。
綜上所述,建議在AI專門(mén)立法中,為數(shù)據(jù)訓(xùn)練增設(shè)具體的合理使用規(guī)則,規(guī)則可表述為:“為進(jìn)行機(jī)器學(xué)習(xí)、文本與數(shù)據(jù)挖掘等計(jì)算機(jī)信息處理,使用具有合法來(lái)源并已經(jīng)發(fā)表的作品的,并且不影響該作品的正常使用,也沒(méi)有不合理地?fù)p害著作權(quán)人的合法權(quán)益,則該使用行為屬于合理使用。但不得以廣播、信息網(wǎng)絡(luò)傳播等傳播方式向公眾提供該作品。”同時(shí),應(yīng)當(dāng)認(rèn)識(shí)到,單純的合理使用規(guī)則仍不足以保障GenAI獲得充分的作品數(shù)據(jù)。只有建立專門(mén)的數(shù)據(jù)流通和利用規(guī)則,推進(jìn)高質(zhì)量的中文數(shù)據(jù)庫(kù)建設(shè),讓海量、類型多樣和權(quán)利人分散的作品數(shù)據(jù)聚合起來(lái)、流動(dòng)起來(lái),方能充分實(shí)現(xiàn)作品數(shù)據(jù)要素的價(jià)值。
