生成式人工智能對(duì)著作權(quán)制度的沖擊,主要體現(xiàn)在輸出端的可版權(quán)性認(rèn)定和輸入端的大模型訓(xùn)練使用作品的合法性認(rèn)定兩個(gè)層面。隨著近年來(lái)司法實(shí)踐的不斷探索,從輸出端看,人工智能生成內(nèi)容的可版權(quán)性問(wèn)題已有基本共識(shí)。我國(guó)法院在認(rèn)定時(shí),已根據(jù)個(gè)案在可版權(quán)性上作出了不同的判定,并未絕對(duì)判定使用者通過(guò)提供和調(diào)整提示語(yǔ)的方式利用人工智能生成內(nèi)容就一定構(gòu)成作品。但從輸入端看,生成式人工智能算法所需要的大模型訓(xùn)練給著作權(quán)制度帶來(lái)的挑戰(zhàn)卻尚未取得共識(shí)。

作者簡(jiǎn)介:熊琦,中國(guó)人民大學(xué)法學(xué)博士,華中科技大學(xué)法學(xué)院教授,博士生導(dǎo)師,副院長(zhǎng),知識(shí)產(chǎn)權(quán)學(xué)科帶頭人,第六屆湖北省十佳優(yōu)秀中青年法學(xué)工作者,華中卓越學(xué)者。
AI訓(xùn)練使用作品引發(fā)爭(zhēng)議
生成式人工智能算法的成型,需要以海量數(shù)據(jù)“喂養(yǎng)”為前提。所以,要訓(xùn)練人工智能來(lái)完成類(lèi)似人類(lèi)的表達(dá),不可避免需要在事前復(fù)制和分析大量人類(lèi)創(chuàng)作的已有作品,由此產(chǎn)生了這種大規(guī)模使用作品是否合法的爭(zhēng)議。
2023年12月,《紐約時(shí)報(bào)》起訴OpenAI和微軟公司未經(jīng)許可使用《紐約時(shí)報(bào)》的文章來(lái)訓(xùn)練 GPT大語(yǔ)言模型,開(kāi)啟了全球媒體機(jī)構(gòu)起訴生成式人工智能侵犯著作權(quán)的先例,也標(biāo)志著著作權(quán)合理使用制度需要再次起到版權(quán)產(chǎn)業(yè)與新興產(chǎn)業(yè)調(diào)節(jié)器的作用。全球范圍內(nèi)大模型訓(xùn)練合理使用爭(zhēng)議案件已大量出現(xiàn),但從域外已有的判例來(lái)看,認(rèn)定合理使用和認(rèn)定侵權(quán)兼有之。針對(duì)這些案件的討論不但關(guān)乎模型訓(xùn)練在現(xiàn)有法律體系內(nèi)的解釋和認(rèn)定,更關(guān)乎人工智能產(chǎn)業(yè)能否在可控成本內(nèi)完成模型訓(xùn)練。
合理使用認(rèn)定涉及的三個(gè)問(wèn)題
在上述問(wèn)題上,版權(quán)產(chǎn)業(yè)主體與人工智能產(chǎn)業(yè)主體各執(zhí)一詞,反映出傳統(tǒng)產(chǎn)業(yè)和新興產(chǎn)業(yè)在版權(quán)利益分配上走到了一個(gè)新的十字路口。著作權(quán)人一方認(rèn)為,上述新生成的內(nèi)容對(duì)其作品的市場(chǎng)產(chǎn)生了替代效應(yīng),并對(duì)著作權(quán)人的收益帶來(lái)了消極影響。而人工智能產(chǎn)業(yè)一方則認(rèn)為人工智能所生成的內(nèi)容與原作品并不構(gòu)成實(shí)質(zhì)性相似,因此并不存在任何著作權(quán)侵權(quán)行為。從現(xiàn)有的判例來(lái)看,合理使用認(rèn)定需要依次回應(yīng)以下三個(gè)問(wèn)題。
第一,機(jī)器學(xué)習(xí)過(guò)程中是否復(fù)制了原作品的表達(dá)。這一問(wèn)題的核心,在于分辨機(jī)器學(xué)習(xí)究竟僅使用了作品的功能性元素還是創(chuàng)造性表達(dá)。針對(duì)這一問(wèn)題,無(wú)論是美國(guó)和歐盟的相關(guān)報(bào)告還是最新案例,都認(rèn)為機(jī)器學(xué)習(xí)之所以將海量作品納入,是因?yàn)樽髌匪芴峁┑呢S富表達(dá)可以幫助人工智能獲得語(yǔ)言概念之間的關(guān)聯(lián)性,以此模擬人類(lèi)的表達(dá)方式。以往將機(jī)器學(xué)習(xí)對(duì)作品的使用認(rèn)定為“非表達(dá)性使用”的觀點(diǎn)在近期的判例中已極少獲得認(rèn)同。
第二,機(jī)器學(xué)習(xí)使用作品是否構(gòu)成使用目的的轉(zhuǎn)換。這一問(wèn)題的核心,在于確定機(jī)器學(xué)習(xí)與人類(lèi)學(xué)習(xí)是否存在差別。鑒于美國(guó)版權(quán)法判例中創(chuàng)設(shè)的轉(zhuǎn)換性使用和日本著作權(quán)法修改中增設(shè)的“非享受性使用”,這似乎使得擁有上述抽象判定要素的規(guī)范能夠在司法實(shí)踐中更容易通過(guò)法律解釋涵蓋新的使用方式:一旦使用目的發(fā)生了轉(zhuǎn)換,合理使用認(rèn)定的可能性就可能增加。但實(shí)際情況卻是由于版權(quán)產(chǎn)業(yè)與人工智能產(chǎn)業(yè)的分歧難以調(diào)和,司法裁判的結(jié)果也有差異。全球?qū)嵺`中,不同法系對(duì)上述問(wèn)題的認(rèn)定存在顯著差異。美國(guó)法院在新近生效判決中就認(rèn)為,人工智能大模型訓(xùn)練和自然人的閱讀和學(xué)習(xí)本質(zhì)相同,訓(xùn)練過(guò)程中對(duì)作品的使用乃是為生成新內(nèi)容做準(zhǔn)備,如果自然人使用作品進(jìn)行學(xué)習(xí)和培訓(xùn)不構(gòu)成侵權(quán),那么大模型訓(xùn)練也應(yīng)當(dāng)被如此看待。模型訓(xùn)練在使用作品目的上具有高度轉(zhuǎn)換性,因此在合理使用的認(rèn)定時(shí)可以降低對(duì)人工智能產(chǎn)業(yè)主體商業(yè)性使用的考量。但我國(guó)與歐盟等諸多作者權(quán)法體系下的著作權(quán)例外立法體例,采取的是具體列舉的方式,因此都存在現(xiàn)行立法中缺乏能夠納入模型訓(xùn)練的合適條款。針對(duì)歐盟近期的相關(guān)判決,歐盟有報(bào)告專(zhuān)門(mén)指出,當(dāng)前歐盟著作權(quán)指令中的文本和數(shù)據(jù)挖掘例外條款并非為適應(yīng)生成式人工智能訓(xùn)練的表達(dá)性和合成性而設(shè)計(jì),將其適用于此類(lèi)系統(tǒng)可能扭曲歐盟著作權(quán)例外的目的和限制。立法者需要考慮在具體列舉的著作權(quán)例外情形中專(zhuān)門(mén)增加針對(duì)模型訓(xùn)練的條款。
第三,基于模型訓(xùn)練所構(gòu)建的生成式人工智能算法,所生成的內(nèi)容是否構(gòu)成對(duì)原作品著作權(quán)市場(chǎng)的替代。無(wú)論在作者權(quán)法體系還是版權(quán)法體系下,是否對(duì)原作品著作權(quán)市場(chǎng)造成消極影響一直是認(rèn)定合理使用是否成立的核心要素。在針對(duì)模型訓(xùn)練使用作品是否會(huì)對(duì)原作品著作權(quán)市場(chǎng)帶來(lái)影響這一問(wèn)題,著作權(quán)人一方的憂(yōu)慮在于當(dāng)人工智能能夠以極低成本隨意生成海量作品時(shí),將會(huì)對(duì)原作品的著作權(quán)市場(chǎng)產(chǎn)生替代,從而顯著削弱對(duì)人類(lèi)創(chuàng)作的激勵(lì)。美國(guó)版權(quán)局在今年發(fā)布的人工智能與版權(quán)系列報(bào)告中明確提出,使用作品進(jìn)行大模型訓(xùn)練可能影響這些作品市場(chǎng)價(jià)值的實(shí)現(xiàn),包括銷(xiāo)售損失、市場(chǎng)稀釋和許可機(jī)會(huì)的喪失。所以是否構(gòu)成合理使用需要在個(gè)案中根據(jù)具體情形來(lái)認(rèn)定。但在近期的相關(guān)判決中,美國(guó)和歐盟多起案件的司法裁判結(jié)論都已傾向于認(rèn)定利用人工智能生成海量新內(nèi)容并不意味著對(duì)原作品著作權(quán)市場(chǎng)形成替代,只有在新內(nèi)容與原作品構(gòu)成實(shí)質(zhì)性相似的前提下,才會(huì)從輸出端的角度認(rèn)定侵權(quán)行為的存在。
我國(guó)應(yīng)對(duì)路徑的建議
總體而言,生成式人工智能依賴(lài)海量作品進(jìn)行模型訓(xùn)練引發(fā)的著作權(quán)爭(zhēng)議,仍然延續(xù)了新技術(shù)帶來(lái)的版權(quán)產(chǎn)業(yè)與新興產(chǎn)業(yè)利益博弈。
從廣播技術(shù)時(shí)代因錄像設(shè)備普及帶來(lái)的爭(zhēng)議到網(wǎng)絡(luò)時(shí)代社交媒體引發(fā)的二創(chuàng)風(fēng)波,合理使用制度都在其中充當(dāng)了調(diào)節(jié)器的角色。但這種調(diào)節(jié)在堅(jiān)守法律規(guī)范的同時(shí),也當(dāng)然包含各國(guó)根據(jù)自身產(chǎn)業(yè)發(fā)展階段做出的政策考量。從此次人工智能技術(shù)帶來(lái)的沖擊看,人工智能技術(shù)領(lǐng)先型和技術(shù)追趕型國(guó)家均在不同程度上放寬了對(duì)作品使用目的和使用程度的限制,將模型訓(xùn)練與搜索引擎等歷史上新技術(shù)的適用進(jìn)行類(lèi)比,作品復(fù)制被視為技術(shù)開(kāi)發(fā)的中間步驟。在該步驟中,復(fù)制作品的目的并非是享受作品的表達(dá),也未使新的受眾接觸原作品內(nèi)容,而是利用訓(xùn)練數(shù)據(jù)中所得出的抽象信息來(lái)創(chuàng)建新內(nèi)容。同時(shí),生成式人工智能對(duì)原作品的風(fēng)格模仿乃是為創(chuàng)作工具技術(shù)迭代的結(jié)果,只要沒(méi)有故意對(duì)模型訓(xùn)練進(jìn)行調(diào)整來(lái)生成實(shí)質(zhì)性相似的新內(nèi)容,就不應(yīng)視為會(huì)侵害著作權(quán)人可預(yù)期的市場(chǎng)利益。
對(duì)于我國(guó)而言,現(xiàn)今在版權(quán)制度上面臨的重大挑戰(zhàn)一方面在于如何確立針對(duì)模型訓(xùn)練階段大規(guī)模使用作品的政策立場(chǎng),另一方面在于我國(guó)著作權(quán)法合理使用條款中缺乏能夠直接適用于模型訓(xùn)練的例外條款?,F(xiàn)行法律中已有的“個(gè)人學(xué)習(xí)”與“科學(xué)研究”條款難以適配人工智能的商業(yè)開(kāi)發(fā)需求。簡(jiǎn)單采取擴(kuò)大解釋或類(lèi)推解釋的方法,容易導(dǎo)致認(rèn)定標(biāo)準(zhǔn)的混亂和司法裁量權(quán)的不當(dāng)擴(kuò)大與模糊化。所以我國(guó)首先應(yīng)秉持技術(shù)趕超型國(guó)家的政策立場(chǎng),在不損害版權(quán)人合法權(quán)益的前提下,允許人工智能在學(xué)習(xí)和創(chuàng)造過(guò)程中對(duì)現(xiàn)有作品進(jìn)行有限度的使用,從而推動(dòng)新技術(shù)的發(fā)展并最終實(shí)現(xiàn)社會(huì)整體利益最大化。然后結(jié)合生成式人工智能的技術(shù)特性和實(shí)際應(yīng)用,對(duì)模型訓(xùn)練進(jìn)行類(lèi)型化分析,在充分考慮本土產(chǎn)業(yè)特點(diǎn)和已有域外經(jīng)驗(yàn)的基礎(chǔ)上,在我國(guó)著作權(quán)法實(shí)施條例中或增設(shè)專(zhuān)門(mén)針對(duì)機(jī)器學(xué)習(xí)和模型訓(xùn)練的合理使用條款,或增設(shè)更為寬泛的“非享受性使用”條款,允許不損害作品表達(dá)價(jià)值的商業(yè)性使用,既避免法律過(guò)度干預(yù)技術(shù)發(fā)展,又通過(guò)合理使用動(dòng)態(tài)平衡機(jī)制維護(hù)對(duì)創(chuàng)作的持續(xù)激勵(lì),實(shí)現(xiàn)技術(shù)創(chuàng)新與著作權(quán)保護(hù)在制度層面的協(xié)調(diào)融通。
