人工智能(AI)作為新一輪科技革命和產(chǎn)業(yè)革命的重要驅(qū)動(dòng)力,目前已成為全球科技、經(jīng)濟(jì)以及宏觀政策布局所關(guān)注的領(lǐng)域。算力、算法和數(shù)據(jù)作為人工智能產(chǎn)業(yè)發(fā)展的基礎(chǔ)設(shè)施和生產(chǎn)要素,是決定人工智能產(chǎn)業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展的重要保障。數(shù)據(jù)要素因包含了版權(quán)保護(hù)客體,引發(fā)了人工智能產(chǎn)業(yè)是否需要取得權(quán)利人授權(quán)并支付報(bào)酬的爭(zhēng)論。如何在強(qiáng)化數(shù)據(jù)供給的過(guò)程中保障版權(quán)權(quán)利人的權(quán)益,是在促進(jìn)人工智能產(chǎn)業(yè)發(fā)展過(guò)程中需要面對(duì)的問(wèn)題。
作者簡(jiǎn)介:李陶,中央財(cái)經(jīng)大學(xué)法學(xué)院副教授,中南財(cái)經(jīng)政法大學(xué)知識(shí)產(chǎn)權(quán)研究中心研究員,碩士生導(dǎo)師;主要研究領(lǐng)域:知識(shí)產(chǎn)權(quán)法、反不正當(dāng)競(jìng)爭(zhēng)法、反壟斷法;華中科技大學(xué)法學(xué)碩士和法學(xué)學(xué)士,德國(guó)慕尼黑大學(xué)法學(xué)博士;兼任中國(guó)電影著作權(quán)協(xié)會(huì)法律工作委員會(huì)副主任等。 數(shù)據(jù)要素包含版權(quán)保護(hù)客體
人工智能模型訓(xùn)練需要海量的優(yōu)質(zhì)數(shù)據(jù)。數(shù)據(jù)集中除了自然人和法人的行為數(shù)據(jù)外,亦包含文字、圖片、影視、音樂(lè)等受版權(quán)保護(hù)的客體。這些客體是人工智能模型訓(xùn)練和語(yǔ)料庫(kù)建設(shè)中的關(guān)鍵性要素:從“量”的角度看,人工智能模型訓(xùn)練只有盡可能多地使用這些數(shù)據(jù),才能提升模型運(yùn)算的效率,為用戶提供全面的信息;從“質(zhì)”的角度看,人工智能模型訓(xùn)練的可靠性依賴高質(zhì)量的優(yōu)質(zhì)數(shù)據(jù),越是傳播效率高的優(yōu)質(zhì)版權(quán)客體,越能提升人工智能模型生成結(jié)果的可靠性和準(zhǔn)確性。由于版權(quán)保護(hù)客體能夠滿足人工智能模型訓(xùn)練對(duì)高質(zhì)量數(shù)據(jù)的需要,因此成為了人工智能模型訓(xùn)練中的關(guān)鍵性生產(chǎn)資料。版權(quán)保護(hù)客體包括作品(文字、音樂(lè)、美術(shù)等)和鄰接權(quán)保護(hù)客體(錄音錄像制品、廣播電視節(jié)目等)。在我國(guó),自然人作品的保護(hù)期是作者終生及其死亡后五十年,鄰接權(quán)保護(hù)客體的保護(hù)期則是十年到五十年不等。目前產(chǎn)業(yè)中的文字生成軟件、圖像生成軟件、音樂(lè)生成軟件、視頻生成軟件都需要以版權(quán)保護(hù)客體作為訓(xùn)練數(shù)據(jù)進(jìn)行前期訓(xùn)練。
模型訓(xùn)練存在侵權(quán)風(fēng)險(xiǎn)
版權(quán)包括發(fā)表權(quán)、署名權(quán)、修改權(quán)、保護(hù)作品完整權(quán)四項(xiàng)人身權(quán),以及復(fù)制權(quán)、信息網(wǎng)絡(luò)傳播權(quán)、改編權(quán)、翻譯權(quán)、匯編權(quán)等財(cái)產(chǎn)權(quán)。在人工智能模型訓(xùn)練的過(guò)程中,會(huì)涉及上述版權(quán)所包含的權(quán)項(xiàng)。依據(jù)我國(guó)現(xiàn)行著作權(quán)法,使用者的開發(fā)利用行為如涉及上述權(quán)項(xiàng),除存在版權(quán)合理使用情形外,均需要取得權(quán)利人授權(quán)并支付報(bào)酬。從人工智能模型開發(fā)者的角度看,實(shí)踐中其要么與權(quán)利人簽訂了商業(yè)利用版權(quán)保護(hù)客體的許可合同,要么通過(guò)技術(shù)手段從網(wǎng)上爬取所需要的數(shù)據(jù)或從第三方處購(gòu)買所需要的數(shù)據(jù)使用權(quán)。在這一過(guò)程中,第三方是否有權(quán)許可他人使用版權(quán)客體用于模型訓(xùn)練在很多情況下存疑。此外,模型開發(fā)者是否能夠?qū)⑽唇?jīng)授權(quán)從網(wǎng)上爬取的數(shù)據(jù)用于模型訓(xùn)練也存在爭(zhēng)議。
能夠?yàn)槭褂眯袨樘峁┗砻獾暮侠硎褂弥贫?,是眾多未取得授?quán)而使用版權(quán)保護(hù)客體進(jìn)行模型訓(xùn)練的主體在面臨版權(quán)侵權(quán)指控時(shí)所運(yùn)用的抗辯理由。實(shí)踐中,有一些國(guó)家的司法判決認(rèn)為,大模型對(duì)作品的使用屬于對(duì)作品獨(dú)創(chuàng)性表達(dá)的非表達(dá)性使用,且數(shù)據(jù)訓(xùn)練只是對(duì)語(yǔ)料數(shù)據(jù)做結(jié)構(gòu)性特征的分析,此種行為應(yīng)當(dāng)認(rèn)定為合理使用。對(duì)該觀點(diǎn),我國(guó)學(xué)界和產(chǎn)業(yè)界持謹(jǐn)慎態(tài)度,相關(guān)行為是否屬于合理使用的共識(shí)尚未形成。一方面,許多模型訓(xùn)練的開發(fā)者已經(jīng)與高質(zhì)量語(yǔ)料庫(kù)的權(quán)利人簽訂了版權(quán)保護(hù)客體的數(shù)據(jù)訓(xùn)練使用許可協(xié)議,如該觀點(diǎn)成立,則意味著其前期基于語(yǔ)料庫(kù)采購(gòu)所形成的競(jìng)爭(zhēng)優(yōu)勢(shì)將不復(fù)存在;另一方面,版權(quán)權(quán)利人也擔(dān)心后續(xù)模型訓(xùn)練所生成的內(nèi)容,會(huì)對(duì)其創(chuàng)作行為所反映的使用價(jià)值產(chǎn)生影響。此外,相關(guān)判決的說(shuō)理忽視了人工智能模型訓(xùn)練需以對(duì)版權(quán)保護(hù)客體進(jìn)行復(fù)制為前提。該復(fù)制行為因服務(wù)于后續(xù)產(chǎn)品開發(fā)和服務(wù)提供而具有獨(dú)立的經(jīng)濟(jì)價(jià)值,因此屬于對(duì)復(fù)制權(quán)的侵犯。
分類施策合理規(guī)制
從制度供給的角度看,各國(guó)立法者已經(jīng)意識(shí)到了版權(quán)保護(hù)客體在人工智能模型開發(fā)利用中的價(jià)值以及其中所存在的問(wèn)題,已有立法者對(duì)本國(guó)的版權(quán)制度進(jìn)行了調(diào)整與創(chuàng)新,以回應(yīng)產(chǎn)業(yè)發(fā)展和權(quán)利保護(hù)需求。在尊重知識(shí)產(chǎn)權(quán)的前提下,以實(shí)現(xiàn)利益平衡為共識(shí),是在版權(quán)制度框架下解決人工智能模型訓(xùn)練中版權(quán)問(wèn)題的出發(fā)點(diǎn)。對(duì)此,結(jié)合版權(quán)制度已有的規(guī)范工具,針對(duì)不同人工智能模型對(duì)特定版權(quán)保護(hù)客體的依賴程度和人工智能模型本身的用途,分類施策應(yīng)是未來(lái)合理的規(guī)制路徑。
首先,應(yīng)當(dāng)充分挖掘合理使用的適用潛力,對(duì)特定主體通過(guò)人工智能技術(shù)、為滿足特定目的使用版權(quán)保護(hù)客體的行為予以豁免。從已有域外立法的角度看,該豁免所適用的領(lǐng)域,應(yīng)在滿足“三步檢驗(yàn)法”的前提下確定。“三步檢驗(yàn)法”作為國(guó)際領(lǐng)域確定版權(quán)合理使用的標(biāo)準(zhǔn),《保護(hù)文學(xué)和藝術(shù)作品伯爾尼公約》第九條第二款對(duì)此進(jìn)行了規(guī)定。其主要包括以下三個(gè)步驟。第一,合理使用只能在某些特殊情況下使用。對(duì)此,公約并沒(méi)有具體規(guī)定哪些情況屬于特殊情況,但根據(jù)各國(guó)立法,通常包括個(gè)人學(xué)習(xí)、研究或欣賞,介紹、評(píng)論某一作品或說(shuō)明某一問(wèn)題,報(bào)道時(shí)事新聞,學(xué)校課堂教學(xué)或科學(xué)研究中的翻譯,圖書館的陳列、保存或其他非營(yíng)利性目的等。第二,合理使用不得與作品的正常利用相沖突,即合理使用不能影響作品的正常市場(chǎng)或商業(yè)價(jià)值。例如,不能因?yàn)楹侠硎褂枚鴮?dǎo)致作品的銷售量下降或市場(chǎng)價(jià)值受損。第三,合理使用不得損害版權(quán)權(quán)利人的合法權(quán)益,即合理使用不能侵犯版權(quán)人的署名權(quán)、保護(hù)作品完整權(quán)等合法權(quán)益。
其次,應(yīng)當(dāng)引入新型法定許可制度,為特定場(chǎng)景下人工智能模型的開發(fā)者創(chuàng)造使用版權(quán)保護(hù)客體的渠道。法定許可制度具有平衡產(chǎn)業(yè)主體利益的功能,在適用法定許可的場(chǎng)景下,使用人無(wú)需取得權(quán)利人的一對(duì)一授權(quán),而只需要向權(quán)利人支付合理的報(bào)酬。在不少國(guó)家和地區(qū),法定許可費(fèi)用的支付及其標(biāo)準(zhǔn)的確定,多由著作權(quán)集體管理組織負(fù)責(zé)。著作權(quán)集體管理組織作為權(quán)利人和使用者之間的橋梁與紐帶,具有保障權(quán)利人權(quán)益、平衡權(quán)利人與使用者利益、促進(jìn)版權(quán)保護(hù)客體高效傳播與利用的功能。著作權(quán)集體管理組織的運(yùn)行受到專門性規(guī)范的調(diào)整(在我國(guó)為《著作權(quán)集體管理?xiàng)l例》),并接受市場(chǎng)監(jiān)管部門和行業(yè)主管部門的監(jiān)督。
此外,還應(yīng)當(dāng)保留版權(quán)權(quán)利人和人工智能模型訓(xùn)練開發(fā)者針對(duì)特定模型開發(fā)的協(xié)商許可機(jī)制,以針對(duì)某類具體版權(quán)保護(hù)客體的人工智能應(yīng)用進(jìn)行授權(quán)。對(duì)此應(yīng)當(dāng)注意到,人工智能模型具有多樣性的特點(diǎn),如果某種人工智能模型對(duì)特定作品具有高度的依賴性,即其所生成的內(nèi)容和原作品之間具有緊密的關(guān)聯(lián)性,且能夠再現(xiàn)原作品的獨(dú)創(chuàng)性表達(dá),則針對(duì)該場(chǎng)景下的人工智能模型訓(xùn)練就需要取得版權(quán)人和使用者的一對(duì)一授權(quán),既不適用合理使用,也無(wú)法通過(guò)法定許可進(jìn)行規(guī)制。
