
作者簡(jiǎn)介:1、胡開(kāi)忠:男,中國(guó)人民大學(xué)法學(xué)博士;現(xiàn)任中南財(cái)經(jīng)政法大學(xué)校學(xué)術(shù)委員、知識(shí)產(chǎn)權(quán)研究中心二級(jí)教授、博士生導(dǎo)師, 國(guó)家版權(quán)局國(guó)際版權(quán)研究基地副主任,國(guó)家社科基金重大項(xiàng)目“支持全面創(chuàng)新的知識(shí)產(chǎn)權(quán)制度體系構(gòu)建研究”首席專家。 兼任世界知識(shí)產(chǎn)權(quán)組織知識(shí)產(chǎn)權(quán)與遺傳資源、傳統(tǒng)知識(shí)和民間文學(xué)藝術(shù)政府間委員會(huì)特設(shè)專家組專家,中國(guó)法學(xué)會(huì)知識(shí)產(chǎn)權(quán)法學(xué)研究會(huì)常務(wù)理事,湖北省法學(xué)會(huì)知識(shí)產(chǎn)權(quán)法學(xué)研究會(huì)副會(huì)長(zhǎng)等。
2、江璐迪:中南財(cái)經(jīng)政法大學(xué)知識(shí)產(chǎn)權(quán)學(xué)院2023級(jí)博士生。
自2025年1月底發(fā)布以來(lái),DeepSeek持續(xù)引發(fā)廣泛熱議。憑借出色的文本、圖像等內(nèi)容生成能力和理解推理能力,DeepSeek迅速嶄露頭角,成為繼ChatGPT之后的又一現(xiàn)象級(jí)人工智能產(chǎn)品,被迅速應(yīng)用于內(nèi)容創(chuàng)作、在線客服、教育培訓(xùn)、企業(yè)運(yùn)營(yíng)等多個(gè)領(lǐng)域。
隨著生成式人工智能的普及和應(yīng)用,知識(shí)產(chǎn)權(quán)法律保護(hù)也迎來(lái)了前所未有的挑戰(zhàn)。其中,位于生成式人工智能生命周期前端的機(jī)器學(xué)習(xí)的版權(quán)合法性問(wèn)題尤為突出。由于生成式人工智能技術(shù)的發(fā)展離不開(kāi)依賴于海量數(shù)據(jù)訓(xùn)練的機(jī)器學(xué)習(xí),版權(quán)作品作為優(yōu)質(zhì)的信息資源,是機(jī)器學(xué)習(xí)過(guò)程中必要的數(shù)據(jù)來(lái)源。根據(jù)著作權(quán)的事前授權(quán)原則,利用版權(quán)作品進(jìn)行機(jī)器學(xué)習(xí)需要事前獲得著作權(quán)人的許可。
然而,面對(duì)海量的作品使用需求,人工智能的開(kāi)發(fā)者需逐一與著作權(quán)人展開(kāi)漫長(zhǎng)復(fù)雜的談判以獲取授權(quán),將產(chǎn)生極高的交易成本。于是,未經(jīng)著作權(quán)人許可利用作品開(kāi)展機(jī)器學(xué)習(xí),成為人工智能產(chǎn)業(yè)發(fā)展的普遍現(xiàn)象,導(dǎo)致了作品市場(chǎng)的利益失衡。在此背景下,著作權(quán)人紛紛起訴人工智能企業(yè),以期司法實(shí)踐能積極回應(yīng)新技術(shù)所引發(fā)的作品利用難題,構(gòu)建機(jī)器學(xué)習(xí)場(chǎng)景下的版權(quán)治理框架。
生成式人工智能機(jī)器學(xué)習(xí)行為的特殊之處
從司法實(shí)踐的訴訟情況來(lái)看,無(wú)論是北京互聯(lián)網(wǎng)法院正在審理的“全國(guó)首例涉及AI繪畫(huà)大模型訓(xùn)練著作權(quán)侵權(quán)案”,還是美國(guó)的30余起機(jī)器學(xué)習(xí)相關(guān)的版權(quán)糾紛,有關(guān)機(jī)器學(xué)習(xí)的版權(quán)合法性爭(zhēng)議主要集中于生成式人工智能領(lǐng)域。這一現(xiàn)象的根源在于生成式人工智能機(jī)器學(xué)習(xí)的特殊性和復(fù)雜性。
與傳統(tǒng)的文本與數(shù)據(jù)挖掘行為不同,生成式人工智能機(jī)器學(xué)習(xí)不僅是將作品視為事實(shí)信息予以分析并提取規(guī)律,還涉及對(duì)作品元素的表達(dá)性使用。此外,這項(xiàng)技術(shù)對(duì)作品市場(chǎng)的影響頗為復(fù)雜,一方面,生成式人工智能開(kāi)啟了“機(jī)器創(chuàng)作”的新模式,其高效率的創(chuàng)作能力客觀上為人類創(chuàng)作者提供了更豐富的語(yǔ)料素材。同時(shí),利用生成式人工智能從事創(chuàng)作活動(dòng)降低了作品創(chuàng)作成本,提升了藝術(shù)創(chuàng)作效率,促進(jìn)了公眾自由表達(dá)的實(shí)現(xiàn)。另一方面,更廉價(jià)的人工智能生成物會(huì)對(duì)人類作者的作品產(chǎn)生一定的替代效應(yīng),損害人類作者的整體利益。長(zhǎng)此以往,這可能導(dǎo)致“劣幣驅(qū)逐良幣”,平庸、同質(zhì)的機(jī)器生成內(nèi)容取代了獨(dú)特、多樣的人類創(chuàng)作作品,阻礙文化表達(dá)的多樣性發(fā)展。
生成式人工智能機(jī)器學(xué)習(xí)的定性之難也折射出一個(gè)更本質(zhì)的問(wèn)題,即當(dāng)版權(quán)保護(hù)和技術(shù)創(chuàng)新的價(jià)值發(fā)生沖突時(shí)應(yīng)如何協(xié)調(diào)?不同的制度選擇體現(xiàn)了不同的價(jià)值立場(chǎng)。在學(xué)界,多數(shù)學(xué)者主張采用更寬松的監(jiān)管政策,即適用合理使用制度為人工智能產(chǎn)業(yè)發(fā)展減負(fù)。他們認(rèn)為,數(shù)據(jù)訓(xùn)練中的作品使用行為具有“非特定性”,屬于算法黑箱中過(guò)程性使用行為和非表達(dá)性使用,不構(gòu)成著作權(quán)侵權(quán)。此外,基礎(chǔ)模型作為人工智能時(shí)代的新型基礎(chǔ)設(shè)施,在技術(shù)效果上具有普惠性,認(rèn)定生成式人工智能機(jī)器學(xué)習(xí)構(gòu)成合理使用,不僅在國(guó)內(nèi)層面有利于中小型企業(yè)釋放創(chuàng)新潛力,而且在國(guó)際層面也能夠吸引更多人工智能研發(fā)者,助力我國(guó)人工智能產(chǎn)業(yè)的高質(zhì)量發(fā)展。
另一部分學(xué)者則以作品市場(chǎng)的利益平衡為視點(diǎn),主張適用法定許可制度規(guī)制生成式人工智能的機(jī)器學(xué)習(xí)行為。他們指出,合理使用制度的濫用可能進(jìn)一步鞏固技術(shù)研發(fā)者的市場(chǎng)壟斷地位,加劇作品市場(chǎng)的利益失衡,甚至導(dǎo)致人類作者因難以維持生計(jì)而退出創(chuàng)作領(lǐng)域,最終損害文化表達(dá)的多樣性。而法定許可制度作為一個(gè)折中方案,以公平價(jià)值為理念,在簡(jiǎn)化作品許可使用程序的同時(shí),保障了著作權(quán)人的經(jīng)濟(jì)利益,為其提供談判籌碼,兼顧了版權(quán)保護(hù)和技術(shù)發(fā)展的雙重目標(biāo)。
此外,由于算法黑箱的不可知性,在人工智能致害的場(chǎng)景下,侵權(quán)責(zé)任認(rèn)定的因果關(guān)系常難以成立,事后救濟(jì)面臨障礙。法定許可制度作為一種事前規(guī)制手段,要求基礎(chǔ)模型的研發(fā)者在技術(shù)開(kāi)發(fā)初期就將著作權(quán)人的利益納入考量。這不僅有助于督促研發(fā)者采取更多的技術(shù)措施,降低輸出侵權(quán)結(jié)果的概率,還能有效內(nèi)化技術(shù)發(fā)展中產(chǎn)生的負(fù)外部性。
生成式人工智能機(jī)器學(xué)習(xí)行為的合理使用分析
生成式人工智能機(jī)器學(xué)習(xí)行為的定性目前仍存在較大爭(zhēng)議,盡管多數(shù)學(xué)者傾向于認(rèn)為生成式人工智能的數(shù)據(jù)訓(xùn)練應(yīng)構(gòu)成合理使用,但這一主張仍然需要在具體實(shí)踐中通過(guò)“四要素測(cè)試法”加以檢驗(yàn)。
使用作品的性質(zhì)和目的。是否構(gòu)成轉(zhuǎn)換性使用在合理使用的認(rèn)定中發(fā)揮著關(guān)鍵作用,“轉(zhuǎn)換性”程度較高的作品使用行為,即便是商業(yè)性使用也可能被認(rèn)定為合理使用。持有“合理使用說(shuō)”的學(xué)者認(rèn)為,機(jī)器學(xué)習(xí)是技術(shù)開(kāi)發(fā)的必要環(huán)節(jié),其對(duì)作品的使用是一種以實(shí)現(xiàn)某一技術(shù)功能的轉(zhuǎn)換性使用。誠(chéng)然,對(duì)于并不應(yīng)用于內(nèi)容生成的基礎(chǔ)模型而言,作品數(shù)據(jù)訓(xùn)練的目的是為提取作品中的事實(shí)信息,這種功能性使用通常不會(huì)被認(rèn)定為侵權(quán)。然而,某些創(chuàng)意生成的語(yǔ)言模型,其輸出的結(jié)果可能會(huì)與訓(xùn)練作品構(gòu)成實(shí)質(zhì)性相似,或其應(yīng)用的市場(chǎng)與原作品的市場(chǎng)存在重疊,此時(shí)上述觀點(diǎn)便缺乏解釋力。在司法實(shí)踐中,法院可能會(huì)裁定輸出的結(jié)果、模型的部署等構(gòu)成著作權(quán)侵權(quán),不受合理使用原則的保護(hù)。比如,在廣州互聯(lián)網(wǎng)法院審理的“奧特曼案”中,由于案涉生成式人工智能輸出的結(jié)果與奧特曼美術(shù)形象構(gòu)成實(shí)質(zhì)性相似,法院最終認(rèn)定被告構(gòu)成著作權(quán)侵權(quán)并要求其承擔(dān)法律責(zé)任。這表明,生成式人工智能機(jī)器學(xué)習(xí)的合理使用判定的關(guān)鍵在于分析輸出結(jié)果與版權(quán)作品是否構(gòu)成實(shí)質(zhì)性相似,若答案是肯定的,則需要進(jìn)一步考察使用行為的性質(zhì)和目的是否具有足夠的“轉(zhuǎn)換性”。通過(guò)個(gè)案的具體事實(shí)進(jìn)行綜合判斷,方能勾勒出生成式人工智能機(jī)器學(xué)習(xí)的合理使用輪廓。
考察使用行為是否出于商業(yè)目的或非營(yíng)利的教育目的。對(duì)該要素的分析需要結(jié)合轉(zhuǎn)換性使用的程度、對(duì)原作品市場(chǎng)的影響等其他因素進(jìn)行綜合判斷。一般來(lái)說(shuō),非商業(yè)性的作品使用行為與合理使用制度內(nèi)在的公益價(jià)值相契合,有較大可能構(gòu)成合理使用。然而,在人工智能的產(chǎn)業(yè)實(shí)踐中,從事基礎(chǔ)模型研發(fā)的主體多為商業(yè)性質(zhì)的互聯(lián)網(wǎng)企業(yè)或科技公司,這使生成式人工智能機(jī)器學(xué)習(xí)的合理使用認(rèn)定于該要素上處于劣勢(shì)。此外,美國(guó)最高法院在2023年“安妮·霍爾案”中強(qiáng)化了“商業(yè)性使用”對(duì)合理使用認(rèn)定的不利影響,提升了該要素在判定中的重要性,進(jìn)一步增加了以商業(yè)目的進(jìn)行機(jī)器學(xué)習(xí)被認(rèn)定為合理使用的難度。
判斷是否為善意使用。生成式人工智能機(jī)器學(xué)習(xí)是否構(gòu)成善意使用,與其數(shù)據(jù)來(lái)源的合法性密切相關(guān),即是否規(guī)避或破壞著作權(quán)人所采取的技術(shù)措施?!渡墒饺斯ぶ悄芊?wù)管理暫行辦法》第七條第一項(xiàng)規(guī)定,開(kāi)展數(shù)據(jù)訓(xùn)練處理活動(dòng)應(yīng)使用具有合法來(lái)源的數(shù)據(jù)和基礎(chǔ)模型。因此,數(shù)據(jù)來(lái)源合法性是考察機(jī)器學(xué)習(xí)版權(quán)合法性的前提。例如,在美國(guó)的“紐約時(shí)報(bào)案”中,ChatGPT繞過(guò)了紐約時(shí)報(bào)所采取的技術(shù)保護(hù)措施“付費(fèi)墻”,以逐字復(fù)制原作品的方式給未付費(fèi)用戶提供了文章《雪崩:隧道溪的災(zāi)難》(SnowFall:The Avalanche at Tunnel Creek)。這一行為將阻止機(jī)器學(xué)習(xí)構(gòu)成合理使用。
被使用作品的性質(zhì)。版權(quán)保護(hù)的強(qiáng)弱與作品的性質(zhì)緊密相關(guān),虛構(gòu)作品相較于事實(shí)作品會(huì)獲得更充分的版權(quán)保護(hù),因此,使用事實(shí)作品更容易構(gòu)成合理使用,使用虛構(gòu)作品則反之。當(dāng)前生成式人工智能被廣泛應(yīng)用于廣告、游戲等創(chuàng)意產(chǎn)業(yè),其輸出結(jié)果更容易與虛構(gòu)作品或藝術(shù)作品構(gòu)成實(shí)質(zhì)性相似,存在較高的著作權(quán)侵權(quán)風(fēng)險(xiǎn)。
需考量被使用部分在整個(gè)原作品中所占比例和質(zhì)量。使用作品的比例要與其所實(shí)現(xiàn)的正當(dāng)目的或功能相適應(yīng)。以生成式人工智能機(jī)器學(xué)習(xí)為例,作品輸入和模型訓(xùn)練階段的作品使用是為提取海量作品中的語(yǔ)言表達(dá)規(guī)律,是技術(shù)開(kāi)發(fā)過(guò)程中的非表達(dá)性使用,此時(shí)即便是完全地逐字復(fù)制也能被認(rèn)定為合理使用。在結(jié)果輸出環(huán)節(jié),生成式人工智能根據(jù)指令生成符合用戶需求的內(nèi)容,此過(guò)程涉及對(duì)原作品的表達(dá)性使用。理論上應(yīng)以少量使用為限,過(guò)量地使用原作品或使用其核心部分均不利于合理使用的認(rèn)定。
使用行為對(duì)原作品潛在市場(chǎng)或其價(jià)值的影響。該要素的考察與使用行為的轉(zhuǎn)換性密切相關(guān),也需要區(qū)分因構(gòu)成著作權(quán)侵權(quán)而引發(fā)的市場(chǎng)替代效應(yīng)與基于非著作權(quán)侵權(quán)行為所導(dǎo)致的市場(chǎng)競(jìng)爭(zhēng)損害。通常而言,使用行為的轉(zhuǎn)換性越弱,越容易被認(rèn)定為著作權(quán)侵權(quán),越有可能在“原作品的潛在市場(chǎng)”產(chǎn)生替代效應(yīng)。以“下一個(gè)倫勃朗”項(xiàng)目為例,計(jì)算機(jī)通過(guò)學(xué)習(xí)倫勃朗的繪畫(huà)風(fēng)格、作品細(xì)節(jié)以及諸多倫勃朗作品片段,最終形成的人工智能系統(tǒng)能夠根據(jù)指令“創(chuàng)作”出既具有倫勃朗繪畫(huà)風(fēng)格,又完全不同于其任何現(xiàn)存作品的全新數(shù)字繪畫(huà)作品。然而,若倫勃朗的作品仍受版權(quán)保護(hù),該人工智能生成的衍生作品將對(duì)倫勃朗作品市場(chǎng)產(chǎn)生替代效應(yīng),并影響其潛在市場(chǎng),此時(shí),機(jī)器學(xué)習(xí)便難以被認(rèn)定為合理使用。
通過(guò)上述分析可知,并非所有生成式人工智能的機(jī)器學(xué)習(xí)行為都能被認(rèn)定為合理使用。在輸出端非轉(zhuǎn)換性使用與轉(zhuǎn)換性使用的交織,使生成式人工智能機(jī)器學(xué)習(xí)的合理使用判定處于灰色地帶,需要結(jié)合個(gè)案中的具體事實(shí)進(jìn)行綜合判斷。即便主張生成式人工智能的機(jī)器學(xué)習(xí)構(gòu)成合理使用,研發(fā)者要免于著作權(quán)侵權(quán)責(zé)任,仍要確保人工智能的輸出結(jié)果與現(xiàn)有作品不構(gòu)成實(shí)質(zhì)性相似。因此,合理使用制度的適用因個(gè)案中輸出結(jié)果的差異具有高度的不確定性,這既無(wú)法為基礎(chǔ)模型研發(fā)者提供明確的法律指引,也難以完全滿足行業(yè)實(shí)踐的現(xiàn)實(shí)需求。
