原文標題:《司曉 | 奇點來臨:ChatGPT時代的著作權(quán)法走向何處——兼回應(yīng)相關(guān)論點 | 爭鳴》
文章摘要
1. 生成式人工智能技術(shù)的興起改變了著作權(quán)領(lǐng)域的創(chuàng)作邏輯,人工智能可以完成獨創(chuàng)性思想的表達。
2. 對于人工智能生成內(nèi)容的著作權(quán)問題存在爭議,一部分學(xué)者認為只有證明存在自然人的創(chuàng)作貢獻才能被認定為著作權(quán)法上的作品。
3. 新一代生成式人工智能的發(fā)展具有“涌現(xiàn)能力”,使得生成的內(nèi)容接近人類的表達邏輯和語義語法。
4. 生成式人工智能的興起挑戰(zhàn)了著作權(quán)法的底層邏輯,人工智能可以超越人類的創(chuàng)作能力,使得創(chuàng)作不再是自然人的專屬。
5. 生成式人工智能的發(fā)展可能導(dǎo)致著作權(quán)法的適用價值被消解,著作權(quán)法只保護自然人創(chuàng)作的內(nèi)容,無法適應(yīng)人工智能生成內(nèi)容的情況。
6. 生成式人工智能對于在先作品的學(xué)習(xí)利用行為難以歸入現(xiàn)有著作權(quán)專有權(quán)利的范疇, 著作權(quán)法的合理回報機制失效。
7. 生成式人工智能的發(fā)展使得著作權(quán)法面臨內(nèi)容生成和內(nèi)容傳播兩個并行領(lǐng)域的平臺責(zé)任問題,需要創(chuàng)設(shè)新的平臺責(zé)任規(guī)則。
8. 生成式人工智能的興起將引發(fā)著作權(quán)法的徹底變革,需要進一步研究和論證適應(yīng)生成式人工智能時代的著作權(quán)制度。
當下,以ChatGPT類產(chǎn)品為代表的生成式人工智能技術(shù)的興起與應(yīng)用,極大地改變了著作權(quán)領(lǐng)域的底層創(chuàng)作邏輯。人工智能已經(jīng)能夠以超乎想象的水平和效率完成過往只能由自然人實施的創(chuàng)作行為——對于思想的獨創(chuàng)性表達。而傳統(tǒng)的著作權(quán)制度立足于“思想表達二分法”這一底層邏輯之上,即“只保護自然人思想的外在表達,而不保護思想本身”。但在漸行漸近的生成式人工智能時代,現(xiàn)有著作權(quán)制度如若無法對“最為寶貴的人的創(chuàng)造性思想”,以及“最為普遍的人工智能的獨創(chuàng)性表達”加以有效涵攝,那么其適用價值將不可避免地被消解,其顛覆性變革也就可以預(yù)見。
一、生成式人工智能興起與著作權(quán)理論的新思考
1. AIGC著作權(quán)問題的爭議
我國理論界對于人工智能生成內(nèi)容著作權(quán)問題的關(guān)注,大致源起于2018年北京市海淀區(qū)法院審理的“菲林訴百度案”和深圳市南山區(qū)法院審理的“騰訊訴網(wǎng)貸之家”。筆者以“人工智能+版權(quán)/著作權(quán)”為關(guān)鍵詞在中國知網(wǎng)進行檢索,限定文獻來源為“CSSCI”,共檢索到289篇文章,其中有260篇文章均為2018年后出版,亦驗證了這一基本判斷。雖然上述兩案判決對于“人工智能生成內(nèi)容”是否構(gòu)成作品做出了不同的認定。但不同的判決結(jié)果歸因于兩個案件涉及的人工智能模型(或者說機器模型)在運行機制方面的本質(zhì)差異;而在法律層面,兩個判決的落腳點存在高度共識,即只有證明存在自然人的創(chuàng)作貢獻,人工智能生成內(nèi)容才會被認定為著作權(quán)法上的作品。
彼時,理論界的討論重點聚焦于“人工智能生成內(nèi)容是否受著作權(quán)法保護”這一基礎(chǔ)問題。一部分學(xué)者持肯定態(tài)度,主要有如下理由:第一,該階段的人工智能技術(shù)自主化程度較低,僅僅是輔助和服務(wù)人類創(chuàng)作的工具。第二,人工智能本質(zhì)上體現(xiàn)的是模型設(shè)計者或訓(xùn)練者的創(chuàng)作意志和行為,只要其生成內(nèi)容滿足“獨創(chuàng)性”要求即可構(gòu)成作品。第三,可以借鑒早已存在且運作成熟的法人作品制度,將人工智能的所有者視為著作權(quán)人。另一部分學(xué)者則持反對態(tài)度,主要理由在于:第一,人工智能生成內(nèi)容是應(yīng)用算法、規(guī)則和模板的結(jié)果,不能體現(xiàn)創(chuàng)作者獨特的個性。第二,人工智能的創(chuàng)作機理并非著作權(quán)意義上的“創(chuàng)作”,生成的內(nèi)容也不能被認定為作品。第三,在判定客體是否具有獨創(chuàng)性時,不僅要在客觀上滿足表達的形式要件,還要通過整體的主觀感受判斷客體是否貢獻了“智力上的創(chuàng)新”。
2. 技術(shù)迭變賦予AIGC著作權(quán)探討新的時代意義
2022年11月30日,美國人工智能研究公司Open AI發(fā)布了ChatGPT,在短短2個月的時間,其月度活躍用戶已達1億,成為全球互聯(lián)網(wǎng)歷史上用戶增長最快的應(yīng)用。自2023年3月16日百度發(fā)布“文心一言”之后,阿里、科大訊飛、商湯等企業(yè)也相繼發(fā)布對標ChatGPT的生成式人工智能產(chǎn)品。目前,國內(nèi)用戶和企業(yè)尚無法注冊ChatGPT賬號或接入其應(yīng)用程序編程接口,國產(chǎn)ChatGPT類產(chǎn)品則基本處于內(nèi)測和研發(fā)階段。但鑒于生成式人工智能技術(shù)對于內(nèi)容創(chuàng)作和著作權(quán)制度的重大影響,相關(guān)理論探討也便被賦予了新的時代意義。
值得注意的是,新一代生成式人工智能的發(fā)展之所以備受關(guān)注,就在于其一定程度上已經(jīng)具備系統(tǒng)科學(xué)領(lǐng)域所稱的“涌現(xiàn)能力”。所謂“涌現(xiàn)能力”,就是當人工智能模型參數(shù)達到一定量級之后,會突然擁有包括常識推理、問答、翻譯等一系列類似人類的“智慧能力”,這朝著通用人工智能(artificial general intelligence)邁進了一大步。生成式人工智能涌現(xiàn)能力的出現(xiàn),也解釋了為什么ChatGPT類產(chǎn)品在內(nèi)容表達上看起來已經(jīng)和人類無異。就此,有學(xué)者指出,ChatGPT本質(zhì)上是一個大型語言模型,是“智能搜索引擎+智能文本分析器+洗稿器”的結(jié)合,不屬于法律意義上的“人”,生成的內(nèi)容也不應(yīng)受到著作權(quán)法的保護。也有學(xué)者表示,ChatGPT與此前人工智能的重要區(qū)別,在于存在基于人類反饋強化學(xué)習(xí)的訓(xùn)練,使得生成的內(nèi)容融入了人類的主觀偏好。因此,ChatGPT生成的作品就是人的智力成果。另有學(xué)者表示,ChatGPT生成的內(nèi)容應(yīng)當分情形討論,如果人類輸入的指令足夠具體,則生成的內(nèi)容就蘊含著人類足夠具體的意思表達,應(yīng)受著作權(quán)法保護。
綜上來看,理論界目前對于新一代人工智能生成內(nèi)容著作權(quán)問題的探討,雖然在觀點上存在明顯差異,但依舊立足于既有著作權(quán)制度下“主體規(guī)則—僅限于自然人創(chuàng)作”和“客體規(guī)則—僅保護獨創(chuàng)性的外在表達”的基本框架。然而,在人工智能技術(shù)發(fā)展的“奇點時刻”(singularity moment)加速來臨之際,ChatGPT類產(chǎn)品已經(jīng)超越了既往的人工智能模型應(yīng)用,一定程度上可以說具有了“通用人工智能”屬性或者說“類人性”。對此,我們需要審視和思考:撼動和變革既有著作權(quán)制度整套邏輯的“奇點時刻”是否已經(jīng)加速到來?
二、生成式人工智能打破了著作權(quán)法的底層邏輯
從著作權(quán)法的底層邏輯來看,一方面,以ChatGPT類產(chǎn)品為代表的新一代生成式人工智能改變了內(nèi)容創(chuàng)作的基本邏輯,雖然人類目前仍然可以壟斷獨創(chuàng)性的思想,但在思想的具體表達層面正逐漸被人工智能所趕超。另一方面,新一代生成式人工智能推翻了“思想表達二分”創(chuàng)設(shè)時的合理性前提,ChatGPT類產(chǎn)品通過對作品風(fēng)格、靈感等進行學(xué)習(xí),便可以輸出海量的、區(qū)別于原作品的新表達形式,雖不構(gòu)成著作權(quán)侵權(quán)但對在先創(chuàng)作者產(chǎn)生了現(xiàn)實的市場替代效應(yīng)。
1. 創(chuàng)作層面:人類對“獨創(chuàng)性表達的壟斷”被打破
第一,各類生成式人工智能利用海量數(shù)據(jù)進行模型訓(xùn)練、生成最終內(nèi)容的方法大體相同。首先,自監(jiān)督學(xué)習(xí)。機器自己學(xué)習(xí)大數(shù)據(jù),包括購買的數(shù)據(jù)庫,公開的網(wǎng)站文章、電子書,電子版的報紙、雜志,以及開源社區(qū)的計算機代碼等。其次,監(jiān)督學(xué)習(xí)。人類把自己寫的問題和答案交給機器學(xué)習(xí),讓機器學(xué)會人類說話的方式和風(fēng)格。最后,人類反饋強化學(xué)習(xí)。人類會先訓(xùn)練一個獎勵模型,它包括了對于多個答案優(yōu)劣的評價,然后再用這個模型去訓(xùn)練和評價機器生成的內(nèi)容,讓機器的回答越來越接近人類的敘述方式。
以 ChatGPT 為例,其內(nèi)容生成機制被形象地稱為“文字接龍”,實際上是統(tǒng)計學(xué)“自回歸”原理的具體展示:先通過模型預(yù)測下一個字,然后把預(yù)測出來的字帶入模型,再去預(yù)測下一個字,不斷迭代輸出。而此前,傳統(tǒng)的自然人創(chuàng)作是建立在自身所獨有的語言理解能力之上,特定的語言與特定的文字對應(yīng)以后,文字表達便通過內(nèi)含的語義來傳遞人類的思想。當語義通過文字方式不斷組合,便形成了不同的詞匯、短語,進而持續(xù)擴展表達的豐富程度。久而久之,文字之間形成了特定的結(jié)構(gòu),使人們能夠理解交流對象所要表達的意思,這就形成了人類的語法和語句。語句的進一步疊加出現(xiàn)了語段、語篇,直至成為著作權(quán)法認可的作品。由此可見,ChatGPT“自回歸式”的單字內(nèi)容生成機制,和人類傳統(tǒng)意義上基于語言理解能力的創(chuàng)作邏輯存在本質(zhì)差異。
第二,自然人創(chuàng)作正日益被人工智能“創(chuàng)作”所趕超和替代。目前,雖然ChatGPT似乎仍無法像人一樣理解其輸出內(nèi)容的真正意義。但為何ChatGPT可以判斷出下一個最可能的字是什么,并且在將這些字組成完整的內(nèi)容后,看起來高度契合人類的表達邏輯和語義語法?回答這個問題,便需要我們反思,是否應(yīng)當從更宏大的視角去審視著作權(quán)法上的創(chuàng)作行為。畢竟生成式人工智能憑借“涌現(xiàn)能力”重塑了創(chuàng)作邏輯,開辟了一條不同于自然人創(chuàng)作的新路徑。
此外,ChatGPT等生成式人工智能產(chǎn)品的表達能力近乎是無限的。經(jīng)過海量數(shù)據(jù)訓(xùn)練的大模型可以用遠超人類的創(chuàng)作效率和藝術(shù)水平,不間斷地輸出高質(zhì)量的內(nèi)容。從目前ChatGPT類產(chǎn)品的商業(yè)模式來看,用戶幾乎可以“零成本”的方式讓其隨時隨地協(xié)助生成內(nèi)容。由此,生成式人工智能的發(fā)展應(yīng)用極大地改變了人們對于著作權(quán)法上“創(chuàng)作”的認知。與“創(chuàng)作”一詞直接對應(yīng)的“獨創(chuàng)性表達行為”,不再是一個被專業(yè)群體壟斷的高門檻領(lǐng)域,普通大眾在生成式人工智能的輔助下,只要擁有有價值的想法和觀點,具體的表達完全可以交由機器來完成。
2. 制度邏輯層面:“思想表達二分法”的適用價值被消解
第一,“思想表達二分法”存在的正當性基礎(chǔ)被撼動。“思想表達二分法”作為著作權(quán)制度的底層邏輯,強調(diào)著作權(quán)法只保護自然人思想的“外在表達”,而不保護“思想本身”。“思想表達二分法”的創(chuàng)設(shè)前提,是過去人們學(xué)習(xí)既有作品的風(fēng)格、靈感進而創(chuàng)作出新作品的能力十分有限。即便人們可以學(xué)習(xí)他人獨創(chuàng)性的思想,但將其付諸具體內(nèi)容創(chuàng)作時仍存在很高的準入門檻,需要具備足夠的專業(yè)技能。加之,個體學(xué)習(xí)和創(chuàng)作的效率與精力往往有限。因此,在過去即使不保護在先作品中的思想,也并不會導(dǎo)致不同主體之間利益的顯著失衡。于是有觀點直言,即使一個人每天看一本書,窮其一生也頂多只能閱讀三萬本書,并且極大可能一生也寫不出一本書。而生成式人工智能的發(fā)展,則使得原本專屬于人類的獨創(chuàng)性表達,可以通過近乎零成本、無門檻的機器生產(chǎn)方式完成。換言之,ChatGPT類產(chǎn)品可以在短時間內(nèi)快速“學(xué)完”人類社會海量思想、知識和風(fēng)格的基礎(chǔ)上,進行無限的、全新的內(nèi)容生成。
第二,著作權(quán)領(lǐng)域“智力勞動合理回報機制”的失效。從內(nèi)容生成機制來看,人工智能模型并不會侵犯在先作品中受著作權(quán)法保護的“外在表達”。以ChatGPT為例,其實際是在“自回歸原理”下,不斷學(xué)習(xí)海量在先作品中不同文字之間排列組合的概率和規(guī)律,然后內(nèi)化為自身模型參數(shù)的過程。ChatGPT對于訓(xùn)練數(shù)據(jù)庫中作品內(nèi)容的學(xué)習(xí)利用,可以理解為細化到分散、海量的作品中每一個字的引用,而不會復(fù)現(xiàn)特定作品,甚至不會復(fù)現(xiàn)特定作品中的段落和語句。所以,ChatGPT實際上不存在對在先訓(xùn)練作品的實質(zhì)性引用,從而就不會侵犯在先作品中受著作權(quán)法保護的“外在表達”。但是與在先作品風(fēng)格和思想相似的人工智能生成內(nèi)容,會對著作權(quán)人既有授權(quán)市場產(chǎn)生現(xiàn)實的擠出效應(yīng)。加之,生成式人工智能內(nèi)容生產(chǎn)的效率和規(guī)模遠非自然人可比,由此便會進一步放大上述的市場替代效應(yīng)。目前發(fā)生的典型案例,是全球各地的藝術(shù)家起訴Midjourney等人工智能繪畫平臺利用在先美術(shù)作品投喂機器、進行模型訓(xùn)練,并大規(guī)模生成和特定藝術(shù)家風(fēng)格相一致的畫作在市場上拋售。
著作權(quán)制度的目標在于“對人類智力勞動合理回報機制的設(shè)計”。然而生成式人工智能的模型研發(fā)、商業(yè)應(yīng)用主體,通過“利用既有作品風(fēng)格思想,進而輸出全新表達”的內(nèi)容生成機制,借由提供商業(yè)服務(wù)和技術(shù)接口等方式盈利,但沒有把這些利益分配給在先作品的權(quán)利人。著作權(quán)制度本應(yīng)體現(xiàn)的合理回報機制在此出現(xiàn)了缺位,從而在事實上導(dǎo)致了內(nèi)容上下游之間的利益失衡。
三、生成式人工智能挑戰(zhàn)了著作權(quán)法的基礎(chǔ)規(guī)則
從著作權(quán)制度的基礎(chǔ)規(guī)則來看,鑒于ChatGPT類產(chǎn)品生成內(nèi)容的效率遠高于人類,未來其或?qū)⒅饾u成為全社會知識內(nèi)容的生產(chǎn)主體,而著作權(quán)法僅對“源于自然人創(chuàng)作的內(nèi)容”加以保護,由此其適用價值便受到挑戰(zhàn)。同時,生成式人工智能對于他人作品訓(xùn)練利用的行為難以歸入現(xiàn)有著作權(quán)專有權(quán)利的范疇,著作權(quán)領(lǐng)域傳統(tǒng)的“授權(quán)許可模式”因此也面臨落地難的現(xiàn)實困境。
1. 權(quán)利主體層面:“只保護自然人創(chuàng)作”的制度基礎(chǔ)受到挑戰(zhàn)
第一,AI或?qū)⒊蔀槿鐣畔?nèi)容的生產(chǎn)主體。以ChatGPT類產(chǎn)品為代表的新一代生成式人工智能的興起,打破了自著作權(quán)制度誕生以來長久的共識——內(nèi)容生產(chǎn)特別是作品創(chuàng)作,是自然人專屬智慧的體現(xiàn)。當下,生成式人工智能的迅猛發(fā)展,正在使“創(chuàng)作”與“人類的表達”快速解耦。內(nèi)容創(chuàng)作從“大腦構(gòu)思+手工表達”轉(zhuǎn)變?yōu)?ldquo;人腦思考+機器表達”。由此,人們設(shè)想的內(nèi)容創(chuàng)作領(lǐng)域大規(guī)模工業(yè)化的場景也將加速來臨。有研究發(fā)現(xiàn),ChatGPT在2023年1月的內(nèi)容輸出能力為3.1億單詞每分鐘。而據(jù)谷歌公司此前統(tǒng)計,自1440年古登堡印刷機發(fā)明以來,全社會出版了約1.298億本書。每本書估算有5萬個單詞,總共約有6.5萬億單詞。由此,按照ChatGPT目前的內(nèi)容生產(chǎn)能力,幾乎每14天便可以輸出相當于人類全部印刷作品的內(nèi)容量。雖然筆者沒有找到這一研究之外類似的數(shù)據(jù),但即便延長到14個月甚至更長的時間維度,這依舊是一個令人興奮的發(fā)展趨勢。由此,我們可以預(yù)想,未來生成式人工智能輸出的內(nèi)容將會成為全社會信息內(nèi)容的主體。
第二,難以規(guī)制AIGC將導(dǎo)致著作權(quán)法適用價值的消弭。長久以來,各國著作權(quán)法均堅持“只保護自然人創(chuàng)作”的基本理念,即內(nèi)容生成過程中只有存在自然人的創(chuàng)作性貢獻,才會被認定為作品并受著作權(quán)法保護。但從目前ChatGPT類產(chǎn)品的內(nèi)容生成機制來看,存在難以證明具備自然人創(chuàng)作貢獻的事實困境。著作權(quán)法保護的是自然人的獨創(chuàng)性表達,也即對創(chuàng)作元素最終和具體的選擇安排。但是在人們向生成式人工智能輸入“prompts”進而直接輸出內(nèi)容的過程中,對于創(chuàng)作元素最終和具體的選擇安排,恰恰是由人工智能“模型黑箱”而非使用人工智能的用戶來實際完成的。2023年3月16日,美國版權(quán)局發(fā)布了專門的指南,表示“ChatGPT類產(chǎn)品生成的內(nèi)容,因為難以證明存在自然人的創(chuàng)作性貢獻,所以不構(gòu)成作品,不受到版權(quán)法保護”。長期以來,完全由自然界、動物產(chǎn)生的內(nèi)容素材都不會被認定為著作權(quán)法上的作品,如獼猴自拍、風(fēng)力侵蝕形成的石像等。在我國,現(xiàn)行《著作權(quán)法》對作品和作者的規(guī)定是,“作品是指文學(xué)、藝術(shù)和科學(xué)領(lǐng)域內(nèi)具有獨創(chuàng)性并能以一定形式表現(xiàn)的智力成果”“創(chuàng)作作品的自然人是作者”。自然人以外的動物以及作為機器模型的生成式人工智能均不能成為創(chuàng)作主體,生成內(nèi)容也無法構(gòu)成作品。
當下,雖然說在“人機協(xié)作模式”之下,創(chuàng)作者可以通過對人工智能自動生成的內(nèi)容“改編”(增加包含人類獨創(chuàng)性貢獻的內(nèi)容)或匯編(內(nèi)容的選擇或者編排上體現(xiàn)獨創(chuàng)性)等方式間接獲得保護。但是,伴隨ChatGPT類產(chǎn)品內(nèi)容生成能力的不斷提升,未來社會絕大多數(shù)有價值且被廣泛利用的信息內(nèi)容可能都是由人工智能生成。囿于著作權(quán)法“只保護自然人創(chuàng)作”的底層邏輯,上述內(nèi)容卻難以享有著作權(quán)。與此同時,受著作權(quán)法保護的人類作品卻存在內(nèi)容體量小、使用占比低、市場價值弱等現(xiàn)實問題。
2. 客體權(quán)利層面:“先授權(quán)、再利用”的傳統(tǒng)范式被顛覆
第一,“授權(quán)許可”難以實行。著作權(quán)作為一種法定權(quán)利,不同于物權(quán)等自然權(quán)利,是在法律上人為創(chuàng)設(shè)的一項權(quán)利,是為了激勵內(nèi)容創(chuàng)作和知識傳播,從社會公有領(lǐng)域中為著作權(quán)人劃出的一塊保護區(qū)。為了平衡權(quán)利人和社會公眾間的利益,著作權(quán)法僅賦予創(chuàng)作者授權(quán)和規(guī)制落入法定權(quán)利范疇的作品利用行為,比如復(fù)制、發(fā)行、信息網(wǎng)絡(luò)傳播等。但生成式人工智能模型對于他人作品思想、風(fēng)格層面的“學(xué)習(xí)訓(xùn)練行為”實際難以落入既有著作權(quán)法專有權(quán)利的規(guī)制范疇。既無權(quán)利,何來授權(quán)?表面來看,生成式人工智能模型的“學(xué)習(xí)訓(xùn)練行為”類似于自然人閱讀文字作品、欣賞美術(shù)作品后的思考、吸收及再創(chuàng)作行為,和既有的著作權(quán)專有權(quán)利無法對應(yīng)。若著作權(quán)法對于生成式人工智能時代最為普遍和重要的作品利用行為——機器學(xué)習(xí)或者說模型訓(xùn)練難以規(guī)制,那么“授權(quán)許可模式”在實操層面也便失去了現(xiàn)實意義。深入思考可以發(fā)現(xiàn),生成式人工智能模型的“學(xué)習(xí)訓(xùn)練行為”作用對象是在先作品中的“思想”而非著作權(quán)法所保護的“表達”。在“思想表達二分法”規(guī)則之下,模型“學(xué)習(xí)訓(xùn)練行為”在納入著作權(quán)權(quán)利框架上存在障礙。
即便打破“思想表達二分法”的制度屏障,將模型“學(xué)習(xí)訓(xùn)練行為”納入著作權(quán)專有權(quán)利范疇,亦仍將面臨權(quán)利價值缺位的現(xiàn)實問題,即著作權(quán)人難以對ChatGPT類產(chǎn)品未經(jīng)授權(quán)的“學(xué)習(xí)訓(xùn)練行為”加以有效規(guī)制。其原因在于,著作權(quán)人存在發(fā)現(xiàn)模型侵權(quán)、舉證模型侵權(quán)以及侵權(quán)內(nèi)容比對等方面的困境,對此后文將具體闡釋。由此來看,或許需要從根本上反思著作權(quán)法既有賦權(quán)和授權(quán)規(guī)則,以適應(yīng)生成式人工智能時代的到來。
第二,“合理使用”亦無空間。對于人工智能模型訓(xùn)練階段未經(jīng)授權(quán)的作品“學(xué)習(xí)訓(xùn)練行為”而言,從現(xiàn)有著作權(quán)法“合理使用制度”角度考察,責(zé)任豁免的探討似乎也缺乏實際意義。合理使用的制度設(shè)計在于,對本身構(gòu)成著作權(quán)侵權(quán)的行為,基于特定公共利益的考量,在符合一定要求后予以侵權(quán)責(zé)任豁免。但生成式人工智能模型的作品“學(xué)習(xí)訓(xùn)練行為”是對于作品思想風(fēng)格的學(xué)習(xí)利用,難以落入著作權(quán)專有權(quán)規(guī)制的范疇。既然目前上述作品利用行為本身不受著作權(quán)法規(guī)制、不構(gòu)成著作權(quán)侵權(quán),合理使用的責(zé)任豁免便無從談起。論及機器學(xué)習(xí)領(lǐng)域合理使用問題,則不得不提及“谷歌圖書館案”。早在2004年,谷歌公司便將數(shù)字化后的圖書存放于服務(wù)器中,供用戶以“檢索有限文字片段的方式”發(fā)現(xiàn)所需圖書。谷歌上述提供作品片段的行為雖落入“復(fù)制權(quán)”范疇,但美國法院最終認定上述利用行為不構(gòu)成對原有圖書市場的替代。對于ChatGPT類產(chǎn)品而言,前文已述,其內(nèi)容生成機制實際是“學(xué)習(xí)在先作品中不同文字之間排列組合的概率,并細化到分散、海量作品中單字的引用”。因此,生成式人工智能輸出的內(nèi)容基本不涉及作品(甚至作品片段)的復(fù)制利用,相較“谷歌圖書館”而言,“侵權(quán)傳播”概率更低,“市場替代”影響更小,“轉(zhuǎn)換使用”程度更高。
四、生成式人工智能否定了著作權(quán)法的救濟機制
從著作權(quán)制度的救濟機制來看,生成式人工智能模型訓(xùn)練階段的作品利用行為,本質(zhì)上是一種機器內(nèi)部的非外顯性利用,著作權(quán)人在實踐中往往會遭遇舉證不能和侵權(quán)判定難的問題。而平臺責(zé)任領(lǐng)域立基于“內(nèi)容傳播環(huán)節(jié)”的“避風(fēng)港制度”,面對“內(nèi)容生成環(huán)節(jié)”的ChatGPT類產(chǎn)品的模型研發(fā)和商業(yè)應(yīng)用平臺,其適用價值也難以為繼。
1. 侵權(quán)標準層面:“接觸+實質(zhì)性相似”的判定規(guī)則失效
第一,著作權(quán)人難以證明存在對自身作品的“實際接觸”。在先創(chuàng)作者對于ChatGPT等生成式人工智能模型訓(xùn)練中未經(jīng)授權(quán)的作品利用行為,存在現(xiàn)實層面的維權(quán)困境。雖然著作權(quán)人難以發(fā)現(xiàn)侵權(quán)行為這一現(xiàn)實問題已存在較長時間,但著作權(quán)人所遭遇的維權(quán)挑戰(zhàn)從未如此之大。例如,伴隨內(nèi)容分發(fā)領(lǐng)域算法推薦技術(shù)的應(yīng)用,著作權(quán)人疲于應(yīng)對海量的UGC(User Generated Content,也就是用戶生成內(nèi)容)侵權(quán),陷入維權(quán)保護“打地鼠”的泥淖。但現(xiàn)實中,著作權(quán)人至少可以從外在表現(xiàn)發(fā)現(xiàn)作品是否被他人所侵權(quán)利用。生成式人工智能模型訓(xùn)練中的作品利用,事實上是一種在模型內(nèi)部進行的非外顯的作品利用。這就導(dǎo)致了即使自身作品被人工智能模型未經(jīng)授權(quán)用于訓(xùn)練,著作權(quán)人實際上也難以發(fā)現(xiàn)。
既有的著作權(quán)法遵循“接觸+實質(zhì)性相似”的侵權(quán)判定規(guī)則。在權(quán)利人主張生成式人工智能模型訓(xùn)練階段存在侵權(quán)利用自身作品的場景下,首先便需要舉證平臺存在對自身作品的“現(xiàn)實接觸”。但前述非外顯的作品訓(xùn)練行為,導(dǎo)致著作權(quán)人難以提供相應(yīng)的證據(jù)來主張模型訓(xùn)練平臺“實際接觸”到自身作品。如此一來,在先創(chuàng)作者的維權(quán)行為便難以為繼。
第二, 著作權(quán)人難以進行“實質(zhì)性相似”標準的侵權(quán)比對。理論上,在先創(chuàng)作者可以比對ChatGPT類產(chǎn)品生成和傳播的內(nèi)容和自身作品是否存在實質(zhì)性相似,進而倒推人工智能模型訓(xùn)練階段存在未經(jīng)授權(quán)的作品利用行為。然而實踐中,從侵權(quán)比對環(huán)節(jié)下的“實質(zhì)性相似”標準來看,權(quán)利人也會遭遇現(xiàn)實困境。因為生成式人工智能對于內(nèi)容創(chuàng)作的顛覆性影響在于,其通過對在先作品思想、風(fēng)格的吸收學(xué)習(xí),以一種難以預(yù)判的方式,輸出和既有作品相區(qū)分的、全新的內(nèi)容表達。由此,著作權(quán)人在“實質(zhì)性相似”侵權(quán)的比對過程中,會陷入ChatGPT類產(chǎn)品輸出內(nèi)容與自身作品“似曾相識”但又“似是而非”的困境。
2. 平臺責(zé)任層面:“避風(fēng)港制度”的適用錯位
第一,“避風(fēng)港制度”立足“侵權(quán)傳播環(huán)節(jié)”平臺責(zé)任的規(guī)制。“避風(fēng)港制度”誕生于1998年美國頒布的《數(shù)字千年版權(quán)法》,并逐漸發(fā)展成為全球平臺責(zé)任的基礎(chǔ)規(guī)則。“避風(fēng)港制度”適用于目前互聯(lián)網(wǎng)絕大多數(shù)的著作權(quán)侵權(quán)情形:侵權(quán)內(nèi)容是由用戶生成和上傳的,由用戶承擔(dān)直接侵權(quán)責(zé)任。對于網(wǎng)絡(luò)平臺而言,只有在知道用戶利用其網(wǎng)絡(luò)服務(wù)傳播侵權(quán)內(nèi)容,但未采取必要制止措施時,才需要就自身幫助侵權(quán)內(nèi)容傳播的行為承擔(dān)間接侵權(quán)責(zé)任。但是,伴隨“小程序”“云存儲”“算法推薦”等內(nèi)容傳播技術(shù)的普及應(yīng)用,“避風(fēng)港制度”也在不斷遭受挑戰(zhàn),而“內(nèi)容傳播環(huán)節(jié)”平臺責(zé)任的規(guī)則定位始終未被突破。
第二,AIGC領(lǐng)域則需要關(guān)注“內(nèi)容生成環(huán)節(jié)”的平臺責(zé)任。此前的“避風(fēng)港制度”下,網(wǎng)絡(luò)服務(wù)提供者著作權(quán)侵權(quán)責(zé)任的歸責(zé)基礎(chǔ),在于是否幫助了“用戶侵權(quán)內(nèi)容的傳播”;生成式人工智能的模型研發(fā)平臺和商業(yè)應(yīng)用平臺,作為新興網(wǎng)絡(luò)服務(wù)提供者,涉及的則是“用戶侵權(quán)內(nèi)容的生成”。在生成式人工智能技術(shù)出現(xiàn)前,平臺侵權(quán)責(zé)任判定側(cè)重于:用戶上傳侵權(quán)內(nèi)容(直接侵權(quán)責(zé)任規(guī)制的范疇)→傳統(tǒng)的網(wǎng)絡(luò)服務(wù)擴大侵權(quán)內(nèi)容傳播(既有“避風(fēng)港制度”規(guī)制的范疇)兩個環(huán)節(jié)。在生成式人工智能技術(shù)出現(xiàn)后,平臺侵權(quán)責(zé)任則需關(guān)注:用戶利用生成式人工智能產(chǎn)生侵權(quán)內(nèi)容→(新“避風(fēng)港制度”規(guī)制的范疇)用戶上傳侵權(quán)內(nèi)容→傳統(tǒng)的網(wǎng)絡(luò)服務(wù)擴大侵權(quán)內(nèi)容傳播三個環(huán)節(jié)。而生成式人工智能技術(shù)的發(fā)展,已經(jīng)將平臺著作權(quán)侵權(quán)規(guī)則推向了新的發(fā)展階段,即從單純關(guān)注內(nèi)容傳播領(lǐng)域的平臺責(zé)任向關(guān)注內(nèi)容生成和內(nèi)容傳播兩個并行領(lǐng)域的平臺責(zé)任轉(zhuǎn)變?;蛟S,我們已再次站到了與《數(shù)字千年版權(quán)法》誕生時相似的制度十字路口,需要從技術(shù)發(fā)展、著作權(quán)保護和內(nèi)容傳播等視角綜合思考,如何創(chuàng)設(shè)專屬于生成式人工智能時代的新“避風(fēng)港制度”。
五、結(jié)論與展望
面對ChatGPT類產(chǎn)品的快速發(fā)展,我們不禁感嘆生成式人工智能的“創(chuàng)作時代”或許真的是“將至已至、未來已來”。其在改寫內(nèi)容領(lǐng)域創(chuàng)作邏輯的同時,也對著作權(quán)法的底層制度帶來一系列顛覆性影響。如果說既有的著作權(quán)法從創(chuàng)作行為、規(guī)制主體、保護客體、權(quán)利范疇、侵權(quán)判定以及平臺治理等層面都難以應(yīng)對這一沖擊和挑戰(zhàn),那么本文所論證的核心觀點“生成式人工智能的興起將引發(fā)著作權(quán)法的徹底變革”,應(yīng)當說并非危言聳聽,而是揭開了這一難掩趨勢的帷幕。
人工智能領(lǐng)域技術(shù)的迭代速度驚人,從GPT-3.5到GPT-4只用了不到4個月,但各類性能都實現(xiàn)了質(zhì)的提升。OpenAI官方數(shù)據(jù)顯示,在美國律師執(zhí)照??贾校珿PT-4得分排在前10%,而GPT-3.5則為倒數(shù)10%;在生物奧賽排名中,GPT-4可達前1%,而GPT-3.5則在后31%。由此,出現(xiàn)全面超越既有ChatGPT類產(chǎn)品邏輯推理和內(nèi)容生成能力的新一代AI技術(shù)應(yīng)用,很可能并非僅是一種長期假想而是可預(yù)見的短期必然,并在既有著作權(quán)制度無力回應(yīng)時加速其徹底變革。鑒于我國在生成式人工智能技術(shù)研發(fā)和應(yīng)用領(lǐng)域尚處于起步階段,且與域外相比仍存在一定差距,本文在“破題”之后并不急于提出新的“立題”。因為,新一代生成式人工智能方興未艾,制度層面科學(xué)、可行的著作權(quán)應(yīng)對路徑,仍有待理論和實踐層面進一步的觀察和論證,相信這將會是一個價值平衡、利益博弈以及最終立法回應(yīng)的長期過程。
(作者:司曉,中南財經(jīng)政法大學(xué)產(chǎn)業(yè)教授、知識產(chǎn)權(quán)研究中心兼職研究員)
