核心提示:人工智能發(fā)展到現(xiàn)階段,與之相關(guān)的訓(xùn)練數(shù)據(jù)來源合法性爭議在全球凸顯。美國加州一法院對兩件涉及人工智能大模型訓(xùn)練的裁判要點引發(fā)廣泛關(guān)注。有學(xué)者建議,對生成式人工智能使用版權(quán)問題,應(yīng)在輸入端認可訓(xùn)練數(shù)據(jù)的合理使用,在輸出端禁止生成與原作品實質(zhì)性相似的內(nèi)容,還可探索版權(quán)人補償機制,以平衡產(chǎn)業(yè)利益。
人工智能(以下簡稱AI)訓(xùn)練數(shù)據(jù)領(lǐng)域版權(quán)“合理使用”問題有了新進展。近期,美國加州一法院對兩件涉及AI大模型訓(xùn)練,使用未經(jīng)授權(quán)的版權(quán)內(nèi)容案件作出簡易判決,認定“掃描合法購買的紙質(zhì)書籍將其數(shù)字化后用于人工智能大模型訓(xùn)練”屬于合理使用、“利用bt種子下載盜版圖書用于人工智能大模型訓(xùn)練”屬于合理使用、“從盜版網(wǎng)站下載數(shù)百萬書籍構(gòu)建自身永久性的數(shù)字圖書館”不構(gòu)成合理使用等。這些裁判要點引發(fā)國內(nèi)學(xué)界、業(yè)界廣泛關(guān)注。
從國內(nèi)來看,目前,尚沒有書籍、圖片、新聞等版權(quán)方與AI訓(xùn)練數(shù)據(jù)相關(guān)的侵權(quán)糾紛判決,但同樣面臨如何合理使用海量版權(quán)數(shù)據(jù)問題。
AI發(fā)展到現(xiàn)階段,與之相關(guān)的訓(xùn)練數(shù)據(jù)來源合法性爭議在全球凸顯。華中科技大學(xué)法學(xué)院副院長熊琦教授在談到這一問題時,用“教會徒弟,餓死師父”來比喻此間的紛爭,究其本質(zhì),仍是因技術(shù)產(chǎn)業(yè)發(fā)展所導(dǎo)致的版權(quán)產(chǎn)業(yè)與新興產(chǎn)業(yè)在利益分配上的博弈。

“合理使用”規(guī)則在AI訓(xùn)練數(shù)據(jù)中面臨大考
AI訓(xùn)練數(shù)據(jù)中涉及的版權(quán)問題首當其沖的是“復(fù)制權(quán)”。熊琦介紹,早期有種觀點認為,AI訓(xùn)練數(shù)據(jù)使用版權(quán)內(nèi)容用于機器學(xué)習(xí),屬于“非表達性使用”,不構(gòu)成著作權(quán)法意義上的復(fù)制,故,不需要討論侵權(quán)問題。但根據(jù)當前已生效的判決,以及美國和歐盟陸續(xù)公布的相關(guān)權(quán)威報告,現(xiàn)階段的共識是,AI通過學(xué)習(xí)海量作品掌握了人類語言邏輯、美術(shù)風(fēng)格等內(nèi)容,能夠生成人類的表達,這種在機器學(xué)習(xí)階段對作品的實質(zhì)性利用應(yīng)被認定構(gòu)成“復(fù)制”。在構(gòu)成“復(fù)制”的前提下,“合理使用”的判定就成為是否構(gòu)成侵權(quán)的爭議焦點——若不構(gòu)成合理使用,AI企業(yè)需向版權(quán)人支付費用;反之,則可免費使用。
作為著作權(quán)法中的重要規(guī)則,“合理使用”制度允許在特定情況下,可以不經(jīng)著作權(quán)人許可,使用其已經(jīng)發(fā)表的作品,且無需向著作權(quán)人支付費用。
北京市環(huán)球律師事務(wù)所合伙人孟潔律師介紹,在十三位作家控告Meta公司未經(jīng)授權(quán)使用其受版權(quán)保護的作品訓(xùn)練Llama大語言模型案中,美國法院依據(jù)四要素——使用目的與性質(zhì)、作品性質(zhì)、使用量與實質(zhì)性、對原作潛在市場的影響來判定是否構(gòu)成合理使用。其中,核心且具有張力的是,“是否具有轉(zhuǎn)化性目的”這一要素,它賦予了法官在應(yīng)對新類型問題時的較大解釋空間。
熊琦介紹,在美國近期涉及機器學(xué)習(xí)的判例中,判定構(gòu)成“合理使用”的重要標準之一是使用目的的轉(zhuǎn)換性。在AI訓(xùn)練數(shù)據(jù)的使用場景中,企業(yè)使用版權(quán)作品的目標,是通過訓(xùn)練算法以生成新內(nèi)容,而并非直接享受作品創(chuàng)作原初的使用目的。這種目的上的轉(zhuǎn)換性在美國法院的判決中已被認定為合理使用。歐盟在《數(shù)字單一市場版權(quán)指令》中設(shè)計了文本與數(shù)據(jù)挖掘(TDM)機制,規(guī)定以科學(xué)研究為目的進行文本與數(shù)據(jù)挖掘構(gòu)成合理使用。同時,在另一款允許商業(yè)性的文本與數(shù)據(jù)挖掘例外條款中,指令賦予著作權(quán)人“選擇—退出”的程序,即著作權(quán)人可以提出聲明不能對其作品進行文本與數(shù)據(jù)挖掘。
我國著作權(quán)法2020年修改后,第二十四條有了新的變化,以列舉形式規(guī)定了在“指明作者+作品名稱+不影響作品正常使用+不得不合理地損害著作權(quán)人的合法權(quán)益”的前提下,構(gòu)成合理使用的情況,對AI訓(xùn)練數(shù)據(jù)相關(guān)的新的類型行為未列入其內(nèi)。
“在當前AI訓(xùn)練使用版權(quán)內(nèi)容問題上,各法域的‘合理使用’規(guī)則都面臨大考。”孟潔認為,目前,國內(nèi)著作權(quán)法合理使用條款的規(guī)定,對AI訓(xùn)練使用版權(quán)作品的適用空間很小。但根據(jù)2011年12月20日最高人民法院發(fā)布的《關(guān)于充分發(fā)揮知識產(chǎn)權(quán)審判職能作用推動社會主義文化大發(fā)展大繁榮和促進經(jīng)濟自主協(xié)調(diào)發(fā)展若干問題的意見》(以下簡稱《意見》)第8條,存在與美國四要素模式相似的適用解決空間。
《意見》第8條規(guī)定,在促進技術(shù)創(chuàng)新和商業(yè)發(fā)展確有必要的特殊情形下,考慮作品使用行為的性質(zhì)和目的、被使用作品的性質(zhì)、被使用部分的數(shù)量和質(zhì)量、使用對作品潛在市場或價值的影響等因素,如果該使用行為既不與作品的正常使用相沖突,也不至于不合理地損害作者的正當利益,可以認定為合理使用。
對原作品的替代性影響成為關(guān)鍵
“人工智能是20世紀60年代即已誕生的概念,近年來,人工智能應(yīng)用的突破和普及,并非主要得益于算法技術(shù)的顛覆性發(fā)展,而是算力的顯著提升和大數(shù)據(jù)的助力,推動生成式人工智能時代的真正到來。”熊琦表示,當下AI生成的內(nèi)容足以與人類創(chuàng)作一較高下,甚至取而代之,加之AI在應(yīng)用端的大規(guī)模普及,版權(quán)人與AI企業(yè)間矛盾也開始凸顯,博弈便不可避免。
在美國法院的兩例判決中,AI開發(fā)公司在未獲得授權(quán)許可而使用版權(quán)作品的情況下,如何獲取原作品也是關(guān)注熱點。其中一案認定下載盜版圖書進行AI訓(xùn)練被認定為合理使用。對此,孟潔認為,這一判決情況成為未來普遍的司法裁判尺度的可能性不高。在歐盟TDM機制下,即使規(guī)定相關(guān)場景及條件下,允許不經(jīng)授權(quán)進行文本和數(shù)據(jù)挖掘用于AI訓(xùn)練,但獲取原作品的途徑方式等,仍是判斷是否構(gòu)成合理使用的前提。
熊琦認為,單從輸入端即AI訓(xùn)練數(shù)據(jù)這一過程來看,從鼓勵人工智能產(chǎn)業(yè)發(fā)展的立場角度考量,目前,日本、新加坡在法律政策上給予了AI企業(yè)極大力度支持,直接放開了訓(xùn)練數(shù)據(jù)階段對版權(quán)作品的使用限制。但從輸出端來看,如果AI生成內(nèi)容與原作品構(gòu)成實質(zhì)性相似,則AI生成內(nèi)容即可能對原作品的著作權(quán)市場產(chǎn)生替代,當然就不構(gòu)成合理使用。
孟潔表示,國內(nèi)目前已生效的AI版權(quán)相關(guān)訴訟案件判決中,比如廣州互聯(lián)網(wǎng)法院審理的“奧特曼案”、長沙市中級人民法院審理的全國首例AI文生視頻案等,被告最終被判定構(gòu)成侵權(quán)的核心還是聚焦在輸出環(huán)節(jié)存在對作品的復(fù)制改編情形。美國Meta案中,法院在說理部分亦強調(diào):如果原告能夠充分論證被告的使用行為會對原告作品產(chǎn)生實質(zhì)性的替代效果(即對原告作品潛在市場的影響),則其能夠在“合理使用”問題上勝訴。
AI訓(xùn)練數(shù)據(jù)的版權(quán)問題待解
孟潔表示,在AI和版權(quán)人博弈問題上,“利益鴻溝”問題是版權(quán)人斗爭的根本出發(fā)點。雖然,近期美國法院判決顯現(xiàn)AI在“合理使用”的博弈中略呈上風(fēng)態(tài)勢,但利益相對均衡的商業(yè)形態(tài)才能更長久,“合合”才能共贏。
“是否構(gòu)成合理使用,是否構(gòu)成侵權(quán),目前仍需要根據(jù)個案來具體認定。”熊琦表示,盡管美國已有AI訓(xùn)練數(shù)據(jù)領(lǐng)域版權(quán)糾紛相關(guān)的判決,但仍有大案懸而未決,比如《紐約時報》訴微軟和OpenAI案,《紐約時報》就OpenAI公司的ChatGPT和微軟公司的Copilot在未經(jīng)許可且未付費的情況下,非法復(fù)制和使用其數(shù)百萬篇原創(chuàng)文章,以侵犯版權(quán)為由起訴。美國作為AI產(chǎn)業(yè)與版權(quán)產(chǎn)業(yè)均高度發(fā)達的國家,在這個代表性案例中如何平衡兩大產(chǎn)業(yè)間利益,備受關(guān)注。
孟潔提到,歐盟TDM機制在適配和解決AI訓(xùn)練使用版權(quán)作品問題上已逐漸體現(xiàn)出一些不足。比如已有大量版權(quán)人利用“選擇—退出”程序來避免被AI開發(fā)者無償使用其作品。從而有觀點認為,TDM機制導(dǎo)致了“雙輸”的經(jīng)濟效果,不是該問題理想的解決方案。
對生成式人工智能使用版權(quán)問題,熊琦認為,應(yīng)堅持“寬進嚴出”原則,在輸入端認可訓(xùn)練數(shù)據(jù)的合理使用,以推動AI產(chǎn)業(yè)發(fā)展;輸出端嚴格禁止生成與原作品實質(zhì)性相似的內(nèi)容,避免侵權(quán)。同時,還可探索版權(quán)人補償機制,比如由AI企業(yè)向著作權(quán)集體管理組織支付使用費用,平衡產(chǎn)業(yè)利益。
孟潔表示,AI訓(xùn)練使用版權(quán)作品的獲取方式,最理想的狀態(tài)一定是授權(quán)使用,在授權(quán)的過程中雙方可以就包括輸出端在內(nèi)的合作方式作更多模式探討,事實上目前也已有越來越多的授權(quán)合作實踐了。比如OpenAI正在開發(fā)ChatGPT中的支付結(jié)賬系統(tǒng),這意味著人工智能產(chǎn)品作為新的流量入口的時代日漸到來。
“我國也要在法律層面為AI產(chǎn)業(yè)發(fā)展留足空間。”熊琦建議,針對我國現(xiàn)行著作權(quán)法中合理使用條款缺乏對AI訓(xùn)練的相關(guān)規(guī)定,可通過立法調(diào)整擴大法律解釋空間,例如在《中華人民共和國著作權(quán)法實施條例》中增設(shè)與文本和數(shù)據(jù)挖掘相關(guān)的內(nèi)容條款,以備未來發(fā)展之需。
(北京市環(huán)球律師事務(wù)所律師柳玉清對本文亦有貢獻)
