本文根據中國臺灣智財局著作權組視察員陳俞安所著《生成式AI與著作權議題之國際趨勢》第二部分“各國AI政策介紹”內容進行匯編——
生成式AI(人工智能)對各行各業(yè)帶來巨大影響,尤其對創(chuàng)造和創(chuàng)作領域的影響深遠。因此,各國和各地區(qū)對生成式AI的法律規(guī)制也日益重視,其中,尤以著作權法(版權法)的規(guī)制為重點。本文介紹了各國和各地區(qū)對生成式AI的著作權法規(guī)制的相關政策以及對未來提出展望和趨勢預估,期望對讀者有所助益。
一、歐盟(EU)地區(qū)
歐盟地區(qū)出臺的涉及生成式AI的法規(guī)主要包括:(1)2019年3月通過的《數字單一市場著作權指令(Directive on Copyright and related rights in the Digital Single Market,以下簡稱CDSM指令)》;(2)2024年7月12日歐盟發(fā)布的《人工智能法(Artificial Intelligence Act,以下簡稱AIA)》;以及(3)德國法院作出的判例(德國漢堡地方法院 2024年9月27日在Kneschke訴LAION案作出的判決)。
其中,CDSM指令第3條規(guī)定了科研豁免行為,即“研究組織或文化遺產機構”為“科學研究之目的”進行數據探勘(mining)之規(guī)定,在適用主體上強調非營利性及公益性,并限于“有合法接觸權限(lawfully accessible)的著作”,由于該規(guī)定適用范圍相當有限,因此權利人不得以契約條款禁止上述數據探勘行為;而CDSM指令第4條規(guī)定不限非商業(yè)目的之數據探勘權利限制規(guī)定,不限適用主體,同樣限于“有合法接觸權限的著作”,且權利人可以保留其作品用于數據探勘用途的權利,即“選擇退出( opt-out)”。
其中,AIA已明確表示生成式AI的開發(fā)與訓練屬CDSM指令第4條規(guī)定的范疇,但是須尊重權利人選擇退出之意愿,當權利人依該條明示退出時,通用AI模型 (依AIA前言第97、99項,通用AI模型系指透過無監(jiān)督學習或強化學習等方式訓練大量數據,以勝任執(zhí)行各種不同任務的能力之模型。大型生成式人工智能模型即通用人工智能模型的典型例子)提供者需要獲得權利人的授權后才能利用(AIA前言第105項)。
值得注意的是,德國地方法院已有判決認為,為生成式 AI 模型訓練用途重制他人圖片建置數據集之行為,符合德國著作權法第60d條(依據CDSM指令第3條所增訂)“為科學研究目的之資料探勘”權利限制規(guī)定,且法院另補充說明,認為被告重制行為亦符合德國著作權法第44b條一般數據探勘之目的(同CDSM指令第4條),但因權利人已依該條規(guī)定聲明退出,故無法適用。
然而許多權利人團體(組織)擔心創(chuàng)作內容被用于訓練資料影響權益,紛紛表達了“退出”AI訓練數據使用的意愿(如索尼音樂集團、德國著作權集體管理組織GEMA等),對于AI開發(fā)商主張前述數據探勘權利限制規(guī)定將造成不小的沖擊,恐仍需積極地與權利人協商,探索新的合作模式,以取得高質量的訓練資料。至于哪些選擇“退出”方式與技術符合法律要件仍未明確,OpenAI、Google及Apple公司陸續(xù)開發(fā)可自動判斷網站退出信息之爬蟲工具(需以robots.txt等機器可讀形式明示退出數據探勘之用途);微軟則表示須依該公司規(guī)定的形式表達對“特定模型”的退出(權利人需重復為不同訓練模型“選擇退出”,耗費心力);有些公司甚至沒有提供“退出”的選項(Meta承認了臉書IG 貼文全被拿去訓練AI),前述德國地方法院判決則認為不需要求特定技術格式,以純文本聲明亦符合退出聲明。為解決上述AIA實施面臨的問題,需要標準化相關規(guī)范(如“退出”方式)作為實務運作之依據,歐盟AI辦公室爰于法案通過后,陸續(xù)尋求包括AI模型提供者、民間組織、學術界及相關產業(yè)等近千名利害關系人召開數次會議,磋商具體可行的行為準則(code of practice),預計將于2025年5月發(fā)布,以確保模型提供者落實相關義務。
二、英國
英國早在2014 年就于《著作權、設計及專利法》第29A條規(guī)定數據探勘權利限制規(guī)定,但僅限于非商業(yè)之研究目的,適用范圍相當有限。近年英國政府曾討論為因應AI發(fā)展趨勢,修正放寬可用于商業(yè)用途,但是遭遇音樂、出版等創(chuàng)意產業(yè)強烈反對而撤案。在此同時,英國人工智能和知識產權部長認為透過立法來平衡AI開發(fā)商和權利人的利益的任務艱巨,不如推動AI產業(yè)及創(chuàng)意產業(yè)間之協議,建立自愿性著作權行為準則(a voluntary AI copyright code of practice),讓AI開發(fā)商取得訓練模型之高質量數據的同時,內容創(chuàng)作者也能得到充分的補償,但2024年2月該自愿性協議因無法取得產業(yè)間的共識而暫緩推動。 2024年7月新政府(工黨)上任后,強調AI產業(yè)創(chuàng)新對經濟發(fā)展的重要性,為打造有利AI產業(yè)發(fā)展之法律環(huán)境,爰于同年12月進行為期2個月的公眾咨詢,討論是否參考歐盟CDSM指令規(guī)定不限非商業(yè)目的之數據探勘權利限制規(guī)定,并提供權利人選擇退出之機制,但此提案仍受到音樂產業(yè)強烈反對,尚待協商尋求共識。與此同時,英國政府推出《AI行動計劃》,規(guī)劃與國家檔案館、大英圖書館及英國廣播公司(BBC)等機構合作,建立無著作權疑慮(copyright-cleared)之內容數據庫,以推動大規(guī)模國際授權,則系在遵循現行著作權法之前提下,將高質量數據釋出,以促進AI創(chuàng)新與應用發(fā)展。
三、美國
美國雖然沒有針對資料探勘制定例外規(guī)定,但著作權法規(guī)定第107條為評論、研究等目的合理使用著作,不構成著作權侵害之概括合理使用(fair use)規(guī)定,其判斷應考慮四個要素:1、利用之目的與性質,包括系商業(yè)性或非營利目的;2、著作的性質;3、所利用之質量及其在整個著作所占之比例;4、對著作潛在市埸或價值之影響。其中又以第一個要素“利用目的與性質”是否具有“轉化性”為判斷合理使用的關鍵考慮,也就是對著作的利用添加新的要素、具有與原著作不同利用的性質或目的,且不致造成替代原著作的使用,此種“轉化性利用(transformative use)”較容易被認定為合理使用。
而在科技日新月異的時代,利用他人著作是否構成“轉化性利用”而有美國著作權法第107條概括合理使用之適用,是美國訴訟中的重要爭點,美國第二巡回上訴法院就Google Books案之判決,為數字技術合理使用他人著作之經典案例,法院認為Google將書籍數字化,顯示片段訊息以供群眾檢索、瀏覽,是一種合理使用,且具有高度轉化性,增加了大眾認識該等作品的機會,而非向公眾提供原作品的實質替代物,且增進公共利益,符合美國著作權法第107條概括合理使用規(guī)定,亦是目前AI開發(fā)商在辯護中的主要依據之一。
然而從2023年美國最高法院在最新的安迪沃荷( Andy Warhol)案之判決觀之,即使在原作品中添加新的意義而構成“轉化性”使用,法院認為仍然必須衡量二創(chuàng)作品“利用原創(chuàng)作之目的與性質”與原創(chuàng)作者間的衡平利益。因此,生成式AI之被告生成內容與原告作品如具有相同或類似的使用目的、可能取代原作之市場,而被告的大量重制他人著作卻未見對原作之回饋,或欠缺公共利益等,似不當然能主張轉化性的合理使用。美國版權局在2024年7月發(fā)布的政策建議報告亦指出,使用藝術家作品訓練AI模型,以模仿或生成類似風格內容之情形,不排除作者請求損害賠償的可能性,強調AI技術發(fā)展與創(chuàng)作者權益間衡平之重要性。
關于未經授權利用他人著作訓練AI模型的訴訟, 2020年曾有科技公司搜集了知名法律信息檢索平臺之判決摘要訓練AI搜索引擎被該平臺提告,美國地方法院于2023年9月之中間判決提到,如果模型訓練過程中的復制只是為了分析語言模式,以開發(fā)“全新的”、具競爭性產品的過程,且不會包含或輸出侵權內容,則可能屬“具轉化性的中間復制”(transformative intermediate copying)而構成合理使用,并分析未來考慮AI訓練數據合理使用的核心問題包括允許AI使用受保護著作進行訓練之轉化性是否夠大、是否帶來公共利益,以及對原作市場是否造成阻礙等。而本案于2025年2月作出判決(仍可上訴),法院認為被告將摘要作為法律研究工具之目的與原告相同,不具轉化性,且意圖開發(fā)市場替代品與原告競爭,未能增進公共利益、損害原告授權他人訓練模型的潛在市場,因此不構成合理使用。本案雖僅針對“非生成式”AI 進行審理,但其分析仍為未來法院審理AI相關侵權訴訟提供重要指引。
各國于2023年至2024年間已有數十件利用他人著作訓練AI模型相關著作權侵權訴訟,因此法院在個案將如何詮釋、衡量此些關鍵要素,值得密切關注。
四、日本
日本于2018年修訂著作權法第30條之4關于數據探勘權利限制規(guī)定,“不以享受著作中表達的思想或情感為目的”,可在“必要范圍內利用著作”,但不得“不當損害著作權人利益”,因此數據探勘用于生成式AI學習,原則上將不構成侵權,看似較其他國家規(guī)范更加寬松,但對創(chuàng)作人權益影響甚大,因此日本2023年10月起組成“AI時代的知識產權研討小組”陸續(xù)就生成式AI發(fā)展過程之問題進行討論,明確列舉多項需例外取得授權之情形,故利用他人著作于訓練AI模型仍須謹慎。
如具有“以享受為目的”而不適用上述限制規(guī)定之情形,包括為回答使用者提問之檢索增強生成技術(Retrieval-Augmented Generation,RAG),以及僅使用特定創(chuàng)作者之作品進行額外學習等情形;規(guī)避付費數據庫以獲取數據,則屬“不當損害著作權人利益”而被排除適用。此外,如果特定AI產品生成侵權內容的頻率很高,那么該AI產品提供者被認定為侵權主體的可能性將會增加。
日本作為全球動漫產業(yè)大國,包含漫畫家、作曲家、插畫家、攝影、圖書等內容創(chuàng)作者對于生成式AI可能侵害其著作權益表達擔憂,因此政府為減少創(chuàng)作者顧慮,持續(xù)梳理AI發(fā)展過程之著作權問題并針對不同利用主體提供應對方法,從法律、技術及契約三方面著手,例如建議“AI開發(fā)及提供者”于訓練階段檢視是否有“以享受為目的”之情形(法律面)、于生成階段采取過濾措施防止生成與現有作品類似的作品,降低被認定為侵權主體的可能性。同時也建議“權利人”實施可防止AI侵權學習之措施,包括使用“robots.txt”等機器可讀格式等限制數據被搜集(技術面)、透過賬號和密碼等方式限制他人接觸、或將作品整理為數據集有償提供權利人進行追加學習等(契約面)。
此外,日本內閣府指出上述法律、技術及契約三者間之相互關系,并考慮到每種方法都有其局限性,因此三者應發(fā)揮互補作用,并應以動態(tài)的方式應對生成式 AI 可能帶來的侵權風險 38,值得參考。
五、韓國
韓國國會議員曾于2021年提出著作權法修正草案,參考日本立法例,增訂第43條數據探勘限制規(guī)定,即“非享受著作所表現的思想或感情之目的”,為“生成追加性的信息或價值”,可就合法接觸之著作在必要限度內重制、公開傳輸,強調就既有著作之加值利用,以符合產業(yè)發(fā)展需求,惟該草案因國會任期屆滿而于2024年5月失效。有學者認為韓國2011年增訂之著作權法第35-3條概括合理使用規(guī)定或可作為替代方案,然而韓國在概括合理使用原則的司法判決積累遠不如美國,將使得AI開發(fā)商利用他人著作訓練模型時,面臨相當大的不確定性和挑戰(zhàn)。
為應對AI利用著作訓練模型之爭議,韓國著作權委員會邀集學界、法律專家、技術專家及利害關系人組成“AI著作權制度改善工作小組”,并于2024年1月發(fā)布“生成式AI著作權指引”,主要系在現有法律制度下如何避免侵權提供建議,首先,AI開發(fā)商在AI學習階段,建議支付權利人足夠的報酬、使用公共領域作品或其他方式,確保訓練數據之合法權限。其次,在AI生成階段,建議采取過濾措施來防止生成與現有作品相似的內容。而著作權人如不希望作品被用于AI模型訓練,可透過網站使用條款或機器可讀格式聲明退出,另建議用戶輸入指令時應避免誘使AI生成侵權內容,并不得發(fā)布可能侵權的AI生成內容。
此外,為確保AI開發(fā)商能夠合法利用他人著作訓練,前述工作小組于2024年6月28日提出建議,認為政府或學術機構可在著作權集體管理團體與AI開發(fā)商之間的談判授權過程擔任中介角色,并可考慮增訂資料探勘權利限制條款,以促進對著作權保護內容的使用,至于生成式AI開發(fā)商如何揭露AI訓練所使用的內容清單以滿足透明度義務,則仍在研析中。另一方面,為促進AI技術產業(yè)發(fā)展,韓國國會于2024年12月通過由科學和信息通訊技術部提出之“AI發(fā)展和信任建立基本法”(下稱韓國AI基本法),其中為解決AI開發(fā)商合法取得訓練資料之難題,該法第15條24明定政府可自行或指定特定組織建立數據提供系統(tǒng),促進系統(tǒng)數據之搜集、管理、流通與利用,并可針對使用系統(tǒng)數據者收取費用,以確保系統(tǒng)的持續(xù)運作與公平性。但是韓國AI基本法于2026年1月始生效,能否成功為 AI 開發(fā)商提供合法且穩(wěn)定的數據源,解決數據取得的挑戰(zhàn),仍有待進一步觀察與評估。
六、新加坡
新加坡于2021年修正著作權法,其中第244條數據探勘權利限制規(guī)定,明定包含“為資料探勘準備著作(preparing the work)”(例如將原始數據格式化或轉換文件格式),以及為數據分析目的有關的合作研究或學習,得向公眾傳播所重制之著作,且限于“合法接觸之著作”,條文還特別舉出“規(guī)避付費機制”或“違反數據庫用戶條款”作為不適用本條要件之反面案例。然利用來源如為非法重制物,在“僅為本條所定數據探勘目的之必要”情形下亦有本條款之適用,可見新加坡資料探勘權利限制規(guī)定在要件上較為寬松,且根據同法第188條規(guī)定,權利人不得另以契約條款“退出”上述資料探勘權利限制用途。不過,新加坡2024年發(fā)布之“生成式人工智能模型治理架構(下稱 AI 治理架構)”仍提到應促進利害關系者間公開對話,以衡平利益之方式解決利用他人著作進行模型訓練之爭議。
七、中國香港
中國香港政府為提升對AI技術發(fā)展之保障,計劃于“版權條例”制定新的數據探勘權利限制規(guī)定,同時試圖維護著作權人與利用人間的利益平衡,針對數據探勘、用于提升計算機程序效能的計算機數據分析及處理(如AI模型的開發(fā)、訓練、提升)之情形設定要件,包括 1、限于“合法存取之著作”;2、若存在可用的授權方案或著作權人已明確保留其權利(即選擇退出),則該數據探勘活動將被視為未經授權;3、對進一步傳播、散布、經銷在該等權利限制規(guī)定下制作的重制物附加限制。
為確保法規(guī)修訂能兼顧公共利益并充分考慮各界意見,香港政府于2024年7月展開為期兩個月的公眾咨詢。然而目前仍未正式發(fā)布最終修訂版本,顯示不同利害關系人之修正建議,仍在討論協商階段。
