德國(guó)慕尼黑一家地方法院11月11日宣判,OpenAI未經(jīng)許可將音樂(lè)家創(chuàng)作的歌詞用于模型訓(xùn)練,構(gòu)成著作權(quán)侵權(quán)。
過(guò)去三年里,版權(quán)權(quán)利人與大模型公司之間的訴訟在世界各地接連不斷但又懸而未決。慕尼黑這起案件的出爐,被外界視為具有示范性意義。
2024年11月,著作權(quán)集體管理組織——德國(guó)音樂(lè)演出和作品復(fù)制權(quán)協(xié)會(huì)(GEMA)提起了這起訴訟。案件涉及九位德國(guó)音樂(lè)家的熱門歌曲。
原告指控稱,這些歌詞被OpenAI的大模型記憶后,當(dāng)使用者輸入簡(jiǎn)單提示詞時(shí),ChatGPT基本上會(huì)原樣再現(xiàn)歌詞。
OpenAI的反駁依據(jù)是,其開發(fā)的大模型并不存儲(chǔ)或復(fù)制特定的訓(xùn)練數(shù)據(jù),而僅在參數(shù)中反映了基于整個(gè)訓(xùn)練數(shù)據(jù)集所學(xué)到的內(nèi)容。由于模型輸出是用戶輸入的結(jié)果,因此應(yīng)由各個(gè)用戶而非被告對(duì)輸出的內(nèi)容負(fù)責(zé)。
OpenAI還援引版權(quán)法上的“文本與數(shù)據(jù)挖掘例外”作為辯護(hù)理由。這項(xiàng)例外由歐盟和德國(guó)當(dāng)?shù)胤蓜?chuàng)設(shè):如果權(quán)利人沒(méi)有在線上以機(jī)器可讀格式的聲明拒絕,可合法地對(duì)版權(quán)內(nèi)容進(jìn)行文本與數(shù)據(jù)挖掘使用。
對(duì)于OpenAI的說(shuō)法,法院并不認(rèn)同:無(wú)論是語(yǔ)言模型訓(xùn)練時(shí)對(duì)版權(quán)內(nèi)容的“記憶”,還是聊天機(jī)器人在輸出結(jié)果中復(fù)現(xiàn)歌詞,均構(gòu)成對(duì)著作權(quán)的侵害。
審理法院認(rèn)為,當(dāng)在模型訓(xùn)練過(guò)程中不僅從數(shù)據(jù)集中提取了信息,還在訓(xùn)練后形成的參數(shù)中包含了訓(xùn)練數(shù)據(jù)的完整復(fù)制時(shí),就存在這種“記憶化”。通過(guò)將訓(xùn)練數(shù)據(jù)中包含的歌詞與輸出中的再現(xiàn)進(jìn)行比對(duì),確認(rèn)了這種“記憶化”的存在??紤]到歌詞的復(fù)雜性和長(zhǎng)度,可以排除偶然因素導(dǎo)致其復(fù)現(xiàn)的可能性。這種“記憶化”構(gòu)成著作權(quán)法上的復(fù)制,即爭(zhēng)議歌詞以數(shù)據(jù)形式固定在模型的參數(shù)中。
按照法院的解釋,雖然大模型原則上屬于“文本與數(shù)據(jù)挖掘例外”的適用范圍,但該規(guī)定僅涵蓋數(shù)據(jù)集準(zhǔn)備階段進(jìn)行的必要提取行為,例如將作品轉(zhuǎn)換為另一種格式。背后的理念在于,這類提取僅僅是為了后續(xù)分析,不會(huì)影響到版權(quán)人的經(jīng)濟(jì)利益。
然而,如果像OpenAI這起案件那般,不僅從訓(xùn)練數(shù)據(jù)中提取信息,而且復(fù)制了作品,法院則認(rèn)為這并非可被豁免責(zé)任的“文本與數(shù)據(jù)挖掘”行為。這是因?yàn)椋?ldquo;文本與數(shù)據(jù)挖掘例外”的前提是,僅在作者利益未受損的前提下允許為分析目的進(jìn)行的信息提取,而模型中的復(fù)制行為卻實(shí)質(zhì)損害了作品的經(jīng)濟(jì)利用,侵犯了權(quán)利人的正當(dāng)利益。
針對(duì)模型輸出相似的歌詞文本,法院認(rèn)為該行為構(gòu)成未經(jīng)授權(quán)的復(fù)制與公開傳播。由于輸出結(jié)果僅由簡(jiǎn)單的提示詞生成,OpenAI的模型本身對(duì)輸出內(nèi)容有決定性影響,因此,應(yīng)由OpenAI而非用戶承擔(dān)侵權(quán)責(zé)任。
OpenAI將因侵權(quán)行為承擔(dān)賠償責(zé)任,但法院并未具體說(shuō)明賠償金額。GEMA的法律顧問(wèn)Kai Welp表示,預(yù)計(jì)將與OpenAI等就合適的許可費(fèi)用進(jìn)行談判。
GEMA在一份公開聲明中稱,這是歐洲首次對(duì)生成式AI使用受版權(quán)保護(hù)的作品進(jìn)行法律評(píng)估,并作出有利于創(chuàng)作者的裁決。
這起判決暫未生效,OpenAI仍可以上訴。OpenAI對(duì)外回應(yīng)稱:“不同意這一裁決,正在考慮下一步措施。該裁決僅涉及部分歌詞,不會(huì)影響德國(guó)數(shù)百萬(wàn)每天使用我們技術(shù)的個(gè)人、企業(yè)和開發(fā)者。”
另一起由GEMA起訴AI音樂(lè)公司Suno的訴訟,目前正在慕尼黑地方法院審理。該案預(yù)計(jì)于2026年1月26日開庭審理。
OpenAI在美國(guó)也面臨大量來(lái)自作家、新聞媒體等發(fā)起的版權(quán)侵權(quán)訴訟。今年4月,包括紐約時(shí)報(bào)起訴OpenAI在內(nèi)的十余起類似案件被合并處理,交由美國(guó)紐約南區(qū)聯(lián)邦地區(qū)法院統(tǒng)一審理,以消除重復(fù)取證,實(shí)現(xiàn)更高效審理,防止出現(xiàn)互相矛盾的裁決。在這些案件中,OpenAI通常援引“合理使用”的法律規(guī)定,作為未經(jīng)同意使用版權(quán)內(nèi)容的正當(dāng)化依據(jù)。
