以人工智能技術為代表的第四次工業(yè)革命席卷全球,數(shù)智技術已然成為新質生產(chǎn)力的重要驅動力量,我國傳統(tǒng)版權產(chǎn)業(yè)發(fā)展須同數(shù)智技術相向而行。然而,數(shù)智技術給版權法律帶來了許多新問題。如何科學解題不僅是法律適用問題,更要關注政策選擇。如何智慧求解,關乎我國相關產(chǎn)業(yè)的發(fā)展。
版權數(shù)據(jù)資源與科技資源的合作面臨挑戰(zhàn)
數(shù)智技術浪潮的席卷給傳統(tǒng)版權產(chǎn)業(yè)同時帶來機遇和挑戰(zhàn)。一方面,數(shù)智技術賦能內容生產(chǎn),催生了數(shù)智版權產(chǎn)業(yè),人工智能的崛起更是在一定程度上顛覆了傳統(tǒng)的知識生產(chǎn)和傳播模式。數(shù)智技術亦在不斷發(fā)展和迭代,從Web1.0(個人電腦時代的互聯(lián)網(wǎng))到Web2.0(移動互聯(lián)網(wǎng)),再到Web3.0(AR、VR、元宇宙),作品傳播的路徑和應用場景日新月異;從PGC到UGC,再到AIGC,作品創(chuàng)作的形式和傳播樣態(tài)紛繁復雜。
具體而言,隨著生成式人工智能技術的不斷發(fā)展,利用人工智能進行創(chuàng)作的場景越來越多。目前,人工智能已經(jīng)廣泛應用于影視制作(視頻生成視頻)、動漫、微短劇、非玩家角色等領域。在人工智能時代,利用人工智能輔助生成內容在一定程度上已經(jīng)常態(tài)化,且至少在特定范圍內人工智能生成物已然達到“以假亂真”的程度。
另一方面,數(shù)智技術帶來相關版權法律問題。在大模型訓練的過程中,數(shù)據(jù)喂養(yǎng)是關鍵一環(huán),高質量的數(shù)據(jù)成為人工智能生成物品質的決定性因素之一。然而,國內的大模型基本已經(jīng)“學完”來自公有領域的數(shù)據(jù),大模型學習對優(yōu)質數(shù)據(jù)的強烈需求同數(shù)據(jù)持有者的權益保護訴求成為一對必須面對且須通過特定手段解決的重大課題。
由于各種原因,例如,基于平臺優(yōu)勢,一些大模型開發(fā)者天然具有數(shù)據(jù)優(yōu)勢,而另一些大模型開發(fā)者則存在極度的數(shù)據(jù)短缺。由此,我國人工智能產(chǎn)業(yè)發(fā)展中存在不平衡的狀況。另外,人工智能產(chǎn)業(yè)的競爭可能還面臨其他問題。例如,國內模型開發(fā)大多基于國外的開源模型,這不僅存在合規(guī)風險,在一定意義上也可能存在安全隱患。
據(jù)權威調查,目前用于自然語言處理訓練超半數(shù)的公開數(shù)據(jù)集沒有許可證,其正當性存疑。另外,值得注意的是,數(shù)據(jù)公開并不等于權利人放棄版權利益,開源數(shù)據(jù)集的利用亦受制于開源協(xié)議,否則可能存在版權侵權風險、違約風險及其他風險。如何在保證國際競爭力的前提下遵循科學規(guī)律來開展人工智能產(chǎn)業(yè)的市場競爭是擺在行業(yè)發(fā)展面前的重要議題。人工智能產(chǎn)業(yè)發(fā)展參與主體復雜、利益主體多元,這給人工智能產(chǎn)業(yè)發(fā)展的監(jiān)管帶來不少挑戰(zhàn)。如何配置責任、如何追責才能達到利益均衡的狀態(tài)不僅考驗我國的管理部門,也對包括美國、歐盟在內的其他國家和地區(qū)提出監(jiān)管難題。
以出版業(yè)為例,在數(shù)智技術出現(xiàn)之前,傳統(tǒng)出版業(yè)主要是紙質出版和其他有形載體(例如磁帶、磁盤、光盤等)出版;在數(shù)智技術到來之后,傳統(tǒng)出版業(yè)發(fā)生了重大轉型。面對數(shù)字技術的沖擊,傳統(tǒng)出版業(yè)正從載體供給、知識提供演進到知識分析、知識優(yōu)化、知識喂養(yǎng)、知識供養(yǎng)和知識服務的新模式,出版從業(yè)者正不斷推動從傳統(tǒng)出版到智能出版、智慧出版的轉型。
數(shù)智技術可創(chuàng)新內容生產(chǎn),基于讀者需求提供定制化服務,賦能智慧內容生產(chǎn)和傳播;可創(chuàng)新翻譯與編輯校對,給傳統(tǒng)翻譯和編輯工作帶來“指數(shù)級”的助力;可創(chuàng)新營銷方式,不僅能夠打造數(shù)字圖書館、VR空間圖書館及AI交互式內容,甚至通過腦機接口進入“意識流”交流的時代,且通過技術加持,可繪制知識圖譜,建構銷售預測模型,創(chuàng)新出版和服務的呈現(xiàn)形式,亦可通過虛擬數(shù)字人以“圖書+課程”的方式創(chuàng)新產(chǎn)品形態(tài)與服務;可創(chuàng)新管理與賦能發(fā)展,可打造諸如速讀功能、智能決策等新的產(chǎn)品形態(tài),可推動傳統(tǒng)出版業(yè)從出版服務到知識服務的轉型。
然而,數(shù)智時代的到來也給傳統(tǒng)出版業(yè)帶來極大挑戰(zhàn)。一方面,品質不高的書籍以及移動閱讀對傳統(tǒng)紙質圖書市場帶來致命打擊;另一方面,雖然傳統(tǒng)出版業(yè)持有大量以數(shù)據(jù)形式呈現(xiàn)的優(yōu)質版權內容,但缺乏數(shù)據(jù)管理、數(shù)據(jù)治理、數(shù)據(jù)交易及數(shù)據(jù)維權的經(jīng)驗,導致無法融入數(shù)據(jù)產(chǎn)業(yè)鏈條,無法實現(xiàn)出版數(shù)據(jù)產(chǎn)品提質增效。此外,在“人工智能+出版”的實現(xiàn)過程中,不少出版機構雖進行了垂類開發(fā)和應用,但如何實現(xiàn)版權數(shù)據(jù)資源與科技資源的合作共贏依然面臨諸多挑戰(zhàn)。
業(yè)界期待版權爭議有更明晰的解決思路
數(shù)智時代關于版權的爭議不斷涌現(xiàn),其中,作品新的傳播和利用形式是否構成版權侵權備受關注。在AR、VR、元宇宙等場景中對作品的利用是否構成版權侵權及侵犯何種權利爭議不斷。
又如,通過“講書”的方式對作品進行利用是版權侵權還是合理使用?大模型需要大量的優(yōu)質數(shù)據(jù),數(shù)據(jù)是否可被自由利用,機器學習是否構成對復制權、發(fā)行權、改編權、信息網(wǎng)絡傳播權及其他權利的侵犯,機器學習又是否構成合理使用,人工智能生成物是否構成作品、是否具有可版權性、是否可能構成版權侵權等問題正考驗我國司法實踐,業(yè)界期待有更明晰的答案。
算力、算法和數(shù)據(jù)是大模型的三大要素,均發(fā)揮著重要作用。然而,人工智能生成物的權益歸屬是否應受上述因素的影響及受到何種程度的影響依然需要探討。例如,集成大模型付諸應用的民商事主體可能是優(yōu)質數(shù)據(jù)持有者,在垂類應用中用上述優(yōu)質數(shù)據(jù)進行模型訓練是否會惠益基礎模型,是否適宜通過用戶協(xié)議約定用戶生成內容的權益歸屬于服務提供者,垂類應用的服務提供者如何在此種應用場景中最大化自己的利益,都需要進一步研究和探索。
如何打破算力瓶頸、提升算法質量及補齊數(shù)據(jù)短板應成為當前我國政策選擇中的主要著力點。數(shù)智時代所帶來的不僅是“變革”,還是“革命”。面對新技術帶來的新業(yè)態(tài)、新領域、新問題,法律滯后、規(guī)范存漏是常態(tài)。在此種情形之下,行業(yè)發(fā)展需要規(guī)范,并且存在制度供給的需求。筆者認為,在這個階段應更多地指引和促進,而非更強的監(jiān)管和約束,應更多地促進產(chǎn)業(yè)對話和協(xié)同合作,以更好地促進多方發(fā)展。
實踐中,我國人工智能產(chǎn)業(yè)發(fā)展存在一定市場失靈的情形,此種市場失靈可能源于壟斷(例如算力壟斷、數(shù)據(jù)壟斷)、外部性、不完全信息(例如數(shù)據(jù)持有者與模型訓練者之間的信息不對稱)及交易成本問題(例如版權數(shù)據(jù)的確權及利用中的交易成本)。在市場失靈的情形下,試圖通過產(chǎn)權設定達到資源配置的最優(yōu)化可能存在一定困難。此時,可通過一定程度的政府干預,例如,通過算力促進來打破算力壟斷,通過數(shù)據(jù)供給來打破數(shù)據(jù)壟斷,通過數(shù)據(jù)公共產(chǎn)品的提供來解決數(shù)據(jù)短缺問題,通過模型可解釋性、可行的訓練數(shù)據(jù)披露來解決信息不對稱的問題,通過稅收、補貼等手段將外部性問題內部化,通過打造國家級數(shù)據(jù)交易平臺降低交易成本等。
或可選擇審慎包容的柔性管理
科技創(chuàng)新是新質生產(chǎn)力的核心驅動力,數(shù)智技術是新質生產(chǎn)力的核心要素。數(shù)智技術不僅能夠賦能傳統(tǒng)制造業(yè)的發(fā)展,亦將對版權產(chǎn)業(yè)的發(fā)展帶來革命性影響。以數(shù)智技術為重要驅動力的版權產(chǎn)業(yè)將成為“未來產(chǎn)業(yè)”的重要一環(huán),與數(shù)智科技結合、由數(shù)智科技賦能和引領的版權產(chǎn)業(yè)是新質生產(chǎn)力的重要組成部分。
管理部門應大力推動“未來版權產(chǎn)業(yè)”的產(chǎn)品化、市場化及公益化。這其中,必然遇到以產(chǎn)權設定為基礎的市場機制建構問題。在數(shù)智時代的“新版權產(chǎn)業(yè)”中,諸多問題尚在探索,諸多形勢尚不明朗。此時,宜遵守“市場先行、監(jiān)管托底”的思路,循序漸進“摸著石頭過河”。不宜過早立新法,亦不宜過早通過裁判進行指引,而應盡量在現(xiàn)有制度的框架之中尋求過渡性的解決方案。
例如,對于機器學習是否構成合理使用,一些從業(yè)者寄希望于《著作權法實施條例》的修訂能夠一錘定音。OpenAI官宣與新聞集團日前達成機器學習新聞版權數(shù)據(jù)的合作協(xié)議,這一事件盡管發(fā)生在美國,但對我國人工智能產(chǎn)業(yè)發(fā)展具有一定啟示意義:主張機器學習屬于合理使用或許在理論上可以證成,同時也有諸如在歐盟、日本等國家和地區(qū)的立法中將數(shù)據(jù)挖掘和非欣賞性使用界定為合理使用的做法,但試圖對數(shù)據(jù)持有者的優(yōu)質版權數(shù)據(jù)進行免費使用既不現(xiàn)實,亦可能并不合理。因此,可以預見的是,我國的大模型開發(fā)者在窮盡公有領域的數(shù)據(jù)之后,宜通過授權付費的方式獲得更多更優(yōu)質的數(shù)據(jù)。
已有的實踐經(jīng)驗值得被關注。例如,在人工智能產(chǎn)業(yè)發(fā)展中,不糾結算力、算法和數(shù)據(jù)中的哪種因素起到關鍵性作用,而是通過“算力伙伴”“算法伙伴”與“數(shù)據(jù)伙伴”的資源整合和優(yōu)化配置在“協(xié)商”的基礎之上將產(chǎn)品做出來,再慢慢探索問題的解決方案。筆者認為,國家應支持建立優(yōu)質數(shù)據(jù)庫,指引數(shù)據(jù)合規(guī),大力推動我國數(shù)字技術和人工智能產(chǎn)業(yè)發(fā)展,賦能我國版權產(chǎn)業(yè)升級換代,增強核心競爭力。
數(shù)智時代的很多問題具有“未來性”,在“未來”并不明朗的時候,管理部門或可通過審慎包容的柔性管理代替過早的產(chǎn)權設定。
〔作者單位:對外經(jīng)濟貿(mào)易大學法學院、鄭州大學法學院(知識產(chǎn)權學院)〕
