原標(biāo)題:人工智能創(chuàng)作利用數(shù)據(jù)應(yīng)納入合理使用的價(jià)值考量
近期,與人工智能創(chuàng)作中獲取與使用數(shù)據(jù)的合法性問題有關(guān)的研究文獻(xiàn)中,有的以“合理使用制度的整體重塑”為關(guān)注對(duì)象,有的則以“文本與數(shù)據(jù)挖掘”為討論視角,直接從人工智能創(chuàng)作視角關(guān)注數(shù)據(jù)作品獲取與使用的著作權(quán)風(fēng)險(xiǎn)的研究仍為數(shù)不多。
立足于此,本文將在此前深入評(píng)估人工智能創(chuàng)作中獲取與使用數(shù)據(jù)的風(fēng)險(xiǎn)類型的基礎(chǔ)之上,借鑒國際立法并結(jié)合中國實(shí)際探尋科學(xué)、合理、務(wù)實(shí)的化解之道,希冀有助于深化人工智能創(chuàng)作的知識(shí)產(chǎn)權(quán)問題研究,并借此推動(dòng)人工智能技術(shù)應(yīng)用和文化產(chǎn)業(yè)發(fā)展。
現(xiàn)實(shí)考量——傳統(tǒng)許可模式難以滿足數(shù)據(jù)規(guī)模化利用
人工智能創(chuàng)作所使用的數(shù)據(jù)在價(jià)值上具有低密度性,即單個(gè)作品對(duì)最終形成的創(chuàng)作成果貢獻(xiàn)極小,由此意味著只有大批量、規(guī)?;厥褂脭?shù)據(jù)對(duì)人工智能創(chuàng)作才有意義。這種低密度性特征給著作權(quán)的傳統(tǒng)授權(quán)模式帶來極大挑戰(zhàn):一方面,要避免人工智能創(chuàng)作物一經(jīng)生成便背負(fù)上侵權(quán)的“原罪”風(fēng)險(xiǎn),唯一途徑就是逐一獲得數(shù)據(jù)作品著作權(quán)人的許可并支付報(bào)酬;另一方面,要求人工智能系統(tǒng)使用者為了實(shí)施創(chuàng)作從“海量作者”中點(diǎn)對(duì)點(diǎn)地獲得“海量作品”的“海量許可”在現(xiàn)實(shí)中幾乎不太可能。由此便產(chǎn)生美國學(xué)者戈登所提出的著作權(quán)許可市場失靈的問題,即當(dāng)事人之間無法通過市場交易實(shí)現(xiàn)對(duì)版權(quán)作品的有效利用,此時(shí)采用合理使用規(guī)則配置數(shù)據(jù)資源可能是實(shí)現(xiàn)社會(huì)福利和公共利益最大化的最佳選擇。
有觀點(diǎn)提出,可以采用法定許可制度解決人工智能創(chuàng)作中使用數(shù)據(jù)作品的困境。筆者以為,采用法定許可制度仍需支付報(bào)酬,由于人工智能創(chuàng)作所使用的數(shù)據(jù)具有數(shù)量大、種類多、范圍廣的特點(diǎn),決定了實(shí)施人工智能創(chuàng)作所支付的數(shù)據(jù)許可費(fèi)用是非常巨大的。當(dāng)人工智能創(chuàng)作使用數(shù)據(jù)作品所付出的許可費(fèi)遠(yuǎn)大于創(chuàng)作結(jié)果帶來的收益時(shí),作為理性“經(jīng)濟(jì)人”的人工智能投資者便不太可能接受此種作品的使用方式。此時(shí)如果不給予人工智能創(chuàng)作使用數(shù)據(jù)以侵權(quán)豁免,則有可能會(huì)導(dǎo)致兩種結(jié)果:一是人工智能投資者在面對(duì)海量作品的巨額使用費(fèi)時(shí)會(huì)減少甚至放棄人工智能創(chuàng)作技術(shù)的研發(fā)與應(yīng)用;二是一些人工智能企業(yè)可能會(huì)選擇鋌而走險(xiǎn),寧愿侵權(quán),也要置著作權(quán)于不顧而任意使用他人作品,反而加劇侵權(quán)行為的發(fā)生,特別是在人工智能創(chuàng)作使用數(shù)據(jù)一般都比較隱蔽、權(quán)利人不容易發(fā)現(xiàn)的情形下,此種情形發(fā)生的概率更大。此外,法定許可制度所面臨的使用費(fèi)難以落實(shí)的困境至今未能有效解決,使得我國的法定許可制度在一定程度上形同虛設(shè)。因此,即使是建議采用法定許可制度解決人工智能創(chuàng)作使用數(shù)據(jù)問題的學(xué)者也承認(rèn),“法定許可制度配套措施的落實(shí)仍存在相當(dāng)?shù)碾y度”。
公共政策考量——促進(jìn)文化藝術(shù)繁榮
人工智能創(chuàng)作以數(shù)據(jù)為“源頭活水”,數(shù)據(jù)的質(zhì)量往往在一定程度上決定人工智能創(chuàng)作成果的藝術(shù)價(jià)值。為了獲得高質(zhì)量的創(chuàng)作成果,人工智能企業(yè)需要大量優(yōu)質(zhì)的數(shù)據(jù)來進(jìn)行人工智能系統(tǒng)的培訓(xùn)。一般情形下,需要授權(quán)并付費(fèi)的數(shù)據(jù)往往使用價(jià)值更高一些,因此受著作權(quán)保護(hù)的數(shù)據(jù)作品對(duì)人工智能訓(xùn)練更具吸引力。
如果不為人工智能創(chuàng)作使用數(shù)據(jù)設(shè)置合理使用規(guī)則,要想使人工智能創(chuàng)作使用數(shù)據(jù)避免背負(fù)侵權(quán)“原罪”的風(fēng)險(xiǎn),使用者就必須獲得數(shù)據(jù)作品著作權(quán)人的許可并支付費(fèi)用。但正如前文所述,人工智能創(chuàng)作在使用數(shù)據(jù)上具有低密度性特征,為了降低使用成本并消除侵權(quán)風(fēng)險(xiǎn),人工智能企業(yè)往往傾向于將受著作權(quán)保護(hù)的作品剔除出數(shù)據(jù)庫,而更多使用那些不受著作權(quán)保護(hù)的處于公共領(lǐng)域的數(shù)據(jù)來訓(xùn)練人工智能,如此會(huì)造成創(chuàng)作結(jié)果的同質(zhì)化和低劣化,不利于著作權(quán)法“促進(jìn)文化藝術(shù)繁榮”價(jià)值目標(biāo)的實(shí)現(xiàn)。
如果全部都使用那些不受版權(quán)保護(hù)的處于公共領(lǐng)域的數(shù)據(jù)作品,可能會(huì)導(dǎo)致人工智能開發(fā)者“獲取限制較低但帶有偏見的數(shù)據(jù)集”來訓(xùn)練算法,從而影響創(chuàng)作結(jié)果的客觀性和準(zhǔn)確性,這一點(diǎn)對(duì)科學(xué)作品創(chuàng)作的影響尤為明顯。具體而言,在人工智能創(chuàng)作過程中,如果機(jī)器學(xué)習(xí)所使用的數(shù)據(jù)本身不夠完整或存在一定的價(jià)值傾向,則機(jī)器學(xué)習(xí)的結(jié)果也會(huì)存在一定的價(jià)值傾向,從而導(dǎo)致人工智能創(chuàng)作的作品存在一定的偏見。
當(dāng)人工智能研發(fā)者無法獲得著作權(quán)人的許可時(shí),機(jī)器學(xué)習(xí)的資源必然會(huì)局限在已經(jīng)進(jìn)入公共領(lǐng)域的作品中,但由于這些已處于公共領(lǐng)域的作品無法全面反映人類最新的智慧成果,勢必會(huì)導(dǎo)致人工智能創(chuàng)作的作品存在隱形偏見。若將人工智能創(chuàng)作使用數(shù)據(jù)納入合理使用范疇,能夠擴(kuò)大人工智能創(chuàng)作獲取學(xué)習(xí)資源的范圍,在一定程度上能夠避免隱形偏見,為社會(huì)提供更加優(yōu)質(zhì)的作品。
市場秩序考量——維護(hù)公平競爭
為了避免著作權(quán)侵權(quán)風(fēng)險(xiǎn)并降低使用成本,在采用傳統(tǒng)的談判授權(quán)方式幾乎不可能的情形下通過格式合同免費(fèi)獲取數(shù)據(jù)成為一些大型互聯(lián)網(wǎng)公司的選擇,當(dāng)今“用戶創(chuàng)造內(nèi)容”(UGC)模式的興起則使這種選擇成為現(xiàn)實(shí)。
隨著“人人都是創(chuàng)作者”時(shí)代的到來,普通的終端用戶身份正在發(fā)生變化,龐大的用戶群體每時(shí)每刻以創(chuàng)作者身份生成大量數(shù)據(jù)信息,這些數(shù)據(jù)信息可能包括電子郵件、博客、論壇帖子,其中不乏一些符合獨(dú)創(chuàng)性要求而享有著作權(quán)的作品。一些大型互聯(lián)網(wǎng)企業(yè)(例如谷歌、微軟、騰訊、蘋果、百度等)通過設(shè)置所謂“服務(wù)條款”或者“用戶須知”格式條款,要求用戶在注冊時(shí)選擇允許互聯(lián)網(wǎng)企業(yè)免費(fèi)使用用戶發(fā)布的信息,這樣就給大型互聯(lián)網(wǎng)企業(yè)采取“以服務(wù)換取數(shù)據(jù)”模式免費(fèi)使用用戶數(shù)據(jù)提供了機(jī)會(huì),從而為互聯(lián)網(wǎng)企業(yè)規(guī)避著作權(quán)侵權(quán)風(fēng)險(xiǎn)提供了可能。
但是,這種“以服務(wù)換取數(shù)據(jù)”模式通常只適用于大型互聯(lián)網(wǎng)企業(yè)。大公司收集的數(shù)據(jù)信息越多越能完善其人工智能服務(wù),從而也就能夠吸引更多用戶選擇其服務(wù)并進(jìn)而獲取更多信息。相反,中小企業(yè)則因?yàn)橛脩魯?shù)量少,其可以免費(fèi)使用的數(shù)據(jù)無論在數(shù)量還是質(zhì)量上都無法與大公司相比,久而久之會(huì)進(jìn)一步加劇這種相差懸殊的狀況,最終形成強(qiáng)者更強(qiáng)、弱者更弱的不公正的市場競爭環(huán)境。因此,如果不將人工智能創(chuàng)作中使用數(shù)據(jù)的行為納入合理使用,有可能造成高科技領(lǐng)域的不公平競爭。
國家戰(zhàn)略考量——促進(jìn)人工智能技術(shù)發(fā)展
在當(dāng)前新一輪科技革命和產(chǎn)業(yè)變革中,對(duì)社會(huì)影響最為廣泛的非人工智能技術(shù)莫屬,與此相適應(yīng),世界各國都在積極營造更有利于人工智能技術(shù)應(yīng)用和產(chǎn)業(yè)發(fā)展的政策法治環(huán)境。我國也非常重視人工智能技術(shù)的應(yīng)用與發(fā)展,積極營造有利于人工智能技術(shù)應(yīng)用和產(chǎn)業(yè)發(fā)展的法治環(huán)境具有回應(yīng)國家戰(zhàn)略關(guān)切、提升我國人工智能領(lǐng)域國際競爭力的現(xiàn)實(shí)意義。
當(dāng)前,我國的人工智能技術(shù)應(yīng)用和產(chǎn)業(yè)發(fā)展尚處于起步階段,在政策和法律上應(yīng)給予一定支持,如果要求人工智能創(chuàng)作中使用每一件數(shù)據(jù)作品都需經(jīng)過授權(quán)并支付報(bào)酬,無疑會(huì)增加人工智能技術(shù)研發(fā)的負(fù)擔(dān),阻滯人工智能技術(shù)開發(fā)和產(chǎn)業(yè)發(fā)展,最終使我國在新一輪科技革命和產(chǎn)業(yè)變革中處于更加被動(dòng)的境地。
另外,對(duì)于當(dāng)前正在人工智能領(lǐng)域進(jìn)行激烈競爭的每個(gè)國家而言,如果因人工智能創(chuàng)作使用作品在一國被認(rèn)定為侵權(quán),而在另一國屬于合理使用,則必然會(huì)使人工智能企業(yè)為了降低成本而向法律環(huán)境更為寬松的國家流動(dòng)。
比較法考量——國際數(shù)據(jù)作品合理使用規(guī)則
為化解人工智能創(chuàng)作使用數(shù)據(jù)的著作權(quán)侵權(quán)風(fēng)險(xiǎn),歐盟早在2016年就推出了《DSM指令(草案)》,并于第3條規(guī)定了“文本和數(shù)據(jù)挖掘”的著作權(quán)例外條款,因該條款對(duì)適用主體(僅為研究機(jī)構(gòu))和適用目的(非商業(yè)性)都作了較為嚴(yán)格的限制,被認(rèn)為會(huì)阻礙人工智能產(chǎn)業(yè)的發(fā)展。為此,2019年正式通過的歐盟《DSM指令》擴(kuò)大了適用范圍,通過兩個(gè)條文進(jìn)一步細(xì)化了“文本與數(shù)據(jù)挖掘著作權(quán)例外”的內(nèi)容,其中第3條保留了原草案內(nèi)容,將其適用范圍限定為不具有營利性的大學(xué)、研究機(jī)構(gòu)及文化遺產(chǎn)機(jī)構(gòu);第4條則將適用主體擴(kuò)大到基于商業(yè)目的的文本與數(shù)據(jù)挖掘,同時(shí)允許權(quán)利人通過協(xié)議、單方聲明等方式對(duì)此予以保留。
為便利人工智能創(chuàng)作使用數(shù)據(jù),日本亦曾兩次修改其著作權(quán)法。修訂后的規(guī)定將可以享受侵權(quán)豁免的行為從原來的復(fù)制、改編進(jìn)一步擴(kuò)大到向公眾提供,同時(shí)不限定適用的主體和目的,為商業(yè)機(jī)構(gòu)的營利性使用留下了適用空間。
美國以其較為靈活和極具解釋空間的開放式合理使用規(guī)則為人工智能技術(shù)應(yīng)用提供了更好的發(fā)展環(huán)境。首先,《美國版權(quán)法》所創(chuàng)立的合理使用認(rèn)定“四要素標(biāo)準(zhǔn)”具有較大的靈活性和較強(qiáng)的解釋空間。根據(jù)《美國版權(quán)法》第107條的規(guī)定,認(rèn)定某一作品使用行為是否屬于合理使用應(yīng)從4個(gè)方面予以衡量,這4項(xiàng)因素并非法定構(gòu)成要件,并不需要完全具備,在重要性上也難分伯仲,而是由法官進(jìn)行綜合考量,這就為立法時(shí)未預(yù)見到的新類型使用行為留下了適用空間。其次,美國司法實(shí)踐在“四要素標(biāo)準(zhǔn)”中又發(fā)展出了轉(zhuǎn)換性使用規(guī)則,進(jìn)一步拓展了合理使用的適用范圍。
近年來,美國法院在論文查重、人臉識(shí)別、數(shù)字圖書館建設(shè)等案件中對(duì)轉(zhuǎn)換性使用規(guī)則采取了較為寬泛的解釋,以適應(yīng)“機(jī)器閱讀和創(chuàng)作”之需。一些美國學(xué)者也呼吁,為了促進(jìn)美國人工智能技術(shù)的順利發(fā)展,應(yīng)將基于數(shù)據(jù)使用的“機(jī)器學(xué)習(xí)”明確納入合理使用之中。
