結(jié)構(gòu)與參數(shù)是人工智能模型的核心要素,知識產(chǎn)權(quán)法可以提供相應(yīng)法律保護(hù)。筆者認(rèn)為,探討人工智能模型結(jié)構(gòu)與參數(shù)的知識產(chǎn)權(quán)保護(hù)問題,應(yīng)當(dāng)從人工智能模型結(jié)構(gòu)與參數(shù)的特性出發(fā),確定人工智能模型結(jié)構(gòu)與參數(shù)能否獲得知識產(chǎn)權(quán)專門法的保護(hù),然后討論是否可以適用反不正當(dāng)競爭法提供保護(hù),但應(yīng)當(dāng)運(yùn)用體系化思維妥善處理知識產(chǎn)權(quán)專門法與反不正當(dāng)競爭法之間的適用關(guān)系。
一、人工智能模型結(jié)構(gòu)與參數(shù)的技術(shù)概要
?。ㄒ唬┤斯ぶ悄苣P偷慕Y(jié)構(gòu)
結(jié)構(gòu)決定人工智能模型的計(jì)算方式和處理能力。人工智能模型的結(jié)構(gòu)多種多樣,其核心思想都是通過特定架構(gòu)和海量數(shù)據(jù)學(xué)習(xí)構(gòu)建輸入數(shù)據(jù)和輸出數(shù)據(jù)之間的關(guān)系。針對不同的執(zhí)行任務(wù)和功能需求,人工智能模型的結(jié)構(gòu)不盡相同,但大都包含輸入層、處理層、輸出層、損失函數(shù)、優(yōu)化算法等核心組件。
輸入層可以視為一套復(fù)雜且精巧的預(yù)處理流水線,其核心任務(wù)是將人類可理解的非結(jié)構(gòu)化原始數(shù)據(jù)轉(zhuǎn)換為模型可理解的數(shù)值化、結(jié)構(gòu)化的初始向量表示。通過輸入層,雜亂無序的原始數(shù)據(jù)被轉(zhuǎn)化為模型能夠消化和理解的機(jī)器數(shù)據(jù)。
處理層的功能是將輸入層傳來的初始向量表示,逐步轉(zhuǎn)化為富含豐富語義信息的高層表示,并為最終輸出內(nèi)容做好準(zhǔn)備。模型的處理能力在很大程度上取決于處理層的層數(shù),因此模型結(jié)構(gòu)就是從底層處理層到高層處理層組成的多個(gè)處理層的堆疊。通過層層遞進(jìn)的處理,模型逐步構(gòu)建對輸入數(shù)據(jù)從淺層表示到深層抽象的復(fù)雜理解,最終賦予模型強(qiáng)大的理解、推理和生成能力。
輸出層是模型流水線處理的最后一環(huán),核心職責(zé)是將處理層產(chǎn)生的、富含語義信息的高維隱藏狀態(tài)轉(zhuǎn)換為符合需求的最終形式。輸出層是連接模型內(nèi)部表示與外部任務(wù)的橋梁,具體設(shè)計(jì)取決于模型面向的具體任務(wù)。不同的生成策略可以控制模型的輸出行為,使輸出內(nèi)容在確定性、創(chuàng)造性和連貫性之間取得平衡。
損失函數(shù)通過衡量預(yù)測值與真實(shí)值之間的損失(差距),引導(dǎo)模型的學(xué)習(xí)方向。模型數(shù)據(jù)訓(xùn)練的目標(biāo)就是實(shí)現(xiàn)損失函數(shù)的最小化。不同類型的模型的損失函數(shù)的設(shè)計(jì)不盡相同,但是絕大多數(shù)模型的損失函數(shù)的核心思想都是讓模型預(yù)測數(shù)據(jù)分布盡可能接近真實(shí)數(shù)據(jù)分布。
優(yōu)化算法決定模型如何根據(jù)損失函數(shù)的反饋更新模型參數(shù),以提高其性能。在預(yù)訓(xùn)練階段,模型通過海量無標(biāo)注數(shù)據(jù)學(xué)到通用表示和知識,因此這一階段的優(yōu)化算法需要高效、穩(wěn)定并能處理巨大計(jì)算。完成預(yù)訓(xùn)練后,為適應(yīng)特定任務(wù)或?qū)R人類價(jià)值觀,模型參數(shù)需要進(jìn)行微調(diào),這就是微調(diào)對齊階段的算法優(yōu)化。目前,高效微調(diào)策略是主流方法,其核心思想就是凍結(jié)預(yù)訓(xùn)練后絕大部分已經(jīng)確定具體數(shù)值的參數(shù),只訓(xùn)練和更新額外引入的新參數(shù)。
?。ǘ┤斯ぶ悄苣P偷膮?shù)
參數(shù)也是模型的核心組成部分,直接決定模型如何根據(jù)輸入數(shù)據(jù)生成輸出內(nèi)容。參數(shù)是在模型數(shù)據(jù)訓(xùn)練過程中通過優(yōu)化算法從海量數(shù)據(jù)中學(xué)到的。模型數(shù)據(jù)訓(xùn)練的目的就是為模型參數(shù)找到一組最佳值,使模型的損失函數(shù)最小??梢园涯P蛥?shù)想象為模型內(nèi)部眾多帶有刻度的“旋鈕”。模型數(shù)據(jù)訓(xùn)練就是通過不斷地調(diào)整這些“旋鈕”的刻度,使模型在給定輸入數(shù)據(jù)時(shí),能夠盡可能生成符合預(yù)期的輸出內(nèi)容。模型數(shù)據(jù)訓(xùn)練完成后,其參數(shù)就被固定為一系列具體數(shù)值。模型參數(shù)及其具體數(shù)值體現(xiàn)了模型在數(shù)據(jù)訓(xùn)練過程中學(xué)到的所有表示、知識等。
以最常見的神經(jīng)網(wǎng)絡(luò)模型為例,權(quán)重和偏置是主要參數(shù)類型。當(dāng)輸入數(shù)據(jù)進(jìn)入模型時(shí),數(shù)據(jù)在神經(jīng)網(wǎng)絡(luò)中逐層傳遞。在每一層,數(shù)據(jù)會與權(quán)重相乘并加上偏置,然后通常經(jīng)過一個(gè)非線性激活函數(shù)生成該層的輸出,并作為下一層的輸入。這個(gè)過程逐層持續(xù)進(jìn)行,直到產(chǎn)生最終輸出內(nèi)容。簡言之,參數(shù)的數(shù)量及其具體數(shù)值是決定模型性能和能力的關(guān)鍵因素,共同決定輸入數(shù)據(jù)如何被組合、變換并最終產(chǎn)生預(yù)測結(jié)果。
二、知識產(chǎn)權(quán)法對模型結(jié)構(gòu)和參數(shù)的保護(hù)
?。ㄒ唬@▽δP徒Y(jié)構(gòu)與參數(shù)的保護(hù)
包括中國在內(nèi)的世界主要國家的專利審查授權(quán)機(jī)構(gòu)已經(jīng)授權(quán)大量涉及人工智能模型結(jié)構(gòu)的專利。這些專利包括產(chǎn)品(裝置)專利和方法專利,涵蓋模型結(jié)構(gòu)的設(shè)計(jì)、改進(jìn)及應(yīng)用等。這說明模型結(jié)構(gòu)本身、模型結(jié)構(gòu)的優(yōu)化方法等可以獲得專利權(quán)保護(hù)。同樣,這些專利審查授權(quán)機(jī)構(gòu)也授權(quán)了大量涉及人工智能模型參數(shù)的專利。這些專利主要為方法專利,聚焦于模型參數(shù)的優(yōu)化、壓縮、更新、管理等,涉及參數(shù)高效訓(xùn)練、動(dòng)態(tài)調(diào)整、量化壓縮等核心方向。這說明模型參數(shù)的訓(xùn)練、調(diào)整等方法可以獲得專利權(quán)保護(hù)。因此,與硬件或應(yīng)用場景結(jié)合的模型結(jié)構(gòu)本身及其改進(jìn)、涉及模型參數(shù)的方法等都屬于技術(shù)方案,滿足可專利性要求。如果這些技術(shù)方案具備專利法所要求的新穎性、創(chuàng)造性和實(shí)用性,則可以獲得專利權(quán)保護(hù)。
?。ǘ┲鳈?quán)法對模型結(jié)構(gòu)和參數(shù)的保護(hù)
人工智能模型開發(fā)人員是運(yùn)用人類可讀編程語言的源代碼來定義模型結(jié)構(gòu)的層結(jié)構(gòu)及層與層之間的連接關(guān)系的,最終形成模型結(jié)構(gòu)的源程序??梢?,開發(fā)人員編寫的計(jì)算機(jī)源程序定義了模型結(jié)構(gòu),計(jì)算機(jī)源程序是模型結(jié)構(gòu)的表達(dá)形式和載體。定義模型結(jié)構(gòu)的計(jì)算機(jī)源程序顯然屬于著作權(quán)法明確保護(hù)的“計(jì)算機(jī)軟件”。同時(shí),依據(jù)《計(jì)算機(jī)軟件保護(hù)條例》,計(jì)算機(jī)軟件包括計(jì)算機(jī)程序及其有關(guān)文檔,并且同一計(jì)算機(jī)程序的源程序和目標(biāo)程序?yàn)橥蛔髌?。因此,定義模型結(jié)構(gòu)的源程序、目標(biāo)程序以及有關(guān)開發(fā)文檔都可以獲得著作權(quán)法保護(hù)。
模型參數(shù)是模型通過優(yōu)化算法自動(dòng)調(diào)整得到的一系列具體數(shù)值。模型完成數(shù)據(jù)訓(xùn)練后,模型的每個(gè)參數(shù)都被確定為一個(gè)具體數(shù)值并保存到一個(gè)數(shù)據(jù)文件中。這個(gè)數(shù)據(jù)文件中的具體數(shù)值精準(zhǔn)對應(yīng)模型的每一個(gè)參數(shù)。由此可見,保存模型參數(shù)的數(shù)據(jù)文件,既不體現(xiàn)開發(fā)人員的思想,也不是開發(fā)人員智力勞動(dòng)成果的表達(dá)。因此,這個(gè)數(shù)據(jù)文件不屬于著作權(quán)法上的作品,不能獲得著作權(quán)法的保護(hù)。
需要特別指出,模型執(zhí)行任務(wù)需要同時(shí)運(yùn)行模型結(jié)構(gòu)與模型參數(shù),缺一不可。否則就像只有積木說明書(模型結(jié)構(gòu)的代碼)而沒有積木塊(模型參數(shù))或者只有積木塊而沒有積木說明書,都無法拼出預(yù)期的積木模型。因此,定義模型結(jié)構(gòu)的計(jì)算機(jī)程序與保存模型參數(shù)的數(shù)據(jù)文件共同構(gòu)成一個(gè)可運(yùn)行的軟件系統(tǒng)。
?。ㄈ┥虡I(yè)秘密對模型結(jié)構(gòu)和參數(shù)的保護(hù)
依據(jù)我國反不正當(dāng)競爭法的規(guī)定,商業(yè)秘密應(yīng)當(dāng)是不為公眾所知悉、具有商業(yè)價(jià)值并經(jīng)權(quán)利人采取相應(yīng)保密措施的技術(shù)信息、經(jīng)營信息等商業(yè)信息。模型結(jié)構(gòu)與參數(shù)屬于與技術(shù)有關(guān)的結(jié)構(gòu)、算法、數(shù)據(jù)、計(jì)算機(jī)程序及其有關(guān)文檔等信息,顯然構(gòu)成商業(yè)秘密所保護(hù)的技術(shù)信息。作為技術(shù)信息,無論是模型結(jié)構(gòu),還是模型參數(shù),如果能夠滿足商業(yè)秘密法定構(gòu)成要件,則可以獲得商業(yè)秘密保護(hù)。
但是,模型結(jié)構(gòu)或模型參數(shù)不滿足商業(yè)秘密的任何一個(gè)法定構(gòu)成要件的,則不能獲得商業(yè)秘密保護(hù)。例如,所屬領(lǐng)域的相關(guān)人員普遍知悉的模型結(jié)構(gòu)或模型參數(shù),或者所屬領(lǐng)域的相關(guān)人員從公開渠道可以獲得的模型結(jié)構(gòu)或模型參數(shù),或者模型開發(fā)企業(yè)未采取保密措施而投放市場后的模型結(jié)構(gòu)或參數(shù),都不滿足商業(yè)秘密法定構(gòu)成要件,因此不能獲得商業(yè)秘密保護(hù)。
三、關(guān)于適用反不正當(dāng)競爭法第二條保護(hù)模型結(jié)構(gòu)與參數(shù)的分析
反不正當(dāng)競爭法第二條是反不正當(dāng)競爭法的一般條款。如前所述,專利法、著作權(quán)法和反不正當(dāng)競爭法中的商業(yè)秘密條款對于符合條件的模型結(jié)構(gòu)與參數(shù)可以提供相應(yīng)保護(hù)。為此,下文將結(jié)合上文的分析結(jié)果,就如何適用專利法、著作權(quán)法、反不正當(dāng)競爭法的商業(yè)秘密條款和第二條一般條款保護(hù)模型結(jié)構(gòu)與參數(shù)進(jìn)行具體探討。
?。ㄒ唬╆P(guān)于反不正當(dāng)競爭法與專利法之間的適用關(guān)系
如前所述,模型結(jié)構(gòu)及其改進(jìn)、涉及模型參數(shù)的方法及其改進(jìn)都屬于可專利客體范圍。但是,可專利性只是某一技術(shù)方案獲得專利權(quán)的門檻性條件,發(fā)明創(chuàng)造人還需就該技術(shù)方案向國家專利審查部門提出專利申請。如果模型的發(fā)明創(chuàng)造人向國家專利審查部門提出專利申請并被授予專利權(quán),他人未經(jīng)許可使用受專利權(quán)保護(hù)的模型,原則上構(gòu)成專利權(quán)侵權(quán)。專利權(quán)人可以依據(jù)專利法要求模型使用人承擔(dān)專利侵權(quán)責(zé)任。
如果模型的發(fā)明創(chuàng)造人未提出專利申請或者提出專利申請但未獲得專利授權(quán),發(fā)明創(chuàng)造人將模型投入市場后,他人使用該模型不構(gòu)成專利侵權(quán)。在這種情況下,如果適用反不正當(dāng)競爭法第二條對使用該模型的市場競爭行為予以規(guī)制,實(shí)際上是保護(hù)發(fā)明創(chuàng)造人未提出專利申請的技術(shù)方案或者提出專利申請但未獲專利授權(quán)的技術(shù)方案。
這種做法顯然將架空專利法,因?yàn)榫鸵豁?xiàng)技術(shù)方案來說,不申請專利或者不能獲得專利授權(quán),投入市場以后仍然可以獲得類似專利法的保護(hù)。因此,從專利法角度來看,模型發(fā)明創(chuàng)造人未提出專利申請或者提出專利申請但未獲得專利授權(quán),該模型投入市場后他人使用該模型的,不應(yīng)再適用反不正當(dāng)競爭法第二條予以規(guī)制。
?。ǘ╆P(guān)于反不正當(dāng)競爭法與著作權(quán)法之間的適用關(guān)系
如前所述,模型結(jié)構(gòu)表現(xiàn)為模型開發(fā)人員設(shè)計(jì)和編寫的源程序,屬于著作權(quán)法明確保護(hù)的“計(jì)算機(jī)軟件”,定義模型結(jié)構(gòu)的源程序及目標(biāo)程序以及有關(guān)開發(fā)文檔可以獲得著作權(quán)法保護(hù)。模型結(jié)構(gòu)表現(xiàn)為源程序。對于兩個(gè)結(jié)構(gòu)相同或?qū)嵸|(zhì)相似的模型來說,如果系采用同一編程語言進(jìn)行定義的,那么定義這兩個(gè)模型結(jié)構(gòu)的源程序也應(yīng)當(dāng)相同或?qū)嵸|(zhì)相似。對于這種情況,按照著作權(quán)侵權(quán)判定原則,可能構(gòu)成著作權(quán)侵權(quán),也可能不構(gòu)成著作權(quán)侵權(quán),需要具體分析。
兩個(gè)模型的結(jié)構(gòu)雖然相同或?qū)嵸|(zhì)相似,但都是獨(dú)立開發(fā)完成的,那么無論開發(fā)時(shí)間是否存在先后,按照著作權(quán)法的基本原理,開發(fā)者都各自基于其定義模型結(jié)構(gòu)的源程序分別獲得著作權(quán)。對于這種情況,不能因兩個(gè)模型的結(jié)構(gòu)相同或?qū)嵸|(zhì)相似而認(rèn)為在后開發(fā)者侵犯在前開發(fā)者的著作權(quán)。同樣,對于這種情況,也不能因兩個(gè)模型的結(jié)構(gòu)相同或?qū)嵸|(zhì)相似,適用反不正當(dāng)競爭法第二條對在后開發(fā)者的使用模型行為予以規(guī)制,否則將有悖著作權(quán)法的基本原理。
模型A和B的結(jié)構(gòu)相同或?qū)嵸|(zhì)相似,但是B模型是其開發(fā)者從公開渠道提取A模型后直接得到的或者提取A模型而稍作修改后得到的。對于這種情況,定義A模型的源程序及目標(biāo)程序與定義B模型的源程序及目標(biāo)程序應(yīng)當(dāng)相同或?qū)嵸|(zhì)相似。換言之,B模型開發(fā)者從公開渠道提取A模型,實(shí)質(zhì)上是復(fù)制了定義A模型結(jié)構(gòu)的源程序(開源狀態(tài))或目標(biāo)程序(閉源狀態(tài))。因此,B模型開發(fā)者提取A模型的行為侵犯了A模型開發(fā)者的著作權(quán),至少侵犯A模型開發(fā)者的復(fù)制權(quán)。對于這種情況,適用著作權(quán)法足以妥當(dāng)保護(hù)A模型開發(fā)者的合法權(quán)益,無需適用反不正當(dāng)競爭法第二條。當(dāng)然,如果A模型開發(fā)者對于定義A模型的源程序及目標(biāo)程序并不享有著作權(quán),那么B模型開發(fā)者的復(fù)制行為則不侵犯A模型開發(fā)者的著作權(quán)。對于這種情況,也不應(yīng)再適用反不正當(dāng)競爭法第二條,否則也將違背著作權(quán)法的基本原理。
?。ㄈ╆P(guān)于反不正當(dāng)競爭法第二條與商業(yè)秘密條款之間的適用關(guān)系
如前所述,模型結(jié)構(gòu)與參數(shù)屬于技術(shù)信息,滿足商業(yè)秘密法定構(gòu)成要件的,可以獲得商業(yè)秘密保護(hù),不滿足商業(yè)秘密任何一個(gè)法定構(gòu)成要件的,則不能獲得商業(yè)秘密保護(hù)。涉案模型結(jié)構(gòu)與參數(shù)不滿足商業(yè)秘密法定構(gòu)成要件,他人未經(jīng)許可使用涉案模型結(jié)構(gòu)與參數(shù)的,則不構(gòu)成侵犯商業(yè)秘密。在這種情況下,如果適用反不正當(dāng)競爭法第二條對使用該模型結(jié)構(gòu)與參數(shù)的市場競爭行為予以規(guī)制,實(shí)際上保護(hù)了本來不受商業(yè)秘密保護(hù)的技術(shù)信息。這種做法將架空整個(gè)商業(yè)秘密保護(hù)制度,因?yàn)榫瓦@些技術(shù)信息來說,不符合商業(yè)秘密要件卻可以獲得類似商業(yè)秘密的法律保護(hù),甚至當(dāng)事人未采取合理保密措施投入市場之后也仍然可以獲得類似商業(yè)秘密的法律保護(hù)。因此,如果涉案模型結(jié)構(gòu)與參數(shù)不符合商業(yè)秘密法定要件,他人從公開渠道獲得并使用該模型的,不應(yīng)再適用反不正當(dāng)競爭法第二條予以規(guī)制。
四、體系化思維下反不正當(dāng)競爭法第二條的具體適用
解釋及適用某一法律規(guī)范時(shí),不能孤立地解釋及適用該法律規(guī)范而無視其法律規(guī)范。這樣才能避免法律評價(jià)矛盾或目的解釋不一致,進(jìn)而避免有損整個(gè)法秩序。因此,可以說,適用某個(gè)法律規(guī)范實(shí)際上就是在適用整個(gè)法律體系。如果兩個(gè)或者多個(gè)法律規(guī)范都可以適用于某個(gè)特定的案件事實(shí),應(yīng)當(dāng)運(yùn)用體系化思維,依據(jù)特別法優(yōu)于一般法、上位法優(yōu)于下位法、新法優(yōu)于舊法等沖突規(guī)則確定哪一法律規(guī)范應(yīng)當(dāng)?shù)玫絻?yōu)先適用。找到可適用的法律規(guī)范后,解釋及適用該法律規(guī)范時(shí)應(yīng)當(dāng)嚴(yán)格遵循“禁止冗余規(guī)則”,不能因該法律規(guī)范的解釋及適用導(dǎo)致另一法律規(guī)范、一項(xiàng)法律制度或一部法律變得多余,否則就應(yīng)當(dāng)避免采取這種解釋及適用。反不正當(dāng)競爭法第二條的解釋及適用也應(yīng)當(dāng)如此。
如前所述,知識產(chǎn)權(quán)專門法可以為模型結(jié)構(gòu)與參數(shù)提供相應(yīng)的知識產(chǎn)權(quán)保護(hù)。如果涉案模型結(jié)構(gòu)與參數(shù)能夠滿足專門法的保護(hù)條件,則應(yīng)當(dāng)獲得相應(yīng)專門法的保護(hù)。如果涉案模型結(jié)構(gòu)與參數(shù)因不滿足專門法的保護(hù)條件而未能獲得保護(hù)的,不應(yīng)再適用反不正當(dāng)競爭法第二條對使用涉案模型結(jié)構(gòu)與參數(shù)的市場競爭行為予以規(guī)制,否則將違背法律規(guī)范解釋及適用的“禁止冗余規(guī)則”。
反不正當(dāng)競爭法第二條與反不正當(dāng)競爭法的商業(yè)秘密條款構(gòu)成一般與特別的關(guān)系。按照特別法優(yōu)于一般法的適用規(guī)則,應(yīng)當(dāng)優(yōu)先適用商業(yè)秘密條款,不能繞開特別條款而直接適用一般條款。因此,如果涉案模型結(jié)構(gòu)與參數(shù)不滿足商業(yè)秘密法定要件而未能獲得商業(yè)秘密保護(hù),不應(yīng)再適用反不正當(dāng)競爭法第二條對使用涉案模型結(jié)構(gòu)與參數(shù)的市場競爭行為予以規(guī)制,否則不僅違背法律規(guī)范解釋及適用的“禁止冗余規(guī)則”,還違反特別法優(yōu)于一般法的適用規(guī)則。
