提示:本文刊載于《版權理論與實務》,原標題為《著作權侵權認定視角下“海量”內容的比對方法——以導航電子地圖為例兼顧其他場景》。文章注釋從略,完整原文請見《版權理論與實務》紙質版。全文大約12000字,讀完預計15分鐘。
涉及“海量”內容的著作權侵權糾紛,通過鑒定對全量數(shù)據(jù)進行比對存在技術、時間和費用等多方面困難;暗記比對在圖形作品、美術作品等領域不可靠;法庭和當事人迫切需要可行的“全面”而非“全量”的比對方法。筆者通過對“海量地圖數(shù)據(jù)”比對的思考和實測,提出適合權利人初步舉證的全面抽樣“勘察”思路,以及適合被告抗辯和法庭調查的全面抽樣比對方案。“無歧視概率比較法”符合統(tǒng)計學原理,比對結果具有一定科學性,且思路可以靈活拓展、移植到“海量”圖片、音樂、視頻、文章、詞條、評論等場景,有效解決人工比對需求,有利于原被告雙方展開訴爭抗辯,有助于法庭推進庭審調查——
近年來,從“海量圖片”“海量音樂”“海量視頻”“海量文章”“海量詞條”“海量評論”……到備受關注的某導航電子地圖數(shù)據(jù)供應商訴“某地圖”未經(jīng)許可使用其“海量地圖數(shù)據(jù)”[1](簡稱“地圖數(shù)據(jù)案”),法庭在著作權侵權糾紛或不正當競爭糾紛中,不斷面對權利人針對“海量”內容主張權利的考驗。部分判決書往往止步于“大量”或“少量”的主觀評判,缺少從“定量”到“定性”的可靠論證,在判賠層面也缺乏從“定性”再到“定量”的精細裁量。法庭認定有否使用權利人界定的“海量”內容,在遵從“實事求是”原則的基礎上,必然存在著“全量”使用和“沒有”使用兩種極端可能,以及從0.01%到99.99%區(qū)間“部分”使用的可能。權利人如何證明被訴對象“全量”使用或“大比例”使用;被訴對象如何反駁證明“沒有”使用或“小比例”使用,以及針對“大比例”或“小比例”盡可能精準的論證,是擺在法庭和當事人面前的重要課題。
筆者有幸全程參與“地圖數(shù)據(jù)案”二審階段,[2]在委托人法務團隊和技術團隊的全力支持下,對涉案“海量地圖數(shù)據(jù)”的比對方法進行了深入思考和多輪實測,向二審法庭提供了可行的比對方案,能夠有效解決“海量地圖數(shù)據(jù)”的全面比對問題。該比對方案的思路可以拓展、移植到“海量”的圖片、音樂、視頻、文章、詞條、評論等場景,有效解決人工比對需求,也可作為計算機比對程序設計的邏輯模型,對海量內容在更大基數(shù)和范圍內開展機器選樣和比對。本文將介紹針對“海量”內容在爭議范圍內進行全面比對的需求和意義,以及針對“海量地圖數(shù)據(jù)”設計的比對方案,并將思路拓展應用至其他場景,為涉及“海量”內容的爭議提供可行的比對思路,供有機會面對此類場景的法官、律師和學者們參考、驗證,并期待讀者們進一步的指正和完善。
一、導航電子地圖中的海量數(shù)據(jù)
(一)導航電子地圖數(shù)據(jù)是復雜版權客體
導航電子地圖的“數(shù)據(jù)包”,通常包括國界、省界、市縣區(qū)界、道路、鐵路、公交線、水系、綠地、模式圖、實景圖、市街圖、語音等數(shù)據(jù),還有數(shù)以億萬計的興趣點(POI)、紅綠燈、車站等信息,以及相關規(guī)格說明書等各類文檔。這些數(shù)據(jù)中,除了道路等需要通過識圖軟件讀取并顯示出來的“點、線、面”數(shù)據(jù)外,還有大量以獨立的文件夾和獨立文件形式存在的其他數(shù)據(jù),例如,綠地、水系、模式圖、實景圖、市街圖等“圖形”類內容,用戶協(xié)議、規(guī)格說明書等“文字”類內容,公交線、POI等“文字”類信息,關聯(lián)文件等“軟件”類內容,大量錄制好的語音等“音頻”類內容。這些數(shù)據(jù)按文件夾分類存儲,在使用過程中按用戶發(fā)出的使用指令,被識圖軟件或導航軟件讀取和調用,并分層疊加顯示。相對于傳統(tǒng)地圖、電子化地圖,導航電子地圖“數(shù)據(jù)包”不再是單一維度的圖形作品,而是涉及軟件作品、文字作品、美術作品、圖形作品、匯編作品、數(shù)據(jù)庫和一般數(shù)據(jù)等多維度客體的“集合類”作品。[3]
“數(shù)據(jù)包”中,眾多線條連接的整個“瓦片”路網(wǎng),亦或是鄉(xiāng)、縣、市、省乃至全國的連片路網(wǎng),基于線條的選擇、組合、鏈接、整體視覺差異等因素,可能構成“圖形作品”;綠地、水系等每一個“形狀圖”及所在圖層的眾多“形狀圖”組合,基于在繪制過程中的取舍、整體視覺差異等因素,也可能構成“美術作品”或“圖形作品”;“模式圖”屬于“數(shù)據(jù)包”中多個獨立的視圖文件,在導航過程中遇到相應路口時被選擇調用。每一個“模式圖”的內容包括繪制的天空、綠地、道路及相應的顏色選擇,基于其繪制過程中的構圖、線條、顏色等方面的差異,可能構成“美術作品”;POI、紅綠燈、限速牌等信息則是“數(shù)據(jù)包”中數(shù)量最多的信息集合。包含這些信息的文件夾可能構成“數(shù)據(jù)庫”,其編排方案、調用模式等技術細節(jié)都可能成為著作權法、專利法或競爭法保護的對象。另外,用戶協(xié)議、說明書等文檔,提前錄制好的“前方路口向右轉”“駛入輔路”等音頻文件都可能構成著作權法保護的文字作品、錄音制品。[4]
(二)路網(wǎng)“圖形作品”下的海量內容
在類型多樣、體量龐大的導航電子地圖“數(shù)據(jù)包”中,僅以最直觀、侵權爭議多發(fā)的路網(wǎng)“數(shù)據(jù)”為例,在針對路網(wǎng)“數(shù)據(jù)”的著作權糾紛中,就不可避免的涉及海量內容的界定和比對。結合既往案例和行業(yè)調研,導航電子地圖“數(shù)據(jù)包”中的路網(wǎng)“數(shù)據(jù)”通常以省級行政區(qū)劃作為文件夾分類單元,實際存儲和下載數(shù)據(jù)又以地級市行政區(qū)劃為獨立的文件單元。結合我國當前有330余個地級行政區(qū)劃考慮,如果路網(wǎng)“數(shù)據(jù)”構成圖形作品,整個中國境內的路網(wǎng)“數(shù)據(jù)”則是330余個獨立圖形作品單元組合而成的圖形作品集合。
僅就我國疆域,導航電子地圖需要覆蓋960多萬平方公里的面積。導航電子地圖顯然不是在960多萬平方公里的幅面上一蹴繪就,也不是在一個地級區(qū)劃幅面上直接繪制的。根據(jù)行業(yè)通識,導航電子地圖是由一個個“圖幅”組成,地圖行業(yè)內稱之為“瓦片”。每一個“瓦片”的幅面是“10公里×10公里”(即100平方公里)。按此標準,僅我國疆域就涉及多于9.6萬張“瓦片”。
權利人在取證過程中,往往要對其認為構成近似的路網(wǎng)進行“截圖”比對。如果以“截圖”作為圖形作品的構成單元,考慮到“截圖”畫面遠遠小于一個“瓦片”的情況,以每個“截圖”約1平方公里計算,僅中華人民共和國疆域就涉及多于960萬張“截圖”大小的圖形作品。
二、針對導航電子地圖數(shù)據(jù)的侵權主張和比對需求
(一)復雜客體場景下侵權主張的差異
面對導航電子地圖“數(shù)據(jù)包”這樣的復雜客體,“侵權人”當然可能完整復制并使用“數(shù)據(jù)包”,也可能按省份、城市、瓦片(10×10公里圖幅)等不同幅面的地域范圍,復制并使用“數(shù)據(jù)包”中的一部分數(shù)據(jù);還可能只復制“數(shù)據(jù)包”中道路、行政區(qū)劃、水系、綠地、POI等某一類或多類數(shù)據(jù)的全部或部分;也可能在復制全部或部分基礎上,對復制內容進行了少量修改或大幅替換,甚至是全量、分步替換后僅存少量遺漏……在如此復雜多變的情況下,權利人在主張權利之前進行調查評估的細致程度,以及采樣、取證和比對校驗的思路方法,將直接影響其對實際侵權情況的預判。對侵權情況的預判則直接影響對主張權利客體的選擇和固定。選擇和固定客體是主張權利的第一要務,也是被告抗辯和法庭審理的基礎。
權利人基于完整“數(shù)據(jù)包”主張著作權,并主張被告持續(xù)使用其完整“數(shù)據(jù)包”,與基于“數(shù)據(jù)包”中某一類數(shù)據(jù)內容(例如,道路、模式圖、音頻文件)主張著作權,主張被告使用了某一類數(shù)據(jù)內容中的全部或部分(例如,某省、某市),在舉證方法、證明責任轉移等方面,存在巨大差別。[5]因此,查清侵權狀況并做好取證準備,是準確提出侵權主張、完成初步舉證責任并促成證明責任轉移至被告的重要前提。
(二)針對“海量”內容的比對需求
北京知識產(chǎn)權法院在“地圖數(shù)據(jù)案”一審判決(尚未生效)中認定被告全量持續(xù)使用原告地圖數(shù)據(jù),并認為“本案是圖形作品著作權侵權糾紛,比對對象是圖形作品的表現(xiàn)形式,而非計算機軟件代碼,應進行人工肉眼比對,而非數(shù)據(jù)鑒定”“本案不具有比對的基礎”“三被告主張進行全面比對,由于電子地圖內容過多,全面人工比對不具有可行性和操作性,三被告也未提出原告和本院認可的比對方案。因此本院對三被告提出的鑒定和全面比對的要求不予支持”。[6]據(jù)此可知,一審合議庭在認為涉案地圖數(shù)據(jù)沒有比對基礎、內容過多、人工比對不可行、被告未提出比對方案的情況下,僅基于原告舉證的四類、共計二百余處比對點,“推定”了被告全量持續(xù)使用原告的地圖數(shù)據(jù)。
拋開全面人工比對可不可行的問題,以及法院、原被告誰有責任提出比對方案的問題不論,相對于導航電子地圖“數(shù)據(jù)包”中任何一類“海量”內容,在原告僅舉出幾十處比對點的情況下,法庭是否應當主動調查并確認,在原告舉證的“相同”比對點外,有否不相同的內容?筆者認為,“全量持續(xù)使用”的事實需要“隨機選擇一處比對,即大概率得出相同結論”這樣的驗證結果支撐。如果原告認可存在“不同”點,或者被告舉證存在“不同”點,顯然不具備“推定”全量持續(xù)使用的基礎。
在原告主張“海量”內容被全量使用的背景下,如果被告能夠舉證存在等量的“不同”點,考慮原告和被告均是“隨機”選點比對,就已經(jīng)動搖了“推定”全量使用的基礎;如果被告能夠舉證十倍于原告“相同”點數(shù)量的“不同”點,顯然可以進一步稀釋原告舉證“相同”點的推定作用。此情況下,原告沒有完成其主張被告全量使用的舉證責任,被告當然也沒能證明自己從未使用原告某類內容。
在數(shù)以千萬計的內容單元、數(shù)以億計的可比對圖形畫面背景下,僅靠原告選擇出幾十處“相同”點,又沒有要求原告進一步增加隨機選點來驗證“處處相同”,就“推定”被告全量持續(xù)使用,在事實認定層面明顯是草率的;僅憑原告舉出100處相同,被告舉出100處不同,就“推定”被告使用了原告內容的“50%”,亦或原告舉出100處相同,被告舉出10處不同,就“推定”被告使用了原告內容的“90%”,則是缺少總量基數(shù)前提的邏輯錯誤(總量是200處?還是960萬處?)。因此,在前述場景下,為了進一步查明有否相同及相同比例,迫切需要一種可行的比對方法。
(三)通過鑒定對雙方全量數(shù)據(jù)進行比對存在困難
在“地圖數(shù)據(jù)案”中,有效固定原告和被告各自使用的全量“數(shù)據(jù)包”,委托法庭和原被告雙方認可的專業(yè)機構,對雙方“數(shù)據(jù)包”是否存在相同內容及相同比例進行全面鑒定,在不考慮時間和成本的情況下,只要技術上可行,當然是最有利于查清事實的方式方法。但是,由于地圖數(shù)據(jù)體量的巨大,即使法庭組織雙方委托機構進行鑒定,也需要考慮針對數(shù)據(jù)進行全量、無死角比對的技術可行性,以及所需的時間長短和鑒定費用高低。假設在全面比對技術可行的情況下,針對一個地級行政區(qū)劃的道路數(shù)據(jù)進行比對,需要鑒定機構連續(xù)工作一個月時間,申請方先行支付10萬元費用。如果原告要求針對330余個地級行政區(qū)劃進行全面比對,這意味著一個鑒定機構要連續(xù)工作長達330個月,且申請方先行墊付3300余萬元的費用。除非法院同時委托上百家鑒定機構,否則,僅就鑒定時間一個維度,法庭和原被告雙方都是無法接受的。
(四)暗記比對針對圖形作品、美術作品不可行
軟件、數(shù)據(jù)庫的權利人為了防止軟件源代碼、數(shù)據(jù)資源被盜用和復制,通常會在軟件源代碼編寫過程中故意植入不影響軟件功能的錯誤、冗余“字符”,或者在數(shù)據(jù)資源中埋藏一些不為外人所知的“標記”。因此,針對暗記的舉證和比對也是軟件侵權糾紛、數(shù)據(jù)庫侵權糾紛中權利人比較常用的方法。針對源代碼或數(shù)據(jù)相同的場景,被告有可能證明使用相同編程工具或采集方法可能產(chǎn)生相同代碼或數(shù)據(jù)的情況,原告進一步舉證被告代碼或數(shù)據(jù)中存在被告無法合理解釋的相同“暗記”,才具有證明被告代碼或數(shù)據(jù)“復制”自原告的意義。而對于其他類型作品,在滿足“接觸+相似”的條件下,不需要“暗記”作為證明要素的。
圖形作品、美術作品的實質性近似認定,更是不能僅依靠個別暗記來推定。針對這類可以通過人工肉眼比較出異同結論的作品類型,受畫幅和比例尺影響,需要在固定作品幅面和比例尺后,具體比較構成作品表達方式的線條、形狀、顏色、綜合畫面等內容是否存在相同、近似。舉一個夸張的例子,如果兩幅圖形作品,一個是圓形,一個是三角形,線條、構圖完全不同,僅在原告舉證的相同定位點上存在兩個“黑點”,原告將其主張為“暗記”,即便被告沒有合理理由說明為什么在相同位置存在兩個完全相同的“黑點”,筆者相信法官也不會因為存在無法合理解釋的“暗記”而認定被告圖形作品構成侵權。再考慮兩幅水墨中國畫的情況,原告在其繪就的“山水畫”中埋藏了只有用放大鏡才能找到的一個人名,被告的一幅同尺寸“人物畫”,也在相同位置埋藏了一模一樣的人名,原告主張被告作品中存在相同“暗記”,這兩幅美術作品能認定抄襲嗎?顯然不能。針對圖形作品、美術作品,即便是直接對在先作品進行修改,如果改大了,改到只剩下暗記相同,那還是復制、抄襲、借鑒嗎?顯然不是。因此,對于“海量”內容的比對和侵權認定,暗記比對僅是在已經(jīng)認定內容相同基礎上的額外“加分”條件,可以進一步證明“相同”內容來源于原告。
三、針對導航電子地圖數(shù)據(jù)的比對方案
對于導航電子地圖數(shù)據(jù)這類含有“海量”數(shù)據(jù)的復雜版權客體,在針對“海量”數(shù)據(jù)進行全量、無死角比對,在數(shù)據(jù)基礎、技術、時間、費用等方面不可行的情況下,迫切需要一種方法可以針對“海量”數(shù)據(jù)進行比較“全面”而非“全量”勘察。就像我們探查某地的礦產(chǎn)資源,不用將礦產(chǎn)實際開采出來逐一過秤統(tǒng)計,僅需要進行科學的選點采樣并計算得出預估儲量(不一定準確,但有一定科學依據(jù)),針對導航電子地圖數(shù)據(jù)的“勘察”,也可以參照該思路,設計出比較可靠的評估方法。
就導航電子地圖數(shù)據(jù)而言,權利人有必要通過認真的前期“勘察”,來確定被告有否使用數(shù)據(jù);僅使用道路數(shù)據(jù),還是涉及其他類型數(shù)據(jù);使用了全國數(shù)據(jù),還是僅涉及個別省市區(qū)數(shù)據(jù)……進而基于“勘察”結果,確定蘊藏何種礦產(chǎn)(主張權利的數(shù)據(jù)類型,是道路、水系、綠地、模式圖)、礦產(chǎn)儲量(主張權利的數(shù)據(jù)范圍,是全國、部分省市區(qū)、個別地點)、如何開采(主張復制權、信網(wǎng)權、改編權等)、開采預估(索賠金額、合理開支等)。
(一)勘察:適合權利人初步舉證的全面抽樣比對思路
在權利人不掌握目標全量“數(shù)據(jù)包”的情況下,想進行數(shù)據(jù)層面的全量、無死角比對是不可能的。但是,針對使用目標導航電子地圖數(shù)據(jù)的產(chǎn)品,進行符合統(tǒng)計學原理的抽樣比對則是可行的。權利人有必要基于其懷疑目標使用其數(shù)據(jù)的類型、范圍進行比較細致、全面的“勘察”。通過勘察結果夯實或者消減對于侵權情況的懷疑。就導航電子地圖數(shù)據(jù)而言,“勘察”涉及數(shù)據(jù)類型和地域范圍兩個并行維度。
首先“勘察”數(shù)據(jù)類型。權利人的全量“數(shù)據(jù)包”通常包括:國省市縣區(qū)劃界、道路、鐵路、公交線、水系、綠地、模式圖、實景圖、市街圖、語音等數(shù)據(jù)類型。權利人可以根據(jù)懷疑點和相關線索,在排除無權利的數(shù)據(jù)類型(國家標準、采購自其他來源等)后,從其最有價值、最有把握的數(shù)據(jù)類型查起。例如,通過少量的隨機選點,核查道路是否有完全相同(重合)的地點。第一輪勘察結果可能是“處處相同”“部分相同”“沒有相同”。根據(jù)不同的結果,尤其是“處處相同”和“沒有相同”兩個極端結果,有必要增加選點量再行核驗測試,初步保障“處處相同”和“沒有相同”兩個極端結果的可靠性。在“勘察”道路數(shù)據(jù)后,可按相同的方式初步核查其他類型的數(shù)據(jù)。
其次“勘察”地域范圍。針對某一得出“處處相同”“部分相同”結論的數(shù)據(jù)類型,權利人的選點應該覆蓋34個省級區(qū)域。如果針對每個省區(qū)選點都能夠得出“處處相同”的結論,在增加一輪選點后,仍沒有推翻“處處相同”的結論,則可以初步推斷目標產(chǎn)品全量使用了權利人數(shù)據(jù);如果部分省區(qū)出現(xiàn)“沒有相同”的結論,則需要針對該省區(qū)專門增加選點,以核查該省區(qū)是“部分相同”,亦或經(jīng)過多輪驗證后坐實“沒有相同”。
在勘察基礎上,可以初步判斷目標導航電子地圖數(shù)據(jù),是全量使用權利人“數(shù)據(jù)包”中的各類型數(shù)據(jù),還是僅使用部分類型數(shù)據(jù);是使用全國范圍內的數(shù)據(jù),還是僅涉及部分省市區(qū)。當然,對于指示路口樣態(tài)的“模式圖”、導航中各類提示語音并不涉及地域的維度。
根據(jù)“誰主張,誰舉證”的基本原則,權利人如果主張目標使用了其全部或部分導航電子地圖數(shù)據(jù),有義務加以證明。如果權利人通過勘察結論確信目標使用了其導航電子地圖數(shù)據(jù),則應該根據(jù)勘察結論,設計恰當?shù)娜∽C方案,進而證明其“處處相同”或者“部分相同”的主張。在此基礎上,權利人主張目標使用某一類數(shù)據(jù),其取證至少要覆蓋該類數(shù)據(jù)。權利人主張目標使用其全部數(shù)據(jù)類型,卻僅針對部分數(shù)據(jù)類型取證的,不能推定目標使用了未取證的數(shù)據(jù)類型;權利人針對某一數(shù)據(jù)類型,主張目標使用其全國數(shù)據(jù),卻僅針對部分省區(qū)選點取證的,也不能推定目標使用了未取證的其他省區(qū)數(shù)據(jù)。
權利人基于勘察結論設計的取證方案,在能夠全面、恰當?shù)馗采w其主張權利的數(shù)據(jù)類型和地域覆蓋的情況下,有助于權利人完成初步的舉證責任。而沒有統(tǒng)計學依據(jù)和科學方法的“隨機”選點,很容易被反證稀釋,不足以推定“海量”數(shù)據(jù)相同,從而導致權利人沒有盡到舉證責任。
(二)適合被告抗辯和法庭調查的全面抽樣比對設計
如前所述,導航電子地圖涉及“海量”數(shù)據(jù),少量舉例方式不能解決定性和定量問題。即便是法庭主持或第三方鑒定機構進行的隨機抽樣,結果不利的一方都會就“隨機”提出質疑,不認可人工的隨機方案或是軟件的隨機機制。原告起訴時證明“相同”的對比點,被告不認可“隨機”。被告抗辯時證明“不同”的對比點,原告不認可“隨機”。在被告提出的“不同”點稀釋了原告舉證的“相同”點的情況下,迫切需要一種對原被告雙方均公平且有效率的全面“抽樣比對”方法。
在“地圖數(shù)據(jù)案”二審階段,筆者向法庭建議一種迫使雙方被動抽樣且具有較強對抗性的比對方法,暫命名為“無歧視概率比較法”。筆者認為,“抽樣比對”不應該是一方按有利于己方結果的“挑揀”。雙方均應該在法庭主持下,按照無歧視的標準,堅持不規(guī)避的原則,遵循固定的邏輯,進行公平的選樣和比對,從而解決定性和定量的需求。
“無歧視概率比較法”的具體操作方案如下:
(1)【固定比對內容】針對大畫幅單一圖形作品和小畫幅海量圖形作品。
(2)【提出選樣標準】各方提出各自的選樣標準,在已經(jīng)固定的比對內容中選樣,不挑揀,不回避。結合導航電子地圖特點,原告、被告、法庭均可以提出多個具體的選樣標準。
例如:


以省會命名的火車站(31個);
以省級行政區(qū)命名的大學(30個—無“陜西大學”);
各省車牌B城市的電視臺(31個);
各省車牌C城市的市政府(31個);
各省車牌D城市的圖書館(31個);
各省車牌E城市的中級法院(31個);
各省車牌F城市的火車站(31個);
各省車牌G城市的第一中學(31個);
各省車牌H城市的人民醫(yī)院(31個);
各省車牌J城市的中國移動分公司(31個)。
(3)【選樣標準的數(shù)量和抽取樣本的數(shù)量】結合比對內容的特點、總數(shù)等情況,由雙方協(xié)商并由法庭決定首輪提出的選樣標準的數(shù)量和抽取樣本的數(shù)量。法庭、原告、被告可分別提出N個(例如,5個)選樣方案,總計3×N個(例如,15個)選樣方案。各方基于選樣方案查找到具體的比對點,進行近似判斷。
(4)【進行比對】原被告雙方按專業(yè)常識或法庭指導的認定標準,就各自選樣的內容進行比對,得出比對結論,并交付對方核驗。各方就比對結論意見不一致的,法庭綜合各方意見,給出比對結論。
(5)【結果統(tǒng)計】基于法庭認可的結論,就每一組樣本中,目標結論數(shù)量(例如,構成實質性相似的條數(shù))占該組選樣總數(shù)量的百分比進行統(tǒng)計,得出結果百分比;再綜合各組下的結果百分比,計算平均百分比,作為該輪比對的綜合結果。例如,第一組80%、第二組90%……第十組80%、第十一組90%、第十二組85%,經(jīng)計算12組平均值,得出綜合結果為85%。
(6)【增加選樣和停止選樣】如果一方對首輪綜合結果不認可(不滿意),并主張增加選樣標準或樣本數(shù)量后,綜合結果可能變化,各方應當在選樣方案的邊界內再提出與首輪數(shù)量相同的選樣標準,并據(jù)此補充選出樣本。如果后續(xù)輪次比對得出的綜合結果與前續(xù)輪次比對的綜合結果差距不大,則停止比對,并將各輪次綜合結果的平均值作為貼近事實的比對結論。如果后續(xù)輪次比對得出的綜合結果與前續(xù)輪次比對的綜合結果均有較大差距,則應當再行考慮增加選樣標準和選樣數(shù)量,補充比對。
(7)【比對效果】相對于通過鑒定進行“全量、無死角比對”,前述被動對抗性抽樣比對,在“處處相同”和“沒有相同”兩個極端結果以外,就“部分相同”情況不能保證呈現(xiàn)出絕對的客觀真實情況,但可以保障抽樣的公平性,且隨著選樣方案的增加,逐步接近客觀真實情況。
筆者在“地圖數(shù)據(jù)案”二審階段,基于前述“無歧視概率比較法”,向法庭提交了11組共計330余選點比對。被告可以充分利用該比較方法針對原告“全量使用”的主張進行抗辯,法庭也可以利用該比較方法就原告主張被告使用其某一類地圖數(shù)據(jù)的情況,基于相對公平的選樣,得出符合統(tǒng)計學原理的計算結果,進而得出爭議數(shù)據(jù)內容“整體(100%)近似、大比例(30%—99%)近似、小比例(1%—29%)近似、不近似(0%)”的結論。
四、“無歧視概率比較法”在其他場景的應用
除“地圖數(shù)據(jù)案”二審階段首次應用了“無歧視概率比較法”外,筆者嘗試將該方法應用到其他涉及“海量”內容比對的場景(例如,海量詞條、海量圖片等),同樣可以將其作為原告舉證、被告抗辯和法庭調查的引導思路和比對方法。
(一)針對“海量”詞條比對的應用
在一起涉及數(shù)十萬“詞條”近似比對的案件中,筆者作為一方當事人聘請的獨立專家,再次應用了“無歧視概率比較法”,向法庭提交了“詞條”內容查驗和比對方法的建議。“詞條”內容及其保存形式,與導航電子地圖數(shù)據(jù)差異很大,但仍可以延續(xù)“無歧視概率比較法”的思路,提煉選樣方案。
首先,原告取證保全的“詞條”內容以電子文件形式保存在特定的文件夾中。經(jīng)查驗可以發(fā)現(xiàn),電子文件至少存在名稱、修改日期、大小三個信息維度,可通過計算機進行快速排序,并可以快速查找定位的具體文件(示例如下表)。

其次,筆者基于上述信息維度進一步提煉針對“詞條”的選樣方案:
(1)【名稱排序】即詞條按名稱正序或倒序排列后,在起始為符號或首字音序從A到Z的全部詞條中,選擇任意符號或音序的第N個詞條。例如,首字音序為Y詞條中的第7個詞條;如果首字音序沒有Y,則順延至下一個音序(Z);如果詞條數(shù)量不足的,選擇該音序最后一個詞條(首字音序為Y詞條只有5個,則選擇第5個)。
(2)【生成時間排序】即詞條按修改日期正序或倒序排列后,在最早生成時間到最末生成時間內,選擇任意生成時間的第N個詞條。例如,選擇2021年7月16日21:07分生成詞條中第7個詞條;如果沒有指定的時間點,則順延至下一個臨近且有文件生成的時間點;如果詞條數(shù)量不足的,選擇該時間點排序的最后一個詞條。
(3)【大小排序】即詞條按大小正序或倒序排列后,在最小數(shù)值到最大數(shù)值內,選擇任意數(shù)值的第N個詞條。例如,選擇文件大小100K的第7個詞條;如果沒有指定的大小,則增大(或減?。┲料乱粋€臨近且有詞條的文件大小數(shù)值;如果詞條數(shù)量不足的,選擇該文件大小詞條中最后一個詞條。
選樣方案示例如下:
[1]正序排列:首字音序為B詞條中的第5個詞條;
[2]正序排列:首字音序為D詞條中的第6個詞條;
[3]倒序排列:首字音序為F詞條中的第7個詞條;
[4]正序排列:(結合起止時間)XX年X月XX日XX分生成的第3個詞條;
[5]正序排列:(結合起止時間)XX年X月XX日XX+1分生成的第6個詞條;
[6]正序排列:(結合起止時間)XX年X月XX日XX+2分生成的第9個詞條;
[7]正序排列:(結合大小區(qū)間)XXKB的第1個詞條;
[8]正序排列:(結合大小區(qū)間)XX+10KB的第2個詞條;
[9]倒序排列:(結合大小區(qū)間)XX+20KB的第3個詞條。
原被告雙方、法庭可在前述方案內,提出任意選樣標準,據(jù)此選定比對樣本,再進行比對和結果統(tǒng)計。最后,基于選樣比對,分組統(tǒng)計比對結論,進一步計算出平均結論,作為雙方詞條近似數(shù)量在統(tǒng)計學意義上的參考結論。原告可以據(jù)此提出訴訟請求,被告可以據(jù)此提出抗辯主張,法庭也可以取得做出裁判所需的“定量”參考。
(二)圖庫、曲庫、文庫等其他場景
結合“無歧視概率比較法”在“海量”地圖數(shù)據(jù)和“海量”詞條對比場景下的應用經(jīng)驗,筆者進一步思考,該比對方法的思路也可以靈活地應用到“海量圖片”“海量音樂”“海量視頻”“海量文章”“海量評論”等有比對需求的場景。原被告雙方和法庭都可以結合涉案客體的類型、存儲和查找條件、數(shù)據(jù)體量等因素,設計合理的選樣方案,針對“海量”內容進行全面的選樣比對。針對涉及“海量”內容的圖庫、曲庫、文庫等場景,原被告和法庭均可以考慮涉案圖片、音樂、文章的特點,靈活地設置和建議選樣方案。例如,按拍攝對象(花、鳥、魚、蟲、人物、建筑……)設計,按作品、作者名稱分類,按作品風格、流派、類型等考慮,按國籍、地區(qū)、省份劃分,按文件大小、年代時間等維度排序,等等。
綜上,“無歧視概率比較法”可以在“海量”內容比對場景下成為法庭推進庭審調查,以及原被告雙方展開訴爭抗辯的工具。有效利用“無歧視概率比較法”的思路,原告可以完成初步的“全面”舉證,據(jù)此提出可靠的訴請主張;被告則可以有針對性地進行抗辯和舉證,配合法庭逐步查清事實。更有意義的是,類似導航電子地圖數(shù)據(jù)、大型圖片庫等高價值版權集合的權利人,在擬提起維權訴訟之前,可以依據(jù)“無歧視概率比較法”提供的思路和方法,進行比較可靠的前期“勘察”,據(jù)此制定妥當?shù)娜∽C計劃,進而提出相對準確的訴請主張,并在庭審初期完成舉證責任,將反駁證明責任穩(wěn)定地轉移至被告。
通常情況下,涉及“海量”內容的高價值版權集合的權利人,應當具備強大的技術團隊和專業(yè)的法務團隊。權利人在提出維權主張之前,有能力對維權目標及其行為進行比較細致、全面的調查評估,也有必要、有責任向法庭如實陳述其調查了解到的實際情況。僅憑少量相同主張就維權目標“全量”使用是不負責任。在涉及“海量”內容比對的場景下,筆者建議權利人嘗試應用“無歧視概率比較法”的思路和方法,作為夯實或消減“侵權懷疑”的工具,通過科學的前期“勘察”確認侵權狀況和維權需求,較為準確地提出維權主張,避免因為前期判斷失準而浪費巨額的維權成本和寶貴的司法資源。同時,也建議被告積極應用“無歧視概率比較法”,以實事求是的態(tài)度,積極提出選樣方案,認真配合比對工作,助力法庭查清事實、高效裁判。
