人工智能(AI)作為新一輪科技革命和產業(yè)革命的重要驅動力,目前已成為全球科技、經濟以及宏觀政策布局所關注的領域。算力、算法和數據作為人工智能產業(yè)發(fā)展的基礎設施和生產要素,是決定人工智能產業(yè)實現高質量發(fā)展的重要保障。數據要素因包含了版權保護客體,引發(fā)了人工智能產業(yè)是否需要取得權利人授權并支付報酬的爭論。如何在強化數據供給的過程中保障版權權利人的權益,是在促進人工智能產業(yè)發(fā)展過程中需要面對的問題。
作者簡介:李陶,中央財經大學法學院副教授,中南財經政法大學知識產權研究中心研究員,碩士生導師;主要研究領域:知識產權法、反不正當競爭法、反壟斷法;華中科技大學法學碩士和法學學士,德國慕尼黑大學法學博士;兼任中國電影著作權協(xié)會法律工作委員會副主任等。 數據要素包含版權保護客體
人工智能模型訓練需要海量的優(yōu)質數據。數據集中除了自然人和法人的行為數據外,亦包含文字、圖片、影視、音樂等受版權保護的客體。這些客體是人工智能模型訓練和語料庫建設中的關鍵性要素:從“量”的角度看,人工智能模型訓練只有盡可能多地使用這些數據,才能提升模型運算的效率,為用戶提供全面的信息;從“質”的角度看,人工智能模型訓練的可靠性依賴高質量的優(yōu)質數據,越是傳播效率高的優(yōu)質版權客體,越能提升人工智能模型生成結果的可靠性和準確性。由于版權保護客體能夠滿足人工智能模型訓練對高質量數據的需要,因此成為了人工智能模型訓練中的關鍵性生產資料。版權保護客體包括作品(文字、音樂、美術等)和鄰接權保護客體(錄音錄像制品、廣播電視節(jié)目等)。在我國,自然人作品的保護期是作者終生及其死亡后五十年,鄰接權保護客體的保護期則是十年到五十年不等。目前產業(yè)中的文字生成軟件、圖像生成軟件、音樂生成軟件、視頻生成軟件都需要以版權保護客體作為訓練數據進行前期訓練。
模型訓練存在侵權風險
版權包括發(fā)表權、署名權、修改權、保護作品完整權四項人身權,以及復制權、信息網絡傳播權、改編權、翻譯權、匯編權等財產權。在人工智能模型訓練的過程中,會涉及上述版權所包含的權項。依據我國現行著作權法,使用者的開發(fā)利用行為如涉及上述權項,除存在版權合理使用情形外,均需要取得權利人授權并支付報酬。從人工智能模型開發(fā)者的角度看,實踐中其要么與權利人簽訂了商業(yè)利用版權保護客體的許可合同,要么通過技術手段從網上爬取所需要的數據或從第三方處購買所需要的數據使用權。在這一過程中,第三方是否有權許可他人使用版權客體用于模型訓練在很多情況下存疑。此外,模型開發(fā)者是否能夠將未經授權從網上爬取的數據用于模型訓練也存在爭議。
能夠為使用行為提供豁免的合理使用制度,是眾多未取得授權而使用版權保護客體進行模型訓練的主體在面臨版權侵權指控時所運用的抗辯理由。實踐中,有一些國家的司法判決認為,大模型對作品的使用屬于對作品獨創(chuàng)性表達的非表達性使用,且數據訓練只是對語料數據做結構性特征的分析,此種行為應當認定為合理使用。對該觀點,我國學界和產業(yè)界持謹慎態(tài)度,相關行為是否屬于合理使用的共識尚未形成。一方面,許多模型訓練的開發(fā)者已經與高質量語料庫的權利人簽訂了版權保護客體的數據訓練使用許可協(xié)議,如該觀點成立,則意味著其前期基于語料庫采購所形成的競爭優(yōu)勢將不復存在;另一方面,版權權利人也擔心后續(xù)模型訓練所生成的內容,會對其創(chuàng)作行為所反映的使用價值產生影響。此外,相關判決的說理忽視了人工智能模型訓練需以對版權保護客體進行復制為前提。該復制行為因服務于后續(xù)產品開發(fā)和服務提供而具有獨立的經濟價值,因此屬于對復制權的侵犯。
分類施策合理規(guī)制
從制度供給的角度看,各國立法者已經意識到了版權保護客體在人工智能模型開發(fā)利用中的價值以及其中所存在的問題,已有立法者對本國的版權制度進行了調整與創(chuàng)新,以回應產業(yè)發(fā)展和權利保護需求。在尊重知識產權的前提下,以實現利益平衡為共識,是在版權制度框架下解決人工智能模型訓練中版權問題的出發(fā)點。對此,結合版權制度已有的規(guī)范工具,針對不同人工智能模型對特定版權保護客體的依賴程度和人工智能模型本身的用途,分類施策應是未來合理的規(guī)制路徑。
首先,應當充分挖掘合理使用的適用潛力,對特定主體通過人工智能技術、為滿足特定目的使用版權保護客體的行為予以豁免。從已有域外立法的角度看,該豁免所適用的領域,應在滿足“三步檢驗法”的前提下確定。“三步檢驗法”作為國際領域確定版權合理使用的標準,《保護文學和藝術作品伯爾尼公約》第九條第二款對此進行了規(guī)定。其主要包括以下三個步驟。第一,合理使用只能在某些特殊情況下使用。對此,公約并沒有具體規(guī)定哪些情況屬于特殊情況,但根據各國立法,通常包括個人學習、研究或欣賞,介紹、評論某一作品或說明某一問題,報道時事新聞,學校課堂教學或科學研究中的翻譯,圖書館的陳列、保存或其他非營利性目的等。第二,合理使用不得與作品的正常利用相沖突,即合理使用不能影響作品的正常市場或商業(yè)價值。例如,不能因為合理使用而導致作品的銷售量下降或市場價值受損。第三,合理使用不得損害版權權利人的合法權益,即合理使用不能侵犯版權人的署名權、保護作品完整權等合法權益。
其次,應當引入新型法定許可制度,為特定場景下人工智能模型的開發(fā)者創(chuàng)造使用版權保護客體的渠道。法定許可制度具有平衡產業(yè)主體利益的功能,在適用法定許可的場景下,使用人無需取得權利人的一對一授權,而只需要向權利人支付合理的報酬。在不少國家和地區(qū),法定許可費用的支付及其標準的確定,多由著作權集體管理組織負責。著作權集體管理組織作為權利人和使用者之間的橋梁與紐帶,具有保障權利人權益、平衡權利人與使用者利益、促進版權保護客體高效傳播與利用的功能。著作權集體管理組織的運行受到專門性規(guī)范的調整(在我國為《著作權集體管理條例》),并接受市場監(jiān)管部門和行業(yè)主管部門的監(jiān)督。
此外,還應當保留版權權利人和人工智能模型訓練開發(fā)者針對特定模型開發(fā)的協(xié)商許可機制,以針對某類具體版權保護客體的人工智能應用進行授權。對此應當注意到,人工智能模型具有多樣性的特點,如果某種人工智能模型對特定作品具有高度的依賴性,即其所生成的內容和原作品之間具有緊密的關聯(lián)性,且能夠再現原作品的獨創(chuàng)性表達,則針對該場景下的人工智能模型訓練就需要取得版權人和使用者的一對一授權,既不適用合理使用,也無法通過法定許可進行規(guī)制。
