近年來,隨著人工智能技術的快速發(fā)展和廣泛應用,人工智能自主創(chuàng)作詩歌、小說、音樂等已不再是新鮮事情。如同人類作者創(chuàng)作需要已有文獻資料作為創(chuàng)作素材一樣,人工智能創(chuàng)作也需要創(chuàng)作素材來“喂養(yǎng)”。這些創(chuàng)作素材是以數據形式表現的各種數字化作品。根據《著作權法》原理,任何人使用他人處于權利保護期內的作品,都應當取得授權并支付費用(除非屬于合理使用或法定許可),否則屬于侵害著作權的行為。人工智能在創(chuàng)作過程中獲取和利用數據時所面臨的著作權侵權風險問題如果不能妥當地予以解決,將不可避免地使人工智能創(chuàng)作的作品一經生成便背負上侵權“原罪”,從而影響該作品的后續(xù)傳播與使用,最終阻礙人工智能技術的廣泛應用和社會文化藝術的繁榮發(fā)展。
與人工智能創(chuàng)作不斷繁榮的圖景相比,當前在解決人工智能創(chuàng)作中獲取與使用數據的合法性問題上面臨諸多困境:立法上,新修改《著作權法》關于著作權限制與例外的條款并未就此問題作出明確回應,使得這一問題在現行立法框架下如何解決仍缺乏規(guī)范依據;司法上,在我國兩起因人工智能創(chuàng)作引發(fā)的著作權侵權糾紛中,當事人及審理法院僅將人工智能的創(chuàng)作結果是否屬于作品及其著作權歸屬作為爭議焦點,對于人工智能創(chuàng)作所使用的數據來源是否合法則未予關注。立足于此,本文擬分析人工智能創(chuàng)作中獲取與使用數據存在的著作權風險,以期為后續(xù)探尋科學合理的風險化解之道提供依據。
人工智能創(chuàng)作利用數據可能侵害多種權利
復制權侵權風險。首先是數據獲取與輸入環(huán)節(jié)的復制權侵權風險。在人工智能進行深度自主學習之前,需要將作為創(chuàng)作素材的作品進行數字化處理并轉換為適合“機器閱讀”的標準數據格式。一般而言,完成這一過程有3種路徑:一是將非數字格式的作品轉換為機器可讀的數字格式。二是直接在互聯網上抓取已經數字化的數據作品。三是將已經數字化但格式上不兼容的數據進行標準格式的轉換。上述3種方式都是對已有作品在不改變內容的情形下所進行的全文復制和原樣再現,并且存儲在機器中形成永久復制件,屬于著作權法上的“復制”行為,存在侵犯復制權的風險。
其次是作品輸出環(huán)節(jié)的復制權侵權風險。根據“接觸+實質性相似”的著作權侵權判定規(guī)則,如果人工智能最終輸出的內容與之前所使用的數據作品存在實質性相似,則同樣可能會侵犯復制權。與前述全文復制或原樣再現不同的是,此種“實質性相似”判斷還要受到“思想/表達二分法”原則的限制,如果構成實質性相似的是思想而非表達,則難以構成著作權法意義上的復制。
改編權侵權風險。在人工智能創(chuàng)作中,如果最終輸出的生成內容即便具有一定的獨創(chuàng)性,但仍然保留了數據庫中某一作品或者某些作品的基本表達,應屬于改編作品,此種創(chuàng)作行為如未經許可并支付報酬則可能侵害改編權。有觀點認為,將此種情形下人工智能的創(chuàng)作結果視為演繹作品的說法并不十分準確,理由是人工智能創(chuàng)作“不是實質性地以某個作品為基礎所進行的再創(chuàng)作,不是對某個作品的演繹”。實際上,從人工智能創(chuàng)作對已有數據的利用來看,可以分為“利用同一人作品”進行創(chuàng)作和“利用多數人作品”進行創(chuàng)作兩種情形:前者如微軟公司開發(fā)的“下一個倫勃朗”人工智能系統,通過深度學習倫勃朗346幅畫創(chuàng)作出與倫勃朗風格相似但又具有獨創(chuàng)性的繪畫作品;后者如微軟“小冰”深度學習1926年以來500多位詩人的現代詩創(chuàng)作了《陽光失了玻璃窗》。這兩種情形都是利用已有作品創(chuàng)作出新作品,如果被學習的作品仍在著作權保護期限內,則都屬于侵犯改編權的行為。區(qū)別在于,前者侵害了同一作者數個作品的改編權,后者侵害了不同作者各自作品的改編權。
傳播權侵權風險。人工智能創(chuàng)作涉及的傳播權侵權風險主要是信息網絡傳播權和廣播權,表現在人工智能創(chuàng)作的輸出環(huán)節(jié):若將機器學習的數據分析結果通過網絡即時公開發(fā)布,可能會侵犯作品廣播權;如果延時發(fā)布,則可能侵犯信息網絡傳播權。
正是由于人工智能創(chuàng)作在使用數據作品中可能會侵害傳播權,為了避免此種侵權風險,日本著作權法于2018年修訂時專門增加了“提供新的知識和信息”的著作權例外條款。根據該條規(guī)定,如果是為了提供新的知識或者新的信息,通過計算機對作品進行信息處理,可以將處理結果向公眾提供。
人工智能創(chuàng)作利用數據侵權豁免之困境
著作權法的侵權豁免理由一般有合理使用、法定許可和強制許可三種類型。我國現行立法中尚無強制許可制度,法定許可規(guī)則所確定的4種類型也難以適用于人工智能創(chuàng)作場合,以下幾種合理使用情形最有可能作為侵權抗辯依據。
人工智能創(chuàng)作與“個人學習、研究”。根據我國新《著作權法》第二十四條第一款第一項的規(guī)定,“為個人學習、研究或者欣賞,使用他人已經發(fā)表的作品”可以不經著作權人許可亦無須支付報酬,此即為我國立法上的“個人使用”合理使用類型。人工智能創(chuàng)作需要對數據作品進行學習和研究,似乎在文義上屬于“個人使用”合理使用類型中的“學習、研究”范疇,但仔細分析后可發(fā)現,人工智能創(chuàng)作并不符合該條款的規(guī)范意旨,從而難以適用該規(guī)定進行合理使用抗辯。
理由如下:其一,從主體要件來看,“個人學習、研究”中的“個人”通常限于自然人,人工智能創(chuàng)作中使用數據的行為主體為人工智能系統,并非自然人,而控制人工智能創(chuàng)作系統的主體也是具備一定技術條件和物質條件的組織機構,并非單個的自然人。雖然實踐中直接操作或者使用人工智能系統進行創(chuàng)作的主體可能是作為自然人的科研人員或者公司員工,但這些科研人員或者公司員工所從事的“學習、研究”是為履行人工智能所有者(一般為大型科技公司)安排的工作任務所實施的職務行為,并非為了科研人員或者公司員工自己創(chuàng)作而進行的“學習、研究”,因此不符合個人使用的主體要求。其二,從目的要件來看,個人使用必須是基于“學習、研究”的非商業(yè)目的,當前的人工智能創(chuàng)作均由大型商業(yè)互聯網公司控制和實施,也難以符合個人使用的非商業(yè)目的要求。
人工智能創(chuàng)作與“科學研究”。根據我國新《著作權法》第二十四條第一款第六項的規(guī)定,在“為科學研究,翻譯、改編、匯編、播放或者少量復制已經發(fā)表的作品,供科研人員使用,但不得出版發(fā)行”情形下,可以不經著作權人許可亦無須支付報酬,此即為我國立法上的“科學研究”合理使用類型。
在人工智能創(chuàng)作中,對數據作品進行的分析和處理就是一種科學研究活動,但此種情形仍難以適用“科學研究”類型的合理使用抗辯。首先,著作權法規(guī)定的科學研究合理使用類型屬于以公共利益為目的對著作權進行的限制,因而該情形下的科研機構及科研活動應“只適用于國家設立的教育、科研公共事業(yè)單位”,而當前主導人工智能創(chuàng)作的主體多為大型商業(yè)互聯網公司。其次,此類合理使用對復制作品有數量限制,但人工智能創(chuàng)作中使用數據作品往往涉及對作品的全文復制,因此不符合“少量”的要求。最后,此類合理使用要求對于數據作品應“僅供科研人員使用”。
實踐中,人工智能創(chuàng)作使用數據的主體要么是作為人工智能所有人的大型互聯網企業(yè),要么是通過購買人工智能系統成為使用人的其他大型企業(yè);即使人工智能創(chuàng)作實際由科研人員進行操作,其也是基于履行崗位職責要求而實施的職務行為,不符合“供科研人員使用”這一條件,因此無法適用此種合理使用類型進行抗辯。
人工智能創(chuàng)作與“適當引用”。根據我國新《著作權法》第二十四條第一款第二項的規(guī)定,“為介紹、評論某一作品或者說明某一問題,在作品中適當引用他人已經發(fā)表的作品”,可以不經著作權人許可亦無須支付報酬,此即為我國立法上的“適當引用”合理使用類型。人工智能創(chuàng)作是在學習已有作品基礎上進行的二次創(chuàng)作,不可避免地要引用已有作品,表面上看似乎屬于適當引用,但仔細分析可以發(fā)現,此種合理使用類型也難以作為對人工智能創(chuàng)作使用數據予以侵權豁免的法律依據。
理由如下:其一,人工智能創(chuàng)作使用數據不符合“適當引用”條款所要求的目的要件。根據法條文義,適當引用必須是“為介紹、評論某一作品或者說明某一問題”,人工智能創(chuàng)作使用數據完全是為了生成新作品,既非“為介紹、評論某一作品”,也非“為說明某一問題”。其二,人工智能創(chuàng)作使用數據不符合“適當引用”條款所要求的“適當性”要件。引用的適當性要求所引用的部分不能構成被引作品的主要部分或實質部分,引用作品與被引作品具有主從關系和顯著的區(qū)別,如此才不會造成引用作品構成被引作品的“替代品”。人工智能創(chuàng)作對數據作品的使用顯然已經超出了適當性的要求,因此不符合“適當性”要件。
司法政策“混合標準”下的人工智能創(chuàng)作。我國在合理使用規(guī)則的設立上采取了封閉式的立法技術,即認定合理使用只能在《著作權法》列舉的具體類型清單中“對號入座”,不能在清單之外創(chuàng)設其他合理使用類型。但是,最高人民法院于2011年發(fā)布的一項司法政策在法定清單之外創(chuàng)設了認定合理使用的“混合標準”,即把美國版權法的“四要素標準”和國際條約的“三步檢驗法”混在一起形成了“確有必要+特殊情形+四要素標準+三步檢測法(后兩步)”的合理使用認定規(guī)則。該項司法政策并不屬于司法解釋,不宜直接作為法律適用依據,但可以在裁判說理中予以參照。該“混合標準”過于原則和抽象,使得人工智能創(chuàng)作能否被認定為合理使用具有很大的不確定性。例如,同樣采用“四要素標準”,有學者認為人工智能創(chuàng)作使用數據可以納入合理使用范疇,另有學者得出了截然相反的結論。因此,即使將司法政策的“混合標準”作為司法解釋予以適用,人工智能創(chuàng)作中的數據使用行為仍然存在著作權侵權風險。
