在日前召開的北京知識產(chǎn)權(quán)法研究會2025年會“數(shù)字時代著作權(quán)的嚴格保護”專題論壇上,中國政法大學法律學院教授陶乾圍繞基礎(chǔ)模型的著作權(quán)問題進行了深入探討,系統(tǒng)闡釋了“數(shù)據(jù)—信息—作品”三元關(guān)系理論,明確提出基礎(chǔ)模型訓練本質(zhì)上是使用“載體數(shù)據(jù)”而非“信息作品”,不屬于《著作權(quán)法》規(guī)制的“表達性使用”行為,為AI產(chǎn)業(yè)的版權(quán)合規(guī)提供了全新法理框架參考。
厘清“表達性使用”的邊界
陶乾從知識產(chǎn)權(quán)基礎(chǔ)理論切入,指出作品本質(zhì)是信息,數(shù)據(jù)則是信息的載體。“知識產(chǎn)權(quán)無論是技術(shù)方案還是作品,均屬于以非物質(zhì)形態(tài)存在的知識信息;數(shù)據(jù)作為信息的物理載體,承擔著傳輸與存儲功能。”她提到,數(shù)字時代使作品呈現(xiàn)“雙重無形性”:傳統(tǒng)載體,如圖書、光盤等具有物理形態(tài),作品(無形)與載體(有形)界限分明;數(shù)字載體,如電子數(shù)據(jù)中,作品與載體均無形,導致“作品使用”與“數(shù)據(jù)使用”混同。正是這種混同,使得界定著作權(quán)法意義上的“作品使用”成為數(shù)字時代的核心挑戰(zhàn)。
通過對《著作權(quán)法》體系的解構(gòu),陶乾提出:《著作權(quán)法》保護的客體是表達,規(guī)制的行為是對表達的“使用”。在權(quán)利內(nèi)容維度,復制、發(fā)行、表演等行為均是將作品表達呈現(xiàn)給人類感知的過程;在侵權(quán)判定維度,“實質(zhì)性相似”比對的核心是表達而非思想;在權(quán)利限制維度,合理使用制度豁免的仍是對表達的使用,如適當引用。她引入“表達性使用”概念,強調(diào)其本質(zhì)在于使用者通過感知表達獲得精神體驗,例如閱讀文字或觀賞畫作。與之相對的非表達性使用,如統(tǒng)計學分析文本詞頻則不受《著作權(quán)法》約束。
聚焦基礎(chǔ)模型訓練場景,陶乾認為,AI訓練是對“數(shù)據(jù)載體”的物理處理,而非對“作品信息”的“表達性使用”。技術(shù)原理佐證了這一觀點:首先,模型僅分析數(shù)據(jù)元素間的分布規(guī)律,如文字組合概率、圖像像素關(guān)聯(lián),不識別作品藝術(shù)價值或思想內(nèi)涵;其次,AI處理證件照與藝術(shù)照的功能完全一致,均屬數(shù)據(jù)模式識別,無人類審美體驗;再次,實證案例更顯示,“投喂”山東方言倒裝句數(shù)據(jù)后,模型僅習得語法結(jié)構(gòu)規(guī)律,不受版權(quán)保護,而非具體表達內(nèi)容。“機器學習的本質(zhì)是掌握符號統(tǒng)計規(guī)律,與人類通過欣賞表達獲得知識存在根本邏輯差異。”陶乾總結(jié)道,“因此,訓練行為并不構(gòu)成‘使用作品’,更無需討論是否構(gòu)成合理使用。”
構(gòu)建版權(quán)合規(guī)新范式
因此,陶乾提出適配AI產(chǎn)業(yè)實踐的“三層治理模式”。她認為,AI產(chǎn)業(yè)鏈的版權(quán)合規(guī)應(yīng)當遵循分層治理原則。在基礎(chǔ)層,商業(yè)化數(shù)據(jù)集開發(fā)者需嚴格把控版權(quán)合規(guī),在復制和匯編作品時必須取得著作權(quán)人授權(quán)。在技術(shù)層,模型開發(fā)商的責任在于確保從合法渠道獲取整體數(shù)據(jù)集,而非審查數(shù)據(jù)集中的單個作品版權(quán)。在應(yīng)用層,監(jiān)管重點應(yīng)放在侵權(quán)內(nèi)容的傳播環(huán)節(jié),對于AI工具生成的侵權(quán)內(nèi)容,應(yīng)當依據(jù)傳統(tǒng)網(wǎng)絡(luò)傳播權(quán)規(guī)則,追究實際傳播者而非工具開發(fā)者的責任,適用“避風港原則”和“紅旗標準”進行規(guī)制。這種分層治理模式可以既保障權(quán)利人的合法權(quán)益,又為AI技術(shù)創(chuàng)新提供合理發(fā)展空間。
隨著全球AI競賽進入深水區(qū),版權(quán)合規(guī)已成技術(shù)發(fā)展的關(guān)鍵變量。從《著作權(quán)法》基本原理出發(fā),陶乾通過厘清數(shù)據(jù)與作品的法律屬性,為產(chǎn)業(yè)發(fā)展提供了“何處需嚴管(數(shù)據(jù)集匯編)、何處應(yīng)放開(模型訓練)”的建議,值得業(yè)界進一步探討。
