王雪蕾談人工智能數(shù)據(jù)挖掘行為——

應(yīng)被納入著作權(quán)合理使用制度的范疇

2025-03-13 09:53:46 來源：法治日?qǐng)?bào)-法治網(wǎng) -標(biāo)準(zhǔn)+

北京航空航天大學(xué)法學(xué)院王雪蕾在《河北法學(xué)》2025年第3期上發(fā)表題為《人工智能數(shù)據(jù)挖掘適用著作權(quán)合理使用制度的審思》的文章中指出：

在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的時(shí)代背景下，海量數(shù)據(jù)作為驅(qū)動(dòng)社會(huì)進(jìn)步的核心要素，展現(xiàn)出體量龐大、類型多樣、價(jià)值密度低以及處理速度迅捷的四大顯著特征。海量數(shù)據(jù)價(jià)值的深度挖掘與實(shí)現(xiàn)，主要依賴于先進(jìn)的信息挖掘技術(shù)。而作為數(shù)字時(shí)代的標(biāo)志性科技成果，生成式人工智能通過大規(guī)模復(fù)制材料并精準(zhǔn)提取相關(guān)數(shù)據(jù)，進(jìn)行智能識(shí)別與重組，從而生成精確答案，其高效運(yùn)作同樣植根于強(qiáng)大的數(shù)據(jù)挖掘技術(shù)之上。著作權(quán)的存在，是橫亙?cè)谌斯ぶ悄軘?shù)據(jù)挖掘過程中不容忽視的一個(gè)重要問題。在生成式人工智能的數(shù)據(jù)輸入環(huán)節(jié)，由于對(duì)著作權(quán)狀態(tài)進(jìn)行識(shí)別的經(jīng)濟(jì)成本與時(shí)間成本高昂，機(jī)器往往會(huì)在未充分辨識(shí)目標(biāo)對(duì)象權(quán)利狀態(tài)的情況下即啟動(dòng)數(shù)據(jù)挖掘，但此舉潛藏著巨大的著作權(quán)侵權(quán)風(fēng)險(xiǎn)，將給研發(fā)工作帶來沉重的經(jīng)濟(jì)負(fù)擔(dān)。為規(guī)避此風(fēng)險(xiǎn)，部分研發(fā)者轉(zhuǎn)向使用公共領(lǐng)域的數(shù)據(jù)，將數(shù)據(jù)來源局限于20世紀(jì)上半葉之前。但優(yōu)質(zhì)的訓(xùn)練數(shù)據(jù)集對(duì)于構(gòu)建高性能人工智能系統(tǒng)至關(guān)重要，若訓(xùn)練數(shù)據(jù)來源單一或過于陳舊，將導(dǎo)致生成結(jié)果不準(zhǔn)確、帶有時(shí)代偏見與歧視性，進(jìn)而無法貼合現(xiàn)階段用戶的需求，最終阻礙生成式人工智能的持續(xù)發(fā)展。因此，生成式人工智能的價(jià)值實(shí)現(xiàn)，有賴于受著作權(quán)保護(hù)的作品數(shù)據(jù)的有效利用，我國法律對(duì)此必須給予積極回應(yīng)。

為推動(dòng)科學(xué)技術(shù)的進(jìn)步發(fā)展，人工智能數(shù)據(jù)挖掘行為應(yīng)被納入著作權(quán)合理使用制度的范疇。具體到合理使用制度的設(shè)計(jì)上，應(yīng)明確數(shù)據(jù)挖掘行為包含“數(shù)據(jù)分析”與“數(shù)據(jù)獲取”兩階段。在“數(shù)據(jù)分析”階段，應(yīng)明確人工智能對(duì)作品數(shù)據(jù)的利用行為處于著作權(quán)法應(yīng)然規(guī)制范圍外，無合理使用制度適用空間。依據(jù)“有閱讀權(quán)即有挖掘權(quán)”理念，人工智能在合法獲取作品數(shù)據(jù)后，即可對(duì)其進(jìn)行自由利用，無需得到著作權(quán)人的特別授權(quán)。但作為配套措施，人工智能主體需建立數(shù)據(jù)保護(hù)機(jī)制，以保障數(shù)據(jù)安全與隱私權(quán)益。在“數(shù)據(jù)獲取”階段，法律應(yīng)對(duì)商業(yè)性質(zhì)和非商業(yè)性質(zhì)的人工智能主體進(jìn)行區(qū)分，僅對(duì)非商業(yè)性質(zhì)人工智能的數(shù)據(jù)獲取行為適用合理使用制度。在進(jìn)行合理使用制度細(xì)則設(shè)計(jì)時(shí)，我國可考慮先將此合理使用情形納入著作權(quán)法實(shí)施條例的修改，以此實(shí)現(xiàn)與著作權(quán)法的有效銜接和制度閉環(huán)，最終完成該制度的現(xiàn)階段建立。

編輯：梁婧