北京航空航天大學(xué)法學(xué)院王雪蕾在《河北法學(xué)》2025年第3期上發(fā)表題為《人工智能數(shù)據(jù)挖掘適用著作權(quán)合理使用制度的審思》的文章中指出:
在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的時(shí)代背景下,海量數(shù)據(jù)作為驅(qū)動(dòng)社會(huì)進(jìn)步的核心要素,展現(xiàn)出體量龐大、類型多樣、價(jià)值密度低以及處理速度迅捷的四大顯著特征。海量數(shù)據(jù)價(jià)值的深度挖掘與實(shí)現(xiàn),主要依賴于先進(jìn)的信息挖掘技術(shù)。而作為數(shù)字時(shí)代的標(biāo)志性科技成果,生成式人工智能通過大規(guī)模復(fù)制材料并精準(zhǔn)提取相關(guān)數(shù)據(jù),進(jìn)行智能識(shí)別與重組,從而生成精確答案,其高效運(yùn)作同樣植根于強(qiáng)大的數(shù)據(jù)挖掘技術(shù)之上。著作權(quán)的存在,是橫亙?cè)谌斯ぶ悄軘?shù)據(jù)挖掘過程中不容忽視的一個(gè)重要問題。在生成式人工智能的數(shù)據(jù)輸入環(huán)節(jié),由于對(duì)著作權(quán)狀態(tài)進(jìn)行識(shí)別的經(jīng)濟(jì)成本與時(shí)間成本高昂,機(jī)器往往會(huì)在未充分辨識(shí)目標(biāo)對(duì)象權(quán)利狀態(tài)的情況下即啟動(dòng)數(shù)據(jù)挖掘,但此舉潛藏著巨大的著作權(quán)侵權(quán)風(fēng)險(xiǎn),將給研發(fā)工作帶來沉重的經(jīng)濟(jì)負(fù)擔(dān)。為規(guī)避此風(fēng)險(xiǎn),部分研發(fā)者轉(zhuǎn)向使用公共領(lǐng)域的數(shù)據(jù),將數(shù)據(jù)來源局限于20世紀(jì)上半葉之前。但優(yōu)質(zhì)的訓(xùn)練數(shù)據(jù)集對(duì)于構(gòu)建高性能人工智能系統(tǒng)至關(guān)重要,若訓(xùn)練數(shù)據(jù)來源單一或過于陳舊,將導(dǎo)致生成結(jié)果不準(zhǔn)確、帶有時(shí)代偏見與歧視性,進(jìn)而無法貼合現(xiàn)階段用戶的需求,最終阻礙生成式人工智能的持續(xù)發(fā)展。因此,生成式人工智能的價(jià)值實(shí)現(xiàn),有賴于受著作權(quán)保護(hù)的作品數(shù)據(jù)的有效利用,我國法律對(duì)此必須給予積極回應(yīng)。
為推動(dòng)科學(xué)技術(shù)的進(jìn)步發(fā)展,人工智能數(shù)據(jù)挖掘行為應(yīng)被納入著作權(quán)合理使用制度的范疇。具體到合理使用制度的設(shè)計(jì)上,應(yīng)明確數(shù)據(jù)挖掘行為包含“數(shù)據(jù)分析”與“數(shù)據(jù)獲取”兩階段。在“數(shù)據(jù)分析”階段,應(yīng)明確人工智能對(duì)作品數(shù)據(jù)的利用行為處于著作權(quán)法應(yīng)然規(guī)制范圍外,無合理使用制度適用空間。依據(jù)“有閱讀權(quán)即有挖掘權(quán)”理念,人工智能在合法獲取作品數(shù)據(jù)后,即可對(duì)其進(jìn)行自由利用,無需得到著作權(quán)人的特別授權(quán)。但作為配套措施,人工智能主體需建立數(shù)據(jù)保護(hù)機(jī)制,以保障數(shù)據(jù)安全與隱私權(quán)益。在“數(shù)據(jù)獲取”階段,法律應(yīng)對(duì)商業(yè)性質(zhì)和非商業(yè)性質(zhì)的人工智能主體進(jìn)行區(qū)分,僅對(duì)非商業(yè)性質(zhì)人工智能的數(shù)據(jù)獲取行為適用合理使用制度。在進(jìn)行合理使用制度細(xì)則設(shè)計(jì)時(shí),我國可考慮先將此合理使用情形納入著作權(quán)法實(shí)施條例的修改,以此實(shí)現(xiàn)與著作權(quán)法的有效銜接和制度閉環(huán),最終完成該制度的現(xiàn)階段建立。
編輯:梁婧