当前位置:100EC>数字研究>OECD:《2025年人工智能研究报告-爬取训练数据训练人工智能的知识产权问题》(附全文下载)
OECD:《2025年人工智能研究报告-爬取训练数据训练人工智能的知识产权问题》(附全文下载)
OECD发布时间:2025年07月18日 11:23:57

(网经社讯)人工智能(AI),尤其是生成式AI的迅猛发展,为知识产权(IP)领域带来了复杂的挑战。AI模型的开发、测试和验证高度依赖大规模数据集,导致对训练数据的需求激增。一种广泛采用的方法是“数据抓取”,本报告特指从第三方网站、数据库或社交媒体平台自动提取信息的行为。当数据抓取未经权利人同意或未支付报酬时,会直接影响知识产权保护作品的创作者和所有者。此类活动可能涉及多种知识产权及相关权利,包括版权、数据库权利、商标权、商业秘密、肖像权及人格权。

围绕数据抓取的知识产权法律环境复杂且快速演变。现行知识产权法律多制定于现代AI实践兴起之前,且不同司法管辖区存在差异,使得其适用性变得复杂。数据抓取常涉及受知识产权保护的内容,引发关于侵权、例外条款(如合理使用或文本与数据挖掘/TDM规定)的适用性,以及遵守合同条款等问题。抓取受版权保护的材料会引发关于其收集或使用是否构成侵权的疑问。此类诉讼全球范围内日益增多,美国欧盟及其他地区已出现多起具有影响力的案例。此外,对AI生成内容(尤其是未经授权模仿个人风格、声音或外貌的输出)的担忧,正促使各方采取多样化的法律应对措施,以保护权利并防止滥用。

数据抓取已成为普遍实践,但其涵盖多种方法且缺乏普遍认可的定义。该术语常与“数据挖掘”(指通过计算过程识别模式、趋势和关联的流程)及“网络爬虫”等技术混淆。本报告指出定义不一致的问题,并提出了一个广泛的工作定义。数据抓取的流程通常包括数据收集、预处理和使用。报告分析了不同的抓取技术,并强调需要采用通用/标准术语以及对这些方法进行明确区分。

数据抓取生态系统中不同参与者的行为引发了多样的法律问题。部分参与者利用数据抓取支持研究及其他活动,这表明需要针对不同使用场景制定相应的政策工具。该生态系统主要包括研究机构和学术界、AI数据聚合商、以及科技公司和平台运营商。研究机构和学术界常通过数据抓取收集数据用于学术和科学目的。AI数据聚合商被指控将抓取的数据提供给第三方,往往缺乏明确的许可条款或数据来源披露,引发知识产权及其他法律问题。科技公司和平台运营商则既是数据抓取的主要目标(数据来源),本身也常是数据抓取的实践者。

为引导数据抓取在国际协调框架下走上负责任的发展路径,制定“数据抓取行为准则”、推广标准合同条款、开发标准技术工具以及提升认识倡议。若能吸纳包括权利持有人、研究人员、AI开发者、民间社会及政策制定者在内的广泛多元利益相关方意见,此类规范将尤为有效。

自愿性“数据抓取行为准则”:可确立普遍适用的条款,并为AI生态系统中不同参与者(如AI数据聚合商与抓取数据使用者)提供具体指导。准则应包含标准术语以确保共同理解,可纳入监测遵守情况的机制(如注册系统),并就透明度和文档实践提出建议。最后,可包含标准合同条款。

标准技术工具:可帮助保护知识产权,使权利人更便捷地管理自身数据的访问权限,例如数据访问控制机制、自动化合同监控和直接支付系统。标准化工具能简化组织的合规流程,并助力权利人在多个平台上保护其权利。

标准合同条款:可解决与数据抓取相关的法律和运营问题。这些条款可作为可选起点,允许组织协商特定条件。其制定将受益于多利益相关方合作,并可针对不同应用场景(从非营利研究到商业应用)进行定制。

提升意识倡议:赋能利益相关方了解数据抓取及其法律影响,获取保护和管理自身权利的信息。这包括帮助权利人理解保护措施、教育AI系统用户负责任使用,以及确保AI数据生态系统中所有参与者明确自身角色与责任。

《2025年人工智能研究报告-爬取训练数据训练人工智能的知识产权问题》.pdf

浙江网经社信息科技公司拥有18年历史,作为中国领先的数字经济新媒体、服务商,提供“媒体+智库”、“会员+孵化”服务;(1)面向电商平台、头部服务商等PR条线提供媒体传播服务;(2)面向各类企事业单位、政府部门、培训机构、电商平台等提供智库服务;(3)面向各类电商渠道方、品牌方、商家、供应链公司等提供“千电万商”生态圈服务;(4)面向各类初创公司提供创业孵化器服务。

网经社“电数宝”电商大数据库(DATA.100EC.CN,免费注册体验全库)基于电商行业18年沉淀,包含100+上市公司、新三板公司数据,150+独角兽、200+千里马公司数据,4000+起投融资数据以及10万+互联网APP数据,全面覆盖“头部+腰部+长尾”电商,旨在通过数据可视化形式帮助了解电商行业,挖掘行业市场潜力,助力企业决策,做电商人研究、决策的“好参谋”。

【关键词】 AI原创
【投诉曝光】 更多>

【版权声明】秉承互联网开放、包容的精神,网经社欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源网经社;同时,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至NEWS@netsun.com,我们将第一时间核实、处理。

        平台名称
        平台回复率
        回复时效性
        用户满意度
        微信公众号
        微信二维码 打开微信“扫一扫”
        微信小程序
        小程序二维码 打开微信“扫一扫”