AI时代,知识产权如何保护?

〖2025/1/14 8:15:31时〗 白兔商标专网提供

【字体: 】【发表评论
信息来源:中国知识产权报  信息整理编辑:咖啡
 
        编者按

  在数字经济时代,知识产权的保护与运用对于激发创新活力、促进经济高质量发展具有不可替代的作用。近日,北京知识产权研究会成功举办了第五届“数字经济与知识产权论坛”,吸引了众多业界专家、学者以及相关从业者的积极参与。在此次论坛上,与会人员围绕大会主题从不同角度出发,分享了各自的研究成果和实践经验。本期邀请相关专家就数字经济下的知识产权相关问题进行探讨,以飨读者。

        议论风生

        生成式人工智能的著作权法律问题  当前,生成式人工智能技术和应用浪潮快速席卷全球,给现行法律制度带来了诸多新挑战,引发了“训练阶段使用数据合法性”“人工智能生成内容是否可受著作权保护”等话题。

  生成式人工智能的底层关键技术,即大模型的最终性能,主要与计算量、模型参数量和训练数据量三者的大小相关。正是建立了海量的训练数据集,才能实现大模型的“智能涌现”。然而,高质量数据的短缺及训练数据获取和使用的合法性问题仍是产业发展面临的重大法律挑战。

  对于人工智能生成内容是否可受著作权保护的问题,中国、美国、加拿大等国家都已发生了多起典型案件。人工智能生成内容的可著作权性问题,在个案层面涉及作者是否必须是自然人、人对人工智能的影响是否必须是直接决定内容的表达性要素、人工智能是否可以视为人的创作工具等问题;宏观层面则涉及著作权法的立法目标,是否有必要通过著作权法对人工智能技术进行投资激励、促进产业的发展,以及人工智能生成内容是否具有稀缺性和保护价值,对人工智能生成物与人类创作进行区别对待是否可能产生欺诈、隐瞒等问题。

  就生成式人工智能的输出而言,因其可能涉及基座大模型服务方、模型精调服务方、应用服务提供方、用户等的多方参与,具有因果关系复杂性和责任主体多元化等特征,从而使得其侵权认定与传统的网络服务侵权认定存在较大差异,亦无法简单复用传统网络侵权中网络用户与网络服务提供者的二元主体划分。更重要的是,人工智能生成内容并不具备直接公开性,处于人机对话的一对一场景,需要借助用户或者其他主体的进一步传播才有可能影响社会公众。如用户并未对外进一步传播,此时是否应认定知识产权侵权,以及在认定知识产权侵权的情况下如何分配举证责任、认定因果关系,仍需深入研判。

  此外,生成式人工智能技术服务提供者的过错或者注意义务边界何在,特别是是否需要采取事前著作权过滤措施,亦存较大争议。依据生效的广州互联网法院(2024)粤0192民初113号民事判决,法院要求被告应采取关键词过滤等措施停止侵权,且防范程度应达到“用户正常使用提示词,不能生成与涉案图片实质性相似的图片”。然而,“实质性相似”涉及著作权法领域的专业判断,法律专业人士的理解尚可能不一致,要求服务提供者从技术角度实现是否具有可行性,以及此种注意义务边界是否合理、是否符合现行技术发展水平,仍有较大探讨空间。

  当前,科技创新已成为推动产业升级和经济增长的关键因素。以生成式人工智能为代表的前沿科技,不仅在技术层面上实现了突破,更在产业应用上展现出巨大潜力。如何通过法律规则的供给为其发展提供动力,特别是如何引入适应生成式人工智能的责任规则体系、“避风港”规则,为技术和产业发展提供稳定的知识产权预期和侵权责任豁免“空间”,需要社会各界共同探索。(北京知识产权研究会副理事长  王洁)

        大局微观

        人工智能生成内容著作权侵权风险剖析

  随着大模型技术和数字经济的蓬勃发展,人工智能生成内容所涉及的著作权问题日益凸显。对于人工智能生成内容来说,著作权风险不仅存在于训练数据,也可能影响其输出成果。

  在当今大模型“百模大战”的今天,人工智能借助强大算法与海量数据,开启了内容创作的新篇章,涉足文章、图画、视频等诸多领域。然而,人工智能生成内容的繁荣背后,著作权侵权风险与日俱增。

  人工智能生成内容的生成离不开对海量数据的挖掘学习,这些数据依照公开程度分为公开数据、半公开数据、非公开数据,内容多源于现实已存在作品。在数据利用过程中,使用相关数据如果涵盖受保护作品,则需要权利人的授权。但实践中,部分人工智能项目开发者为求快速搭建、优化模型,常忽视数据合法性审查。也会有一些大模型公司,为削减成本,私自抓取文学、新闻、学术等作品作为训练素材,而这一行为将会侵害权利人的复制权、信息网络传播权等权益。一旦被追责,开发者不仅面临巨额赔偿与法律制裁,而且前期研发心血也将付诸东流。

  与此同时,从权利人角度看,人工智能生成内容的数据使用极具隐蔽性。作品融入海量数据集后,权利人极难追踪察觉,即便有所怀疑,鉴于技术追查门槛高、侵权范围难以界定,损失程度量化也较为困难。

  在输出端,不仅从人工智能生成内容训练数据的收集时就需要注意规避侵权风险,在人工智能生成内容完成训练输出成果时,也需防范其著作权风险。

  一方面,人工智能生成内容文本挖掘技术易出现“借鉴”过度的情况。以网络文学为例,在写作中会出现特定情形下的少量引用他人作品,但人工智能生成内容常模糊此界限,各种拼凑、抽取他人作品中精彩语句、情节架构或核心观点融入自身文本。若生成内容不符合“合理使用”要件,如引用超限、冲击原作品市场价值,侵权纠纷便一触即发。以小说为例,部分人工智能生成内容生成小说章节照搬经典桥段,仅换角色名与场景,很容易遭到原作者与读者谴责,AI的开发者与运营者也会陷入舆论与法律困境。另一方面,若人工智能生成内容与输入作品“实质性相似”,极易引发侵权争议。从社会公众视角,如果二者整体观感、关键表达元素易混淆,使人误认关联派生关系,依著作权法相关规定,仍可能被认定为侵权。

  人工智能生成内容在发展过程中面临的挑战,亟需全方位策略“破局”。从立法层面,应加速完善针对人工智能生成内容的著作权法规细则,明确数据使用合法性边界,细化“合理使用”判断标准,为侵权认定与纠纷解决筑牢法律根基;从技术层面,开发者要积极研发侵权监测与预警技术,如区块链溯源数据,在生成内容环节引入查重比对,实时筛查风险;从行业层面,人工智能生成内容产业上下游应联合成立行业协会,制定自律规范,强化数据合规培训,提升从业者著作权意识,营造健康产业环境。(北京理工大学智能科技法律研究中心研究员  王磊)