生成式人工智能的大发展,也带来AI大模型的训练数据来源的侵权争议。9月6日,在北京互联网法院举办的能动司法与数字治理“京e研讨”上,与会学者普遍认为,鼓励知识产权训练数据发展是当前的主旋律,要想解决训练数据侵权的诉争冲突,可以通过司法的个案判决来逐步积累共识、树立规则。
中国政法大学数据法治研究院教授张凌寒认为,要解决训练数据来源的侵权争议,最根本的是要考虑利益平衡的诉求,我们需要思考“究竟希望将来有怎样的AIGC(即生成式人工智能)产业生态。”
著作权法上的“合理使用”制度,并不能直接过渡到生成式人工智能领域的“合理训练”。因此,需要重新设立知识产权规则,而如何设立新的知识产权规则,取决于究竟想要一个怎样的利益分配机制。
张凌寒认为,根据过去的经验,随着时间的推移,利益之争可以成为共同合作的契机。她希望通过司法判决的个案,推动艺术家、原创作者、平台方和用户之间形成共同收益分成的机制。
北京大学法学院副教授胡凌也认为,法院通过裁判可以促进利益平衡和共识形成。“司法判决可以不断地通过个案来积累共识,设定合理价格,解决冲突。”
中国人民大学法学院副教授张吉豫提出一些具体构想,例如合理分配不同主体的注意义务,分割人工智能服务提供者与用户之间的承担;同时,还可以探索和发展人工智能自身的“避风港”规则;此外,“通知-删除”规则也可以进一步发展。