抽象人脸 - 心灵的力量 - 人工智能、心理学、技术
图片来源:ELZABURU
埃尔扎布鲁

人工智能相对于版权的缺点。

最近针对 GitHub上MicrosoftOpenAI 耗资 9 亿美元的 Open AI Codex 证明了可能出现的问题 #人工智能:其开发可能会侵犯 #版权 而且你必须非常小心地操作。

上述法律行动质疑使用 GitHub 存储库来培训 GitHub Copilot(一项使用人工智能自动完成编程代码的服务)的合法性。 该诉讼由 Matthew Butterick 提起,称 11 项开源许可证和版权受到侵犯。

人工智能系统如何工作?

人工智能系统的训练需要为其提供庞大的数据库(例如 GitHub 上的数据库),以开发支持该技术的大型语言模型 (LLM)。

在当前的例子中,它是一个带有代码的大型数据库 #开源。 用于训练人工智能的代码可以是 Copyleft(带有病毒许可证)或带有宽松许可证(不太开放)。 无论如何,他们都需要尊重作者的权利。

这可能会迫使开源代码的用户通知其使用情况,将其来源归于作者,并遵守许可条款,其中可能需要保持源代码的扩展或修改版本的开放性或者对于将其集成为一部分的代码。

 

侵犯版权的内容

好吧,这样的事情不会发生在 GitHub Copilot 服务上,这不仅会违反上述权利和条款,还会促进用户侵犯版权,因为他们不知道自动完成他们的代码片段属于他们其他人。 因此,他们甚至可能正在开发商业代码,而没有真正自由地使用 Github Copilot 为此目的提供的代码。

谷歌或 Facebook 等其他公司的人工智能系统也在以同样的方式开发。 他们不仅使用编程代码作为该技术的燃料,还使用受版权保护的其他类型的文本,例如文学作品、新闻文本、音乐等。

为此,许多专家质疑利用这些作品来推动这项技术的发展是否有效,以及必须采取哪些措施才能实现这一目标。 当然,人类的灵感是有来源的,而不是无中生有,人工智能这样做也是合理的,但必须采取什么措施才能让人工智能在阅读这些来源后不会生成侵犯版权的内容呢?

至少,这将迫使使用 Github Copilot 和其他类似工具的公司执行严格的代码审计。 否则,他们的所有工作都将面临无法进行商业利用等风险。

阿尔贝托·洛佩斯·卡萨里利亚, ELZABURU 律师

分享帖子 →

也许你可能感兴趣...