8月6日消息,英伟达被科技媒体曝光收集了大量涉及版权的资料,用以人工智能(AI)的训练过程。这一行为引发了关于版权法规遵守与AI技术研发界限的讨论,再次将科技伦理与数据使用的合法性置于聚光灯下。
该媒体披露的内部邮件、电子邮件、Slack 对话以及相关文件显示,英伟达从 YouTube 等多个来源收集视频素材,用于扩充训练 AI 的数据集。
该媒体披露的对话显示参与该项目的员工曾提出质疑,认为擅自使用 YouTube 视频以及研究目的编译的数据集,在法律层面可能会存在问题。
不过项目经理的回复是,这种收集模式已经获得了公司最高层的许可,可以使用这些内容训练 AI,并认为“完全符合版权法的文字描述和精神”。
一位英伟达员工透露,公司要求员工收集 YouTube、Netflix 等视频源的视频,用于训练英伟达的 Omniverse 3D 生成器、自动驾驶系统和“数字人类”(Digital Human)产品。
该项目内部称其为 Cosmos 项目,为了规避 YouTube 的检测,英伟达使用具有轮换 IP 地址的虚拟机下载内容以避免被封禁。
英伟达员工写到:“我们在使用 AWS ,重新启动实例会分配一个新的公共 IP,所以到目前为止这不是问题。”
文明上网,理性发言,共同做网络文明传播者