7月18日消息,苹果公司于今日通过科技媒体平台发表正式声明,针对近期关于其OpenELM开源人工智能模型训练过程中涉及YouTube资源的争议予以澄清。苹果强调,OpenELM项目并未被应用于任何其他人工智能或机器学习相关项目中,这包括但不限于Apple Intelligence内部的项目。
非营利性新闻工作室 ProofNews 发布调查报告,表示苹果公司在训练 AI 模型 OpenELM 时,使用了名为 YouTube Subtitles 的数据集,大小为 5.7GB(4.89 亿个单词)。
该数据集由 EleutherAI 创建,最早发布于 2020 年,涉及超过 48000 个频道的 173536 个 YouTube 视频字幕内容,其中还包含 12000 多个平台已删除视频的字幕内容。
苹果在最新声明中表示,OpenELM 模型的目的是为研究社区作贡献,并推动开源大型语言模型发展。
苹果公司的研究人员曾将 OpenELM 描述为“最先进的开放式语言模型”。
苹果强调 OpenELM 仅用于研究目的,没有用于任何商业 Apple Intelligence 功能,该模型以开源方式发布,开发者可以自由获取。苹果还表示现阶段没有计划构建新版 OpenELM 模型。
文明上网,理性发言,共同做网络文明传播者