近日,在AI开发工具的创新热潮中,全球领先的图形处理器制造商英伟达携手知名AI创业公司Hugging Face以及企业级工作流管理服务商ServiceNow,共同揭晓了名为StarCoder2的下一代大型语言模型(LLMs)系列。
该系列模型旨在重新定义代码生成领域的技术标准,凭借其卓越性能、透明度及成本效率等多重优势,力图引领程序员的工作方式步入全新纪元。
该系列模型包括一个由 ServiceNow 训练的 30 亿参数模型、一个由 Hugging Face 训练的 70 亿参数模型和一个由英伟达训练的 150 亿参数模型。
这是通过使用名为 Stack v2 的新代码数据集实现的,该数据集比 Stack v1 大七倍;新的训练技术也意味着该模型可以更好地理解 COBOL 等低资源编程语言、数学和程序源代码讨论。
StarCoder2 经过 619 门编程语言培训,可以执行源代码生成、工作流生成、文本摘要等专业任务。英伟达表示,开发人员可以利用它进行代码补全、高级代码总结、代码片段检索等,从而提高工作效率。
英伟达表示相比较初版 StarCoder LLMs,新的 30 亿参数模型进一步精简和筛选了优质参数,其性能相当于 150 亿参数模型的初版 StarCoder。
StarCoder2 采用 BigCode Open RAIL-M 许可证,允许免版税访问和使用。
文明上网,理性发言,共同做网络文明传播者