当前位置: 首页 > 资讯 > 科技 > B站发布Index-1.9B模型源码:依托2.8万亿字训练数据,开启AI角色扮演新篇章
  • 0
  • 0
  • 分享

B站发布Index-1.9B模型源码:依托2.8万亿字训练数据,开启AI角色扮演新篇章

哔哩哔哩(bilibili) 2024-06-22 09:00:50 爱吃爆米花

近日消息,哔哩哔哩(B站)在人工智能领域迈出新步伐,宣布开源一套专为高效计算设计的Index-1.9B模型系列。此次发布的模型家族引人注目,它不仅涵盖了核心的基础模型,还特意加入了对比实验模型、面向互动的对话模型以及富有趣味性的角色模拟模型等多个维度的变体。

附官方简介:

Index-1.9B base : 基座模型,具有 19 亿非词嵌入参数量,在 2.8T 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先。

Index-1.9B pure : 基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于严格过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响。

Index-1.9B chat :基于 index-1.9B base 通过 SFT 和 DPO 对齐后的对话模型,由于预训练中引入了较多互联网社区语料,聊天的趣味性明显更强。

Index-1.9B character :在 SFT 和 DPO 的基础上引入了 RAG 来实现 fewshots 角色扮演定制。

据介绍,该模型在预训练阶段使用了 2.8T 规模的数据,中英比例为 4:5,代码占比 6%。目前,角色扮演模型内置了角色“三三”,用户也可以按需创建自己的角色。

所 属 资 源
哔哩哔哩电脑版
哔哩哔哩电脑版
软件 / 视频直播 /
一款功能强大的二次元弹幕直播平台
去下载
来源:it之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/57649.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热门游戏
换一换
热门软件
换一换