当前位置: 首页 > 资讯 > 科技 > 智源研究院创新突破:Bunny-3B新一代多模态小模型引领技术新浪潮
  • 0
  • 0
  • 分享

智源研究院创新突破:Bunny-3B新一代多模态小模型引领技术新浪潮

智源研究院 2024-02-23 17:27:21 爱吃爆米花

智源研究院在近日取得一项关键技术创新,成功借助先进的数据压缩与优选技术手段,筛选提炼出高纯度训练数据资源,进而赋能多模态小型模型实现性能跃升,这一突破预示着未来在有限数据条件下优化模型效能的新趋势。

具体来说,他们将 LAION-2B 压缩成2M 核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。这一技术路线带来了新一代多模态小模型 Bunny 系列,其中 Bunny-3B 表现出色,在多个基准上超越了其他近期热门模型,与大模型相媲美。

Bunny 模型采用经典的 Encoder+Projector+LLM 架构,支持多种 Vision Encoders 和 LLM Backbone,提供可扩展的组合框架。在各类多模态模型评估中,Bunny 表现优异,甚至在一些指标上超越了13B 大模型。该技术的关键在于数据驱动的多模态模型研究,为多模态大模型轻量化提供了新思路和工具。

总的来说,通过数据浓缩技术获得高质量训练数据,Bunny 系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/16827.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热门游戏
换一换
热门软件
换一换