当前位置: 首页 > 资讯 > 科技 > 豆包大模型:宣称性能追平GPT-4,首秀300万长文本处理能力
  • 0
  • 0
  • 分享

豆包大模型:宣称性能追平GPT-4,首秀300万长文本处理能力

字节跳动 2025-01-02 09:45:47 爱吃爆米花

近日消息,字节跳动旗下的豆包大模型在今天发布了2024年度的技术进展报告。报告中显示,其最新的版本Doubao - pro - 1215在综合性能方面已经达到了和GPT - 4全面相当的水平,并且在某些特定的专业领域还展现出了更为强劲的实力。这一成果表明,中国的大模型技术在发展进程中成功地迈进了全球第一梯队的行列。

自今年5月首次亮相以来,豆包大模型仅用7个月时间就实现了32%的能力提升。据官方介绍,通过优化海量数据处理和创新模型架构,包括提高模型稀疏度和引入强化学习等技术手段,豆包在理解精度和生成质量方面都取得了显著进步。特别是在数学和专业知识等复杂场景中,其表现甚至超越了GPT-4,而服务价格仅为后者的八分之一。

值得注意的是,豆包首次公开了其300万字的超长文本处理能力,这意味着它能够同时处理相当于"上百篇"学术报告的内容量。通过采用STRING等上下文关联数据算法,以及优化的稀疏化和分布式方案,豆包将百万tokens的处理延迟控制在15秒以内,大幅提升了模型对海量外部知识的处理效率。

这一技术突破不仅展示了中国AI技术的快速发展,也预示着大模型应用的普及可能将因更优的性价比而加速推进。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/107889.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热榜
热门游戏
换一换
热门软件
换一换