近日消息,字节跳动旗下的豆包大模型在今天发布了2024年度的技术进展报告。报告中显示,其最新的版本Doubao - pro - 1215在综合性能方面已经达到了和GPT - 4全面相当的水平,并且在某些特定的专业领域还展现出了更为强劲的实力。这一成果表明,中国的大模型技术在发展进程中成功地迈进了全球第一梯队的行列。
自今年5月首次亮相以来,豆包大模型仅用7个月时间就实现了32%的能力提升。据官方介绍,通过优化海量数据处理和创新模型架构,包括提高模型稀疏度和引入强化学习等技术手段,豆包在理解精度和生成质量方面都取得了显著进步。特别是在数学和专业知识等复杂场景中,其表现甚至超越了GPT-4,而服务价格仅为后者的八分之一。
值得注意的是,豆包首次公开了其300万字的超长文本处理能力,这意味着它能够同时处理相当于"上百篇"学术报告的内容量。通过采用STRING等上下文关联数据算法,以及优化的稀疏化和分布式方案,豆包将百万tokens的处理延迟控制在15秒以内,大幅提升了模型对海量外部知识的处理效率。
这一技术突破不仅展示了中国AI技术的快速发展,也预示着大模型应用的普及可能将因更优的性价比而加速推进。
文明上网,理性发言,共同做网络文明传播者