当前位置：首页 > 资讯 > 科技 > 智源研究院公布FlagEval大模型竞技场：文生视频模型巅峰对决评测平台正式上线

智源研究院公布FlagEval大模型竞技场：文生视频模型巅峰对决评测平台正式上线

智源研究院 2024-09-07 13:34:20 爱吃爆米花

近日消息，北京智源人工智能研究院（BAAI）对外公告，正式启动全球首项融合文本生成视频能力的模型竞技评估平台——FlagEval大模型角斗场，为AI技术的创新与突破开启了全新的竞技舞台。

这一服务面向用户开放，覆盖了国内外约40款大模型，并支持语言问答、多模态图文理解、文生图、文生视频等四大任务的自定义在线或离线评测。FlagEval大模型角斗场的推出，不仅提供了简单理解、知识应用、代码能力、推理能力等多种预设问题的评测，还首次引入了主观倾向阶梯评分体系，以更精确地揭示模型性能差异。

该服务采取匿名机制进行评测，确保评测过程的公正性。用户可以通过网页端或国内首个移动端访问入口参与评测，体验高效的模型对战评测。FlagEval大模型角斗场的评分结果将即时公示，形成角斗场榜单，展现各模型的对战能力。

智源研究院表示，将对模型对战评测的全链路数据进行开源，以促进大模型评测生态的发展。FlagEval大模型角斗场的推出，进一步拓展了智源在模型评测领域的技术布局和工具方法的研发，为人工智能领域的研究和应用提供了新的测试和评估工具。

扩展阅读

智源FlagCX：异构统一通信库，开启AI数据跨芯片高效互联新篇

智源FlagCX：异构统一通信库，开启AI数据跨芯片高效互联新篇

智源研究院 2024-12-30 09:49

来源：站长之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/84753.html

文章标签

智源研究院

评论

文明上网，理性发言，共同做网络文明传播者

验证码

提交

猜你喜欢

腾讯新一代大模型“混元 Turbo”震撼登场：推理效率倍增100%，成本大幅削减50%

腾讯评论：0 2024-09-07
《Outlook》将迎来更新，新增邮件草稿最小化功能

Microsoft Outlook 评论：0 2025-02-12

最新

智源FlagCX：异构统一通信库，开启AI数据跨芯片高效互联新篇

智源研究院评论：0 2024-12-30
智源重磅开源：See3D模型引领无标注视频学习3D生成新潮流

智源研究院评论：0 2024-12-15
智源发布Video-XL大模型：实现小时级超长视频理解

智源研究院评论：0 2024-10-29
智源发布Infinity-Instruct：千万指令量微调数据集引领AI语言模型新纪元

智源研究院评论：0 2024-10-03
智源研究院引领潮流，发布全球首个多语种大模型辩论平台FlagEval Debate

智源研究院评论：0 2024-09-30

显示更多

热榜

百度热搜微博热搜抖音热搜

1买到《哪吒2》手写票的观众发声，质疑偷票房多渠道进行举报

2曝《哪吒2》被偷票房，损失了几千万？

3特朗普停铸1美分硬币：太浪费

4特朗普签令：对输美钢铝征收25%关税

5Meta“AI读心术”准确率可达80%，不开颅、不植入

6朝鲜此时撤军，俄乌释放何种信号

7外交部：中方对努乔马逝世表示深切哀悼

8美国2架飞机跑道上相撞，已致1人死亡

热门游戏

第五人格
手游 / 角色扮演
去下载
王者荣耀
手游 / 角色扮演
去下载

换一换

热门软件

微信
应用 / 社交
去下载
支付宝
应用 / 工具
去下载
抖音
应用 / 视频
去下载

换一换