取消
搜索历史
热搜词
原创
活动
产业创新
转型理念
ENI专访
当前位置:首页 >文章发布 > 正文
智源研究院推出包含文生视频模型对战评测服务:FlagEval大模型角斗场
来源:AIbase基地  作者: 佚名 2024-09-05 09:14:16
9月4日,北京智源人工智能研究院(BAAI)宣布推出全球首个包含文生视频的模型对战评测服务——FlagEval大模型角斗场。

9月4日,北京智源人工智能研究院(BAAI)宣布推出全球首个包含文生视频的模型对战评测服务——FlagEval大模型角斗场。

这一服务面向用户开放,覆盖了国内外约40款大模型,并支持语言问答、多模态图文理解、文生图、文生视频等四大任务的自定义在线或离线评测。FlagEval大模型角斗场的推出,不仅提供了简单理解、知识应用、代码能力、推理能力等多种预设问题的评测,还首次引入了主观倾向阶梯评分体系,以更精确地揭示模型性能差异。

该服务采取匿名机制进行评测,确保评测过程的公正性。用户可以通过网页端或国内首个移动端访问入口参与评测,体验高效的模型对战评测。FlagEval大模型角斗场的评分结果将即时公示,形成角斗场榜单,展现各模型的对战能力。

智源研究院表示,将对模型对战评测的全链路数据进行开源,以促进大模型评测生态的发展。FlagEval大模型角斗场的推出,进一步拓展了智源在模型评测领域的技术布局和工具方法的研发,为人工智能领域的研究和应用提供了新的测试和评估工具。

免责声明:本文系网络转载,版权归原作者所有。本文所用图片、文字如涉及作品版权问题,请联系删除!本文内容为原作者观点,并不代表本网站观点。
编辑:刘婧
关键词: AI  大模型  视频模型  FlagEval  BAAI 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。