根据智源研究院官方公众号,FlagEval天秤大模型评测平台于6月9日上线以来,发布一个月内已收到200+模型评测申请,并更新了首期SFT模型排行榜和大模型2023高考排行榜。近日,FlagEval大模型评测新增了多个开源基座模型和有监督微调模型评测。

在基座模型评测中,LLaMA-30B、GLM-130B分别摘得第一、第二名。悟道·天鹰Aquila-7B接近LLaMA-7B水平,但仍有微小的差距。

FlagEval大模型评测平台7月榜单公布

在微调模型榜单中,悟道·天鹰AquilaChat-7B、Alpaca-7B、Ziya-LLaMA-13B位列前三。

FlagEval大模型评测平台7月榜单公布