首个高考全卷评测结果发布阿里通义模型排名第一
科普
6月19日,上海人工智能实验室发布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。图源/采访对象提供(下同)上海人工智能实验室公众号文章介绍,高考覆盖各类学科及题型,这一面向人类设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。2024年全国高考甫一结束,上海人工智能实验室的司南评测体系OpenCompass就选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。因无法确定闭源…
时间:2024年07月17日  |  阅读:504
关于 我们
免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢! 沪ICP备2023034384号-10
免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢! RSS订阅本站最新文章 沪ICP备2023034384号-10 网站地图