(相关资料图)
快科技8月11日消息,近日,小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。
截至本文成稿,MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,在CMMLU中文向大模型排名第1。
根据C-Eval给出的信息,MiLM-6B模型在各个测试科目中的平均成绩如下:
具体各科目成绩上,在STEM(科学、技术、工程和数学教育)全部20个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。
而在10个社会科学科目中,该模型在教育学和地理外的所有科目,都获得了较为理想的准确率。
人文科学的11个科目中,MiLM-6B则在历史与法律基础上有着不错的准确率表现。
可以看出,MiLM-6B模型目前已经在大多数科目中表现出了相对良好的准确度,但在诸如法学、数学、编程、概率论、离散数学等科目上的表现依旧有明显进步空间。
快科技延展阅读:
根据GitHub项目页给出的信息,MiLM-6B是由小米开发的一个大规模预训练语言模型,参数规模为64亿。
责任编辑:
关键词:
相关文章
-
小米大语言模型MiLM-6B首次现身!同参数量级排名第一
-
我国将全面推进矿业权竞争性出让
-
坚守一线 全程护航郑东新区市场监督管理局全力保障啤酒节食品安
-
周期配置实盘账户展示0811:0.894
-
本周全国碳市场碳排放配额总成交量超83万吨
-
我有一个舅舅,他经常在外地出差,听说他在一次运输货物的过程之
-
光盘cd和dvd有什么区别(CD 光盘和DVD光盘有何区别)
-
既有互动也涨知识!这里的爱心暑托班里来了一群“毛孩子”
-
临武二中老宿舍问题
-
权威报告:全球月均温首次升温超1.5℃,突破危险临界点
-
瞒天过海:美人计(百度云)
-
安徽省郎溪县举办职工工间操比赛
-
校企联手致力激光产业 清华大学-深圳创鑫激光先进制造联合研究
-
60年来我国援阿医疗队累计诊治患者2700多万人次
-
郑东新区豫兴路办事处开展建筑工地安全生产大检查暨电焊违规作业
-
以楼宇更新促产业迭代!市南区启动楼宇经济提质“三年行动”
-
黄色的蜜瓜叫什么瓜?
-
友车科技:8月10日融券卖出2.53万股,融资融券余额3520.42万元
-
“海联金桥·促五区共兴”港澳台侨企业家走进四川甘孜
-
贵州仁怀:用好考核指挥棒 激发干事精气神
热点图集
-
1oppo手机左上角有个hd怎么关(oppo手机左上角显示hd是什么意思)
-
2索尼宣布停止公开PS+人数 将转而公布PC平台销售额
-
3杭州亚运会正式发布“亚运元宇宙”
-
4济南有家长一年花五万给孩子“报班” 专家:别跟风,给孩子留点思考时间
-
5清洁工被碾身亡案司机获国家赔偿 不分青红皂白被羁押366天无罪释放!?
-
6REITS基金二季报总结与展望:业绩好转支撑REITS基金二级市场行情修复
-
7Realme 11 5G 和 Realme 11X 5G 即将在印度推出
-
8吵架拘留会留案底吗
-
9讯飞智能办公本X3首发体验 效率工具or私人助理?
-
10湖南疾控:洪涝灾害发生后这样保证饮用水安全