vivo自研大模型评分64.4分,接近GPT-4,成绩出色!
发布日期: 2023-08-17 22:42:26 来源: 太平洋科技


(资料图片)

8月16日消息,小米的人工智能大模型MiLM-6B才发布不久,又有一家国内手机厂商的自研大模型面世。

vivo的自研大规模预训练语言模型“vivo_Agent_LM_7B”现身C-Eval,并取得了相当出色的成绩。C-EVAL是中文大语言模型评估基准。

  • 覆盖更广泛的领域。
  • 具有四种不同的难度--特别是C-EVAL HARD基准是中国第一个提供复杂推理问题的基准。
  • 努力减少数据泄漏--作者的问题大多来自模拟考试的PDF或Microsoft Word文件,这些文件由作者进一步处理,而AGIEval和MMCU收集的是中国过去国家考试的确切题目。

    C-EVAL的概览图。不同颜色的主体表示四个难度等级:初中、高中、大学和专业。

    (图源:知乎)

    从C-Eval可以得知,vivo_Agent_LM_7B是由vivo AI全球研究院自主研发的有着70亿参数的大规模预训练语言模型。

    vivo_Agent_LM_7B最终得分为64.4分,位列C-Eval第五名,而且在社会科学领域的多个科目得到了80-90的高分。

    它在总成绩上与排名第二的GPT-4(68.7分)相当接近。

    而vivo_Agent_LM_7B模型大概率最终将被用在vivo的语音助手Jovi中,为用户带来更良好、智能、快捷的使用体验。

    编辑点评:各家厂商都在发展自己家的人工智能大模型,现如今人工智能是另一个时代风口,没有厂商想落后一步,便疯狂地一同追赶。人工智能大模型将丰富手机的智能交互方式,也许是成为系统个性化的另一个核心竞争点。

关键词:

相关文章

  • vivo自研大模型评分64.4分,接近GPT-4,成绩出色!

  • 雷军:高端是小米发展的必由之路,更是生死之战

  • 海外华裔青少年感受郑州商代都城历史文化

  • 科大讯飞2023中报:营收净利下滑,但资产负债表改善【BT财报快闪】

  • 工业富联: 工业富联于今年开始为客户开发并量产英伟达的H100及H

  • 港股异动 | 中国中免(01880)反弹逾4% 近期市内免税政策预期有所增强

  • 天龙八部玩游戏怎么会卡 要怎样解决呢

  • 纵横股份在北京参设新公司,经营范围含AI软件开发

  • 美国推出特斯拉新款Model S标准续航版 售价78490美元

  • 宏达电子:8月16日融资买入387.8万元,融资融券余额2.18亿元

  • 雷军演讲会和小米发布会今晚召开,2部旗舰手机提前曝光

  • 美元对卢布汇率跌破1美元兑换100卢布

  • 联合国:苏丹武装冲突已致超4000人死亡

  • 业内:楼市政策实际效力有待8月显现

  • 波尔山羊的养殖技术

  • 4个“冻”作 美菱这次做对了什么?

  • “高温橙色预警”又来啦!快出伏了,遂宁还要热多久?

  • 比亚迪方程豹及首款技术平台DMO正式发布,新车豹5携家族亮相

  • 大行评级丨大摩:上调民生银行目标价至4.5港元新增为内银板块首

  • 战国王朝怎么吸引流民?战国王朝怎么增加村民人口?

热点图集