vivo自研大模型评分64.4分,接近GPT-4,成绩出色!
2023-08-17 11:31:11
来源:
腾讯网
(资料图)
vivo自研大模型评分64.4分,接近GPT-4,成绩出色!
8月16日消息,小米的人工智能大模型MiLM-6B才发布不久,又有一家国内手机厂商的自研大模型面世。
vivo的自研大规模预训练语言模型“vivo_Agent_LM_7B”现身C-Eval,并取得了相当出色的成绩。C-EVAL是中文大语言模型评估基准。
覆盖更广泛的领域。具有四种不同的难度--特别是C-EVAL HARD基准是中国第一个提供复杂推理问题的基准。努力减少数据泄漏--作者的问题大多来自模拟考试的PDF或Microsoft Word文件,这些文件由作者进一步处理,而AGIEval和MMCU收集的是中国过去国家考试的确切题目。
C-EVAL的概览图。不同颜色的主体表示四个难度等级:初中、高中、大学和专业。
(图源:知乎)
从C-Eval可以得知,vivo_Agent_LM_7B是由vivo AI全球研究院自主研发的有着70亿参数的大规模预训练语言模型。
vivo_Agent_LM_7B最终得分为64.4分,位列C-Eval第五名,而且在社会科学领域的多个科目得到了80-90的高分。
它在总成绩上与排名第二的GPT-4(68.7分)相当接近。
而vivo_Agent_LM_7B模型大概率最终将被用在vivo的语音助手Jovi中,为用户带来更良好、智能、快捷的使用体验。
编辑点评:各家厂商都在发展自己家的人工智能大模型,现如今人工智能是另一个时代风口,没有厂商想落后一步,便疯狂地一同追赶。人工智能大模型将丰富手机的智能交互方式,也许是成为系统个性化的另一个核心竞争点。
关键词:
[责任编辑:HY002]
相关内容
- vivo自研大模型评分64.4分,接近GPT-4,成绩出色!
- 脑袋瓜真活!庆祝队内6人参加世界杯,路易斯维尔竞技推出纪念T恤
- 多只基金出现大额赎回
- 南昌中心城区将加推3宗宅地 合计135.83亩
- 新研究:经常说谎身体会变差!心理专家解析谎言四大成因
- 湖北省招办进行2023年高职高专普通批投档
- 平潭发展控股股东山田实业质押2000万股 用于为他人融资担保
- 美媒关注:中国乡村体育展现民众巨大热情
- 仙坛股份:接受富国基金等机构调研
- 贵州移动5G网络全程护航贵南高铁信号满格
- 《博德之门3》新补丁将包含1000多项修复和调整
- 【贝恩】未来中国富有潜力的八大经济模式
- 文化行业概念利好哪些股票?(2023/8/16)
- 湖南中烟与广铁集团、中铁快运深化战略合作
- 二手交易平台乱象调查 虚拟商品遭遇卷卡失踪骗局
- 四川8所高校入围全球前1000名
- 金属短缺引发电动汽车转型放缓担忧
- 国家电投阜新发电:开展警示教育 筑牢重点领域廉洁防线
- 談談解放神學——起源·下
- 2023年暑期档共4部影片票房突破20亿,创影史暑期档新高