一元网络论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 86|回复: 0

Gemini exp 1114 LiveBench排名已公布。

[复制链接]

3万

主题

3万

帖子

9万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
96169
发表于 2024-11-17 18:06:08 | 显示全部楼层 |阅读模式
Gemini 1.5 Pro的逻辑能力提升明显,但LiveBench跑分表现一般,略高于40分,逊于Claude 3.5和O1。LiveBench的语言理解评测与Gemini 1.5 Pro的长文本总结能力实际体验不符,我认为其长文本总结能力是其一大优势。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一元网络论坛

GMT+8, 2024-12-26 23:39 , Processed in 0.061230 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表