您的當前位置:首頁 > 熱點 > Gemini 3中文測評結(jié)果發(fā)布:首超GPT 正文
時間:2025-11-22 07:47:48 來源:網(wǎng)絡整理 編輯:熱點
11月19日消息,2025年末全球AI競技場再掀波瀾,測評機構(gòu)SuperCLUE最新報告顯示:谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基準測評中獲得了70.80
11月19日消息,中文2025年末全球AI競技場再掀波瀾,測評測評機構(gòu)SuperCLUE最新報告顯示:谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基準測評中獲得了70.80的結(jié)果總分。
它超越 GPT-5(high) 1.43 分,發(fā)布較GPT-5.1(high)落后1.71分,首超位居全球第二。中文Gemini-2.5-Pro目前排名全球第七。測評
Gemini-3-Pro-Preview的結(jié)果推理效率相較于Gemini-2.5-Pro有些許提升,從平均每題花費32.2秒降低到31.9秒。發(fā)布推理成本從24.5元/百萬Tokens上升到32.0元/百萬Tokens。首超
據(jù)了解,中文本次測評覆蓋六大核心維度,測評數(shù)學推理、結(jié)果科學推理、發(fā)布代碼生成(含web開發(fā))、首超智能體Agent(多輪工具調(diào)用)、幻覺控制、精確指令遵循。
與GPT-5.1(high)相比,Gemini-3-Pro-Preview的優(yōu)勢集中體現(xiàn)在幻覺控制,科學推理旗鼓相當,而在其他四個方面全面落敗。
2025金搖桿獎榜單出爐 AMD銳龍9 9950X3D斬獲最佳游戲硬件獎2025-11-22 07:46
(粵港澳全運會)乒乓球成年組首金出爐 林高遠/劉詩雯混雙奪冠2025-11-22 07:39
國內(nèi)外乒乓球愛好者樂聚南京 “為愛益起乒”2025-11-22 07:26
(粵港澳全運會)全運會“拳力”收官:十三金見證中國拳擊傳承之力2025-11-22 07:15
退休五年后,公安廳老廳長被查2025-11-22 07:06
(粵港澳全運會)港澳青年運動員體驗別樣全運會2025-11-22 06:52
電力供需矛盾加深 臺灣輿論再度呼吁重啟核電2025-11-22 06:21
白嫖新套路!女子買千元羽絨服退貨收件人填自己:想坑快遞員2025-11-22 05:39
(粵港澳全運會)廣東隊選手吳瑞庭奪得十五運會男子三級跳遠金牌2025-11-22 05:39
和它斗智斗勇一下午省了30塊 但我紅溫了2025-11-22 05:24
魯大師認證加持 天籟·鴻蒙座艙寫下燃油車智能化的翻身故事2025-11-22 07:33
騰訊洪丹毅:跨境需求持續(xù)增長,騰訊保持開放做“連接器”2025-11-22 07:27
17是個好名字!iPhone 17/小米17系列都大獲成功:首月銷量大漲超20%2025-11-22 06:58
2025全場景相機推薦:佳能R50V漫展、旅拍、美食、車展全覆蓋2025-11-22 06:26
重返月球太難!美國登月計劃或又拖一年2025-11-22 06:13
“館”通灣區(qū)丨中國網(wǎng)球新秀集結(jié)!十五運橫琴智能球場細節(jié)拉滿2025-11-22 05:33
(粵港澳全運會)綜合消息:潘展樂捍衛(wèi)榮譽 香港七橄隊摘金2025-11-22 05:22
高德揭秘:鷹眼守護預警和車道級安全預警有啥區(qū)別2025-11-22 05:19
谷歌出手 安卓能向iPhone快速傳文件2025-11-22 05:16
臺灣專家:文化旅游交流是跨越隔閡關鍵路徑2025-11-22 05:16