您現(xiàn)在的位置是:知識 >>正文
騰訊混元2.0正式發(fā)布:推理能力/效率業(yè)界領先
知識8657人已圍觀
簡介12月6日消息,騰訊自研大模型混元2.0Tencent HY 2.0)正式發(fā)布,同時DeepSeek V3.2也在騰訊生態(tài)內逐步接入。目前,這兩大模型已率先在元寶、ima等騰訊AI原生應用中上線,騰訊 ...
12月6日消息,騰訊推理騰訊自研大模型混元2.0(Tencent HY 2.0)正式發(fā)布,混元同時DeepSeek V3.2也在騰訊生態(tài)內逐步接入。正式
目前,發(fā)布這兩大模型已率先在元寶、效率ima等騰訊AI原生應用中上線,業(yè)界騰訊云也已開放相關模型的領先API及平臺服務。
全新發(fā)布的騰訊推理Tencent HY 2.0,采用了混合專家(MoE)架構,混元具備高達406B總參數(shù)量(激活參數(shù)32B),正式模型支持256K超長上下文窗口,發(fā)布推理能力和效率處于業(yè)界領先地位。效率
相比上一版本(Hunyuan-T1-20250822)模型,業(yè)界HY 2.0 Think顯著改進了預訓練數(shù)據(jù)和強化學習策略,領先在數(shù)學、騰訊推理科學、代碼、指令遵循等復雜推理場景的綜合表現(xiàn)穩(wěn)居國內第一梯隊,泛化性大幅提升。
數(shù)學科學知識推理:使用高質量數(shù)據(jù)進行Large Rollout強化學習,使得HY 2.0 Think推理能力大幅增強,在國際數(shù)學奧林匹克競賽(IMO-AnswerBench)和哈佛MIT數(shù)學競賽(HMMT2025)等權威測試中取得一流成績。結合預訓練數(shù)據(jù)的進步,模型在極度考驗知識水平的Humanity’s Last Exam(HLE)和泛化性的ARC AGI等任務上也大幅進步。
指令遵循與長文多輪能力:通過重要性采樣修正緩解了訓練和推理不一致問題,實現(xiàn)了長窗口RL的高效穩(wěn)定訓練。同時通過多樣化可驗證的任務沙盒,以及基于打分準則的強化學習,顯著提升了HY 2.0 Think在Multi Challenge等指令遵循和多輪任務的效果。
代碼與智能體能力:構建了規(guī)模化的可驗證環(huán)境及高質量合成數(shù)據(jù),極大增強了模型在Agentic Coding及復雜工具調用場景下的落地能力,在SWE-bench Verified及Tau2-Bench等面向真實應用場景的智能體任務上實現(xiàn)了躍升。
基于RLVR+RLHF雙階段的強化學習策略,HY 2.0的輸出“質感”顯著進步,在文本創(chuàng)作、前端開發(fā)、指令遵循等實用場景上展現(xiàn)了差異化優(yōu)勢。
在文學創(chuàng)作上,HY 2.0有效減少了“AI味”,可以敏銳捕捉指令中的潛在的情感需求,輸出觀點深刻、邏輯嚴密的文章。
Tencent HY 2.0模型具備扎實的代碼能力和一定的“視覺審美”,在生成Web小游戲時,不僅能跑通復雜的JS邏輯,還能輸出審美在線的CSS布局與動畫效果。
Tags:
相關文章
支付寶碰一下發(fā)布“碰e計劃” 助力展會行業(yè)數(shù)字化升級
知識2025年12月16日,支付寶碰一下正式發(fā)布“碰e計劃”,向展會行業(yè)生態(tài)服務商全面開放核心能力。在當前會展經濟蓬勃發(fā)展的背景下,“碰e計劃”圍繞用戶體驗 ...
【知識】
閱讀更多湖南衛(wèi)健委通報“省人民醫(yī)院祖某某、曾某生活作風問題”:情況基本屬實
知識中新網(wǎng)長沙11月6日電 (記者 徐志雄)11月6日,湖南省衛(wèi)生健康委員會發(fā)布情況通報,確認網(wǎng)傳湖南省人民醫(yī)院祖某某、曾某生活作風問題情況基本屬實。目前,湖南省衛(wèi)生健康委員會已對涉事人員暫停職務進行調查 ...
【知識】
閱讀更多AI是優(yōu)秀的“作者”,寫的論文很優(yōu)質?丨中新真探
知識中新網(wǎng)11月7日電 目前的生成式AI確實能寫出看似流暢的文本,但其本質上只是對訓練數(shù)據(jù)的模仿和重組,它并不具備人類科學家的思考力和創(chuàng)造力,很難寫出有學術價值的論文。而且AI在生成內容的時候可能出現(xiàn)“A ...
【知識】
閱讀更多