尤物在线-97中文字幕-美女性生活-天天干狠狠干-国产中文视频-久久久久久久久国产精品-国产中文字幕视频-一寸一寸挺进她的身体-亚洲最大的成人网-国产香蕉网-黄色网址你懂的-日美毛片-久久机-色网站免费观看-亚洲女人在线-超碰9999-在线网站你懂得-苍老师诊所电影完整版观看-欧美色乱-不卡国产视频-亚洲精品20p-亚洲欧美日韩另类在线-自拍偷拍2019-长篇高h乱肉辣文-欧美风骚少妇-成人av蜜桃-国产野外野战小树林18视频-色婷婷综合久久久久中文字幕-欧美自拍偷拍区-久热草在线

當前位置: 首頁 > 體育 > 電競

騰訊研發全新TiG框架:可用AI玩王者榮耀讓AI模型學會戰略性思考

2025-10-04 21:11:59
電競資訊10月4日稱 據 decoder 今天報道,騰訊研究人員最近用《王者榮耀》游戲作為訓練平臺,探索如何讓AI在游戲中學會“戰略性思考”,研究全新 TiG(Think in Games)框架,相關成果已發表于 Hugging Face 平臺和 arXiv 期刊

研究團隊指出,目前的 AI 模型存在明顯的功能鴻溝,以游戲為取向的 AI 能正常游玩但無法理解自己所做的決策,而語言模型雖然可以推理策略但很難真正執行操作,為此他們研發了全新 TiG 框架,讓模型在游戲中同步思考、行動。

undefined

團隊選擇以《王者榮耀》游戲作為訓練范本,先使用匿名且標準化的賽事數據定義推上路、擊殺暴君、守家等 40 種宏觀行動,勝負回數均衡,AI 模型們必須要在每個定義好的場景下選擇最佳策略,并解釋其戰略緣由。

undefined

具體來說,訓練分為兩個階段,首先是在監督中學習,弄清楚這些策略的基本機制;隨后通過獎勵機制進行強化學習,如果行動正確能得 1 分,錯誤行動則得 0 分。

undefined

隨后團隊測試了多種語言模型,涵蓋 Qwen2.5(7B、14B、32B)、Qwen3-14B 模型,并使用 DeepSeek-R1 大模型作為對照組;先從 DeepSeek-R1 提煉高質量訓練數據,然后使用群體相對策略優化(GRPO)技術比較不同策略之間的優劣

undefined

最終經過 TiG 框架訓練的模型不僅能制定行動計劃還能解釋原因,例如 AI 會指出某個防御塔防守薄弱,是理想的進攻目標,但需要注意埋伏的敵人。模型訓練后仍保持原有的文本理解、數學推理與問答能力。

undefined

最終測試結果如下:

  • 對照組 DeepSeek-R1:決策準確率達 86.67%

  • Qwen3-14B:決策準確率達 90.91%,超越 DeepSeek-R1
  • Qwen2.5-32B :準確率從 66.67% 提升至 86.84%
  • Qwen2.5-14B:準確率從 53.25% 提升至 83.12%
  • 主站蜘蛛池模板: 免费看裸体网站视频 | 国精产品一区一区三区有限公司杨 | 精品少妇人妻一区二区黑料社区 | 午夜视频在线免费观看 | 青青草原亚洲 | 爱情交叉点 | 3d极乐宝鉴国语版观看 | 欧美午夜精品 | 国产麻豆视频 | 日韩小视频 | 91成人在线观看国产 | 日韩在线一区二区三区 | 久久久久久av | 久久激情视频 | 五个姿势夹到男人爽 | 麻豆精品久久久久久久99蜜桃 | 99国产精品99久久久久久 | 日韩小视频 | 午夜精品久久久久久久99老熟妇 | 日韩一区二区在线观看 | 国精产品一区二区 | 欧美伦理片 | 蜜乳av红桃嫩久久 | 四虎av| 久久精品99久久久久久久久 | 久久福利 | 福利视频一区二区 | 大波大乳videos巨大 | 美女被草| 五月天激情小说 | 国产精品美女高潮无套 | 91日韩 | 无码人妻一区二区三区免费n鬼沢 | 久久久久久av | 男人勃起又大又硬图片 | 亚洲精品一区二区 | 久草免费在线视频 | 亚洲一区二区三区 | 免费av网站| 插曲免费高清在线观看 | 久久精品影视 | 国产欧美日韩在线 | 蜜桃av色偷偷av老熟女 | av入口 | 日韩中文字幕在线 | 男女做爰猛烈高潮描写 | 麻豆传媒在线 | 老司机免费视频 |