
Google 今天宣布推出具備推理能力的 Gemini 2.5 版本。
在 NVIDIA 今年舉辦的 GTC 大會中,能夠結合背景、分析資訊、做出合乎邏輯決策的推理 AI(Reasoning AI)已經成為 AI 最新的發展趨勢,而 Google 今天則是宣布在旗下 Gemini AI 產品中,透過強化學習、思路鍊提示等技術,並且在增強基礎模型與改良後期訓練後,推出最新的 Gemini 2.5 版本,可處理更複雜的問題,並且支援功能更強大、具備情境感知能力的 AI 代理(agent)。

而 Google 同時也公布了 Gemini 2.5 在各項基礎測試中的分數表現,包括在衡量人類偏好的LMArena 排行榜具備優勢,並且也展現出優異的推理與 Coding 效能,在常用的程式產生、數學和科學基準測試中具有領先效能,並且產出的結果具有相當高的品質。

Google 官方公布的 Gemini 2.5 在各項測試中的效能表現以及與其他 AI 服務的比較。(點擊可看大圖)。

Gemini 2.5 在 GPQA 和 AIME 2025 等數學和科學基準測試中的測試表現。
另外 Googlle 也展示了 Gemini 2.5 在程式撰寫部分的效能表現,官方表示 Gemini 2.5 在這部分比起 2.0 版本有相當大的提升,未來也將持續進步。在測試效能表現上, Gemini 2.5 Pro 在代理程式碼評估的測試標準 SWE-Bench Verified 上,透過自訂代理設定獲得了 63.8% 的得分,而在實際應用中,Gemini 2.5 Pro 也在 Web 應用程式和代理程式碼應用程序,以及程式碼轉換和編輯上有相當不錯的表現,以下是 Gemini 2.5 Pro 如何利用其推理能力透過從單行提示產生可執行程式碼來創建視訊遊戲的示範影片:
Gemini 2.5 Pro 目前已經在 Google AI Studio 和 Gemini 應用程式中針對 Gemini Advanced 用戶推出,開發人員和企業現在可以在 Google AI Studio 中開始試用 Gemini 2.5 Pro ,而 Gemini Advanced 用戶可以在桌面和行動裝置上的模型下拉選單中選擇使用,至於定價部分 Google 官方表示將在未來幾週公布 Gemini 2.5 Pro 的使用價格。