Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路

Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路

Table Of Contents
Google AI團隊展示Gemini Deep Think模型的藝術創作
Google AI團隊展示Gemini Deep Think模型的藝術創作

今年國際數學奧林匹克競賽(IMO)奪金的背後,藏著Google DeepMind的最新突破。IMO是全球最具影響力的數學競賽之一,此次奪金再次證明了Google DeepMind在人工智能領域的領導地位。這家全球頂尖的人工智能實驗室近日正式推出Gemini Deep Think模型,這款被譽為「先進推理引擎」的AI系統,能同時探索數種思路並最終篩選出最佳答案,其性能在多項國際標準測試中超越OpenAI及xAI等競爭對手。

此模型作為Google首個公開的多代理系統,採用了獨創的強化學習技術,並透過並行運算大幅提升複雜問題的處理效率。例如,在Humanity’s Last Exam(HLE)測試中,Gemini Deep Think未使用工具即取得34.8%的成績,遠超xAI的Grok 4(25.4%)及OpenAI的o3(20.3%)。而在程式設計競技場LiveCodeBench 6的測試中,該模型更以87.6%的表現優於其他對手。

此外,除了技術性能,Google亦指出,該模型能夠自動整合程式碼執行及網頁開發等功能,生成比傳統AI更詳細的回答。在測試中,Gemini Deep Think生成的網站開發方案內容更豐富,視覺效果也更精緻,有望加速學術研究進程。

值得注意的是,多代理系統的高昂運算成本可能促使科技巨頭將其限制在高階訂閱服務內。Google表示,目前僅向月費1950港元(約250美元)的Ultra訂閱用戶開放測試,而xAI及Anthropic等競爭對手亦採取類似策略。

目前,Google正透過Gemini API向學術界及企業開發者擴展測試範圍,並希望收集反饋以優化此系統在學術場景的應用。正如Google在部落格中所言:「Deep Think能協助人們解決需要創造力、策略規劃及逐步優化的問題。」

頂尖AI實驗室的技術趨勢

近年來,多代理系統逐漸成為AI研究的熱門方向。xAI早前推出的Grok 4 Heavy、Anthropic的Research agent等項目,均採用類似的架構。OpenAI研究員Noam Brown更在播客中透露,今年IMO奪金的未公開模型亦屬多代理系統。這一趨勢表明,各大科技公司都在積極開發和應用多代理系統,以提升AI的解決複雜問題的能力。

香港創科界關注技術應用

香港科技園公司(HKSTP)指出,這類AI技術的發展將為本地人工智慧產業注入新動力,特別是多代理系統在學術研究及企業開發中的潛力。然而,專家亦提醒,技術門檻與成本控制仍是推廣的關鍵挑戰。目前,許多本地機構正在積極探索如何應用這些技術,以提升競爭力。

產業觀點:技術與商業的平衡

香港生產力局(HKPC)科技顧問李偉強指出:「多代理AI的突破令人鼓舞,但如何降低使用成本、提升普及性,才是技術落地的關鍵。」他預計未來將有更多本地機構與Google合作探索應用場景。根據最近的一項調查,超過70%的本地企業表示有意引入多代理AI技術,但成本是主要障礙。

中移動香港夥拍有光科技    以人工智能提昇客戶體驗

中移動香港夥拍有光科技 以人工智能提昇客戶體驗

有光科技創辦人溫豪夫:人工智能技術提升客戶服務的效能,帶來了可量化的商業價值和影響。 企業轉型 人工智能的其中一種應用在語音識別、自然語言處理技術,由香港大學衍生的有光科技 (Fano Labs)專 …

了解更多
新常態造就電競行業商機

新常態造就電競行業商機

「數碼娛樂領袖論壇」(DELF) 以「數碼娛樂新常態:從遊戲邁向電競」為主題。 眾創時代 剛過去的「雙12」成為本地電商的網購節日的促銷策略,激發網上購物量飆升;另一邊廂,留家防疫亦為數碼娛樂造就龐 …

了解更多
交通停頓企業變陣   貿發局助轉型升級

交通停頓企業變陣 貿發局助轉型升級

**[企業轉型] [香港貿發局 HKTDC] [O2O]** 美國初創vFairs開發虛擬展覽,今次疫情發揮重大作用,本港兩個園區均以vFairs的「軟件即服務」(SaaS)的雲端服務,舉行年度的招 …

了解更多