火報記者 陳銳/報導
人工智能的領域競爭越演越烈,OpenAI再度掀起一波新風潮。新推出的AI模型系列OpenAI o1因其「慢速但深思熟慮」的回應方式引發業界熱議。在追求速度與精準的AI市場,這一逆向思維的創新之舉究竟能否成為新標準。
人工智能領域日新月異,OpenAI這個科技巨頭再次讓人眼前一亮。於美國時間12日,OpenAI推出了全新AI模型系列——OpenAI o1-preview和OpenAI o1-mini。這兩款新型AI不僅在科學研究、編輯工作和數學解題等方面展現了優越的能力,更特別在於它們的回應速度被刻意放慢,模仿人類思考的過程,為求更高的回答準確性。
OpenAI解釋道,新系列模型在經過反覆訓練後,學會了如何在回應問題之前,進行更長時間的深思熟慮。「這種訓練方式使AI模型能夠像人類一樣,針對問題進行多角度的思考與策略嘗試,甚至認識並糾正自己的錯誤,從而提升整體表現。」目前,OpenAI o1-preview設有每週30個訊息的速率限制,而OpenAI o1-mini則限制在每週50個訊息。
在這種深度訓練的背景下,OpenAI o1-preview在物理、化學和生物學等具挑戰性的基準測試中的表現被評為媲美博士生水平。在許多需要高度推理能力的測試中,它更是達到了與人類專家比肩的表現。此外,數學和編程方面的表現同樣優異,尤其是在國際數學奧林匹克(IMO)資格考試中,OpenAI o1-preview的正確率驚人地達到83%,相比之下,上一代GPT-4o僅能正確解決13%的問題。
而OpenAI o1-mini則因其針對編碼任務的優化,具有更快的回應速度和更高的性價比。OpenAI將其定位為「需要推理能力,但不需要廣泛世界知識的高效模型」,並且其價格僅為OpenAI o1-preview的20%。這樣的設計令其成為成本敏感用戶的不二之選。
然而,儘管新系列模型在許多方面取得了突破性進展,但《The Verge》報道指出,OpenAI o1系列仍未能完全解決AI模型常見的幻覺(hallucination)問題。對此,OpenAI研究負責人Jerry Tworek解釋說,新模型的訓練方法與前代截然不同,採用了全新的最佳化演算法和專為此設計的訓練數據集。他強調:「新模型的幻覺現象確實減少了,但我們並不敢保證這個問題已被完全解決。」
隨著AI技術的持續進步,OpenAI的這一系列創新舉措無疑將成為未來數位技術變革的重要一環。是「慢速深思」的新策略,還是未來AI發展的新方向?市場和用戶的反饋將是最好的答案。