阿裡雲推出AI旗艦模型 稱超越DeepSeek-V3
(德國之聲中文網)本周三(1月29日),阿裡雲通義千問旗艦版模型(Qwen 2.5-Max)正式發布。這一發布時間頗不尋常,恰逢中國農歷新年,大多數中國人都在假期中與家人團聚。選在春節期間發布也反映出中國AI初創公司DeepSeek在過去三周的迅猛崛起不僅給海外競爭對手帶來壓力,也讓國內同行壓力倍增。
在其官方微信賬號阿裡雲上發布的公告稱,在知識(測試大學水平知識的MMLU-Pro)、編程(LiveCodeBench)、全面評估綜合能力的(LiveBench)以及人類偏好對齊(Arena-Hard)等六項基准測試中,Qwen2.5-Max比肩Claude-3.5-Sonnet,並幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。”
其中,GPT-4o來自OpenAI,DeepSeek-V3來自深度求索DeepSeek,而Llama-3.1-405B則是Meta推出的最先進開源AI模型。
DeepSeek崛起引發競爭對手加速模型升級
DeepSeek於1月10日發布的DeepSeek人工智能助手由 DeepSeek-V3 模型驅動,並在1月20日推出了R1模型,這一系列舉措震驚硅谷,並導致多家科技公司股價下挫。DeepSeek據稱研發和使用成本都很低,令投資者對美國頭部AI企業的巨額支出計劃產生了質疑。
與此同時,DeepSeek的成功也促使國內競爭對手加緊升級自己的AI模型。
DeepSeek-R1發布兩日後,字節跳動(TikTok母公司)更新了其旗艦AI模型,並聲稱該模型在AIME測試中優於OpenAI(微軟)的o1模型。AIME是一項衡量AI模型理解和響應復雜指令能力的基准測試。
無獨有偶,DeepSeek此前在推出新模型時也是拿ChatGPT的o1模型做比,表示其R1模型在多個性能基准測試中可與o1媲美。
DeepSeek與國內競爭對手的較量
DeepSeek-V3模型的前身DeepSeek-V2,於去年5月發布後,在中國AI行業引發了一場價格戰。
DeepSeek-V2的開源特性和極低的使用成本(每100萬詞元(token,AI模型處理的數據單位)僅1元人民幣,約合0.14美元)迫使阿裡巴巴雲計算部門宣布對其一系列模型降價,最高降幅達97%。隨後,其他中國科技公司也紛紛跟進,包括百度(2023年3月推出了中國首個類似ChatGPT的產品)以及中國市值最高的互聯網公司騰訊(Tencent)。
DeepSeek創始人梁文峰在去年7月罕見接受中國媒體《浪潮》采訪時表示,自己的這間初創公司“並不在乎”價格戰,而是專注於實現通用人工智能(AGI)。
OpenAI將“通用人工智能”定義為“能夠在大多數經濟價值較高的任務領域超越人類的自主系統”。
與阿裡巴巴等擁有數十萬員工的中國科技巨頭不同,DeepSeek更像是一個研究實驗室,主要由中國頂尖大學的年輕畢業生和博士生組成。
梁文峰在采訪中表示,他認為中國的大型科技公司可能並不適應AI行業的未來。他將這些巨頭的高成本以及自上而下的管理模式,與DeepSeek精簡的運營和寬松的管理風格進行了對比。“大型基礎模型需要持續創新,而科技巨頭的能力是有限的。”他說道。
(路透社)
©2025年德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究。
作者: 德聞