國際

蘋果應用商店下載量超越ChatGPT,DeepSeek究竟何方神聖?

(德國之聲中文網)就在特朗普宣布5000億美元投資人工智能領域之際,中國AI初創公司深度求索(DeepSeek)於本周一(1月27日)推出了兩個新的AI語言模型:DeepSeek-R1-Zero和DeepSeek-R1。據公司透露,這些模型在某些基准測試中的表現卓越,性能直接對標OpenAI的o1正式版。而其價格僅為o1的幾十分之一,且以開源形式向全球開發者開放。

與大多數傳統大型語言模型(LLM)不同,DeepSeek-R1采用了一種被稱為“模擬推理”(simulated reasoning)的方法。模擬了類似人類的思維鏈,采用長鏈推理(Chain-of-Thought, CoT)技術,能夠逐步分解復雜問題,並通過多步驟邏輯推理解決問題。這一過程比典型的語言模型耗時更多,但在處理數學、物理和自然科學領域的任務時,能顯著提高結果的准確性。

OpenAI的o1模型是2024年9月推出,是首個采用此種方法的OpenAI模型。

令人矚目的測試成績

DeepSeek通過多種基准測試評估了其模型性能。

在數學測試Aime 2024中,DeepSeek-R1取得了79.8%的成績,略高於OpenAI的79.2%。

在Math-500基准測試中,該模型的准確率達到97.3%,超越了所有其他測試系統。

在編程能力測試SWE-bench Verified中,DeepSeek-R1的得分為49.2%,展現了專家級的編程能力。

在常識測試MMLU和GPQA Diamond中,該模型的准確率分別為90.8%和71.5%。在寫作和問答基准測試AlpacaEval 2.0中,該模型的勝率達到87.6%。

不過,上述測試結果尚未得到獨立驗證,因此必須謹慎解讀。

該模型數據庫使用截至2024年7月的信息進行訓練。與OpenAI當前的模型類似,DeepSeek 還可以根據需要整合來自網絡的更新信息。但其並不具備生成圖像的功能。

開放許可

與硅谷競爭對手開發的專有大語言模型(LLM)不同,DeepSeek是開源的,這意味著任何人都可以訪問其應用程序代碼,了解其工作原理,並自行進行修改。

其推理模型DeepSeek-R1遵循MIT License開源協議,允許用戶自由使用、修改,包括用於商業目的。

“我們正處於一個由非美國公司保持OpenAI最初使命的時代——真正開放的、前沿的研究,賦與所有人權力。”英偉達(Nvidia)高級研究經理Jim Fan在社交平台X上寫道。

DeepSeek表示,它“在開源模型中名列前茅”,並且“可與全球最先進的閉源模型相媲美”。

Scale AI創始人Alexandr Wang在X上寫道,“DeepSeek給美國敲響了警鐘。”

性價比高

DeepSeek-R1的最大版本包含6710億個參數。公司還提供了多個簡化版本,參數範圍從15億到700億不等,其中最小的版本甚至可以在筆記本電腦上運行。

在商業領域,DeepSeek以極具競爭力的價格進入市場。相比OpenAI的o1版本每生成100萬詞元(token)需支付60美元,DeepSeek僅需2.19美元,價格僅為前者的5%。

但有限制

然而,DeepSeek-R1在基礎配置上受到中國特有的限制。根據中國對互聯網服務的規定,人工智能系統需體現“社會主義核心價值觀”。

這就意味著,與百度的“文心一言”(Ernie Bot)等其他中國聊天機器人一樣,DeepSeek對政治敏感話題(如天安門事件或台灣獨立國家地位等)有限制。例如,當被問及中國領導人習近平或北京在新疆的政策時,它會建議“談論其他事情”。

測試中,德語版DeepSeek對相關政治敏感問題提供了類似ChatGPT的詳細回答。然而,當用英語提問時,AI更傾向於轉移話題。

根據ArsTechnica的報道,通過本地部署而非雲端版本運行該系統時,可完全繞過政治過濾功能,這得益於其開源許可模式。

極低的訓練成本

令人驚訝的是,DeepSeek的開發成本遠低於預期。據Jim Fan 稱,DeepSeek用了兩個月時間,花費 558 萬美元訓練了其基礎模型(V3)。與美國科技巨頭在AI領域投入的數十億美元相比,只能算是九牛一毛。
另外,據新浪財經報道,DeepSeek購買了1萬多塊英偉達GPU,隨後又擴大到5萬塊。這與OpenAI、谷歌、Anthropic等領先AI實驗室動輒超過50萬塊GPU相比,投入成本低到驚人。

而分析人士一直認為,美國在生產高性能芯片上的關鍵優勢,以及阻止中國獲取相關技術的能力,將使其在AI競賽領域佔據上風。

隨著DeepSeek的強勢崛起,美國和日本主要科技公司股價紛紛下跌。

芯片制造巨頭英偉達——世界主要人工智能硬件和軟件供應商——上周五在華爾街收盤時下跌超過3%。而日本軟銀公司——該公司是特朗普宣布的一項5000億美元AI基礎設施建設計劃的主要投資者之一——周一股價下跌超過8%。

特朗普的親密顧問、風險投資家馬克·安德森(Marc Andreessen)將其稱為“AI的斯普特尼克時刻”(Sputnik moment),指的是當年蘇聯衛星發射引發美蘇太空競賽。

“DeepSeek R1 是我見過的最令人驚嘆和印象深刻的突破之一,” 安德森在社交平台X(前推特)上寫道。

DeepSeek是誰?

DeepSeek是一家位於中國杭州市的人工智能技術研究初創公司“深度求索”。杭州以科技公司密集而聞名。其開發的程序DeepSeek既可以作為APP使用,也可以在桌面端運行。它能夠完成許多AI助手可以做到的事情,比如編寫歌詞、制定個人發展計劃,甚至根據冰箱裡的食材寫出一份晚餐食譜。

它也可以用多種語言進行交流,但DeepSeek向法新社表示,它在英語和中文上的表現最為出色。

然而,無論是編寫復雜的代碼還是解決困難的數學問題,業內人士對DeepSeek的能力與競爭對手的接近程度感到驚訝。

Alexandr Wang在接受CNBC采訪時表示:“我們發現,DeepSeek是表現最好的,或者至少與最好的美國模型相當。”

中美AI領域競爭加劇

DeepSeek R1的發布正值美國政府加強對中國出口AI技術限制之時。OpenAI等企業已警告稱,中國的模型未來可能追趕甚至超越美國。

北京領導層已誓言到2030年成為人工智能技術的全球領導者,並計劃在未來幾年內投入數百億美元支持該行業。

目前,包括DeepSeek、阿裡巴巴以及Moonshot AI在內的至少三家中國實驗室,已推出據稱可媲美OpenAI o1的模型。

而DeepSeek的成功也表明,中國企業已經開始克服阻礙其成功的障礙。

喬治梅森大學(George Mason University)AI研究員迪恩·鮑爾 (Dean Ball)認為,這一趨勢表明,中國開發團隊正在迅速接近前沿技術水平。他特別指出,DeepSeek的小型版本R1能夠在普通家庭電腦上運行,這將有助於推動AI應用的普及與民主化。

“DeepSeek小型模型的卓越性能意味著強大的推理系統會迅速傳播,並能在本地硬件上運行——遠離任何集中監管(包括美國的出口管制)的視線。”

(綜合報道)

© 2025年 德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究。

作者: 德才

相關文章