蘋果應用商店下載量超越ChatGPT，DeepSeek究竟何方神聖？

德國之聲2025 年 1 月 27 日

Less than a minute

蘋果應用商店下載量超越chatgpt，deepseek究竟何方神聖？ — 蘋果應用商店下載量超越ChatGPT，DeepSeek究竟何方神聖？

（德國之聲中文網）就在特朗普宣布5000億美元投資人工智能領域之際，中國AI初創公司深度求索（DeepSeek）於本周一（1月27日）推出了兩個新的AI語言模型：DeepSeek-R1-Zero和DeepSeek-R1。據公司透露，這些模型在某些基准測試中的表現卓越，性能直接對標OpenAI的o1正式版。而其價格僅為o1的幾十分之一，且以開源形式向全球開發者開放。

與大多數傳統大型語言模型（LLM）不同，DeepSeek-R1采用了一種被稱為“模擬推理”（simulated reasoning）的方法。模擬了類似人類的思維鏈，采用長鏈推理（Chain-of-Thought， CoT）技術，能夠逐步分解復雜問題，並通過多步驟邏輯推理解決問題。這一過程比典型的語言模型耗時更多，但在處理數學、物理和自然科學領域的任務時，能顯著提高結果的准確性。

OpenAI的o1模型是2024年9月推出，是首個采用此種方法的OpenAI模型。

令人矚目的測試成績

DeepSeek通過多種基准測試評估了其模型性能。

在數學測試Aime 2024中，DeepSeek-R1取得了79.8%的成績，略高於OpenAI的79.2%。

在Math-500基准測試中，該模型的准確率達到97.3%，超越了所有其他測試系統。

在編程能力測試SWE-bench Verified中，DeepSeek-R1的得分為49.2%，展現了專家級的編程能力。

在常識測試MMLU和GPQA Diamond中，該模型的准確率分別為90.8%和71.5%。在寫作和問答基准測試AlpacaEval 2.0中，該模型的勝率達到87.6%。

不過，上述測試結果尚未得到獨立驗證，因此必須謹慎解讀。

該模型數據庫使用截至2024年7月的信息進行訓練。與OpenAI當前的模型類似，DeepSeek 還可以根據需要整合來自網絡的更新信息。但其並不具備生成圖像的功能。

開放許可

與硅谷競爭對手開發的專有大語言模型（LLM）不同，DeepSeek是開源的，這意味著任何人都可以訪問其應用程序代碼，了解其工作原理，並自行進行修改。

其推理模型DeepSeek-R1遵循MIT License開源協議，允許用戶自由使用、修改，包括用於商業目的。

“我們正處於一個由非美國公司保持OpenAI最初使命的時代——真正開放的、前沿的研究，賦與所有人權力。”英偉達（Nvidia）高級研究經理Jim Fan在社交平台X上寫道。

DeepSeek表示，它“在開源模型中名列前茅”，並且“可與全球最先進的閉源模型相媲美”。

Scale AI創始人Alexandr Wang在X上寫道，“DeepSeek給美國敲響了警鐘。”

性價比高

DeepSeek-R1的最大版本包含6710億個參數。公司還提供了多個簡化版本，參數範圍從15億到700億不等，其中最小的版本甚至可以在筆記本電腦上運行。

在商業領域，DeepSeek以極具競爭力的價格進入市場。相比OpenAI的o1版本每生成100萬詞元（token）需支付60美元，DeepSeek僅需2.19美元，價格僅為前者的5%。

但有限制

然而，DeepSeek-R1在基礎配置上受到中國特有的限制。根據中國對互聯網服務的規定，人工智能系統需體現“社會主義核心價值觀”。

這就意味著，與百度的“文心一言”（Ernie Bot）等其他中國聊天機器人一樣，DeepSeek對政治敏感話題（如天安門事件或台灣獨立國家地位等）有限制。例如，當被問及中國領導人習近平或北京在新疆的政策時，它會建議“談論其他事情”。

測試中，德語版DeepSeek對相關政治敏感問題提供了類似ChatGPT的詳細回答。然而，當用英語提問時，AI更傾向於轉移話題。

根據ArsTechnica的報道，通過本地部署而非雲端版本運行該系統時，可完全繞過政治過濾功能，這得益於其開源許可模式。

極低的訓練成本

令人驚訝的是，DeepSeek的開發成本遠低於預期。據Jim Fan 稱，DeepSeek用了兩個月時間，花費 558 萬美元訓練了其基礎模型（V3）。與美國科技巨頭在AI領域投入的數十億美元相比，只能算是九牛一毛。
另外，據新浪財經報道，DeepSeek購買了1萬多塊英偉達GPU，隨後又擴大到5萬塊。這與OpenAI、谷歌、Anthropic等領先AI實驗室動輒超過50萬塊GPU相比，投入成本低到驚人。

而分析人士一直認為，美國在生產高性能芯片上的關鍵優勢，以及阻止中國獲取相關技術的能力，將使其在AI競賽領域佔據上風。

隨著DeepSeek的強勢崛起，美國和日本主要科技公司股價紛紛下跌。

芯片制造巨頭英偉達——世界主要人工智能硬件和軟件供應商——上周五在華爾街收盤時下跌超過3%。而日本軟銀公司——該公司是特朗普宣布的一項5000億美元AI基礎設施建設計劃的主要投資者之一——周一股價下跌超過8%。

特朗普的親密顧問、風險投資家馬克·安德森（Marc Andreessen）將其稱為“AI的斯普特尼克時刻”（Sputnik moment），指的是當年蘇聯衛星發射引發美蘇太空競賽。

“DeepSeek R1 是我見過的最令人驚嘆和印象深刻的突破之一，” 安德森在社交平台X（前推特）上寫道。

DeepSeek是誰？

DeepSeek是一家位於中國杭州市的人工智能技術研究初創公司“深度求索”。杭州以科技公司密集而聞名。其開發的程序DeepSeek既可以作為APP使用，也可以在桌面端運行。它能夠完成許多AI助手可以做到的事情，比如編寫歌詞、制定個人發展計劃，甚至根據冰箱裡的食材寫出一份晚餐食譜。

它也可以用多種語言進行交流，但DeepSeek向法新社表示，它在英語和中文上的表現最為出色。

然而，無論是編寫復雜的代碼還是解決困難的數學問題，業內人士對DeepSeek的能力與競爭對手的接近程度感到驚訝。

Alexandr Wang在接受CNBC采訪時表示：“我們發現，DeepSeek是表現最好的，或者至少與最好的美國模型相當。”

中美AI領域競爭加劇

DeepSeek R1的發布正值美國政府加強對中國出口AI技術限制之時。OpenAI等企業已警告稱，中國的模型未來可能追趕甚至超越美國。

北京領導層已誓言到2030年成為人工智能技術的全球領導者，並計劃在未來幾年內投入數百億美元支持該行業。

目前，包括DeepSeek、阿裡巴巴以及Moonshot AI在內的至少三家中國實驗室，已推出據稱可媲美OpenAI o1的模型。

而DeepSeek的成功也表明，中國企業已經開始克服阻礙其成功的障礙。

喬治梅森大學（George Mason University）AI研究員迪恩·鮑爾（Dean Ball）認為，這一趨勢表明，中國開發團隊正在迅速接近前沿技術水平。他特別指出，DeepSeek的小型版本R1能夠在普通家庭電腦上運行，這將有助於推動AI應用的普及與民主化。

“DeepSeek小型模型的卓越性能意味著強大的推理系統會迅速傳播，並能在本地硬件上運行——遠離任何集中監管（包括美國的出口管制）的視線。”

（綜合報道）

作者: 德才

德國之聲2025 年 1 月 27 日

Less than a minute

SEMA
Perpa Kameram | Güvenlik Kameraları gizli kamera, kamera sis...
ERSAGUN
Van Haberleri, Van Haber | Van Sesi Gazetesi Van Olay, Van G...
Marble bath mats
41. Researching marble countertops! Found amazing ideas on [...
muppu
Pretty! This has been a really wonderful post. Many thanks f...
Granite termite-proof foundations
121. Curious about outdoor flooring! Found amazing ideas on...