國際

DeepSeek用「蒸餾術」構建OpenAI競爭模型?專家:很難制止

(德國之聲中文網)中國AI大模型初創公司DeepSeek(深度求索)1月20日免費開源的一款 DeepSeek-R1推理模型震驚了科技界和政界。該公司稱這款新的AI模型性能足以媲美美國頂尖產品,但投資成本卻低得多——僅557.6萬美元,是OpenAI GPT-4o模型訓練成本的不到十分之一。該公司還稱,它使用是芯片是英偉達相對低端的芯片及其他低端進口芯片。

DeepSeek的這款AI聊天應用迅速登頂蘋果中國和美國應用商店免費APP下載排行榜,同時引發市場對美國在AI領域競爭力的擔憂、對美國企業投入天量資金研發AI合理性及這些公司發展前景的質疑,以及對美國對中國的芯片出口管制究竟有沒有效的質疑,令美國科技公司股價大幅下挫。美國總統特朗普形容DeepSeek為美國業界“敲響警鐘”,並提醒美國要“全力專注於在競爭之中取勝”。

對DeepSeek成本與芯片的質疑

不過,在一些媒體和專家把DeepSeek的“橫空出世”稱為AI界的“史普尼克時刻”之際,也有聲音質疑DeepSeek所公布的開發成本以及所用芯片的規格與數量。

上周,美國人工智能數據服務公司Scale AI首席執行官汪滔 (Alexandr Wang) 在接受 CNBC 采訪時對 DeepSeek的說法表示懷疑,稱“這款產品的背後,可能使用了數萬顆Nvidia(英偉達)的H100芯片”。他說,“DeepSeek顯然擁有50,000顆H100芯片,但他們顯然不能公開這些信息,因為那會違反美國的出口管制。”汪滔沒有為他的說法提供證據。

億萬富翁埃隆·馬斯克支持對DeepSeek持懷疑態度的人。他在X上有關亞歷山大·王上述說法的帖子下跟帖寫道:“顯然”(Obviously)。

英偉達(Nvidia)的H100芯片是目前市場上最先進的AI訓練芯片之一,但根據美國政府的出口管制政策,H100芯片是不能向中國公司銷售的。

DeepSeek蒸餾提煉違反OpenAI條款?

DeepSeek也被一些技術專家懷疑其模型可能從美國先進的模型中學習到了部分成果,即采用了所謂的“蒸餾技術”。該技術是指通過從更成熟、更強大的人工智能模型中提煉數據來訓練新的AI模型,由舊模型評估新模型得出的答案的質量,從而有效地轉移舊模型所掌握的學習成果。這意味著新模型可以從舊模型中獲益,而無需承擔構建舊模型所投入的大量時間、算力等成本。

1月29日,OpenAI稱,發現有證據表明DeepSeek使用OpenAI的專有模型來訓練自己的模型,並暗示這可能違反了OpenAI的服務條款。不過,OpenAI沒有進一步列舉掌握了哪些證據。OpenAI的服務條款規定,用戶可以使用OpenAI的API輸出接口將其AI技術與自己的應用程序相結合,但禁止用戶“復制”其任何服務或“使用其輸出來開發與OpenAI競爭的模型”。用蒸餾輸出構建競爭模型涉嫌違反 OpenAI服務條款。OpenAI表示,它將與美國政府合作保護美國技術,但沒有詳細說明如何合作。

美國商務部長提名人誓言要實施限制

特朗普總統提名的商務部長霍華德·盧特尼克 (Howard Lutnick) 1月29日在在參議院的確認聽證會上表示,DeepSeek似乎盜用了美國的人工智能技術,並誓言要加強限制。他說,““我認為他們(中國)只關心自己,並試圖傷害我們。因此,我們需要保護自己。”盧特尼克還表示:”我們必須停止幫助他們(中國公司)。Meta的開放平台讓DeepSeek可以依靠。他們購買了大量英偉達的芯片,並找到了繞過(美國相關限制)的方法,推動了他們的DeepSeek模式。這一切必須結束。如果他們要與我們競爭,那就讓他們競爭,但不要再利用我們的工具與我們競爭了。”

白宮的人工智能和加密沙皇大衛·薩克斯 (David Sacks) 也在周二接受福克斯新聞采訪時對 DeepSeek的模型蒸餾表示擔憂。

專家:阻止“蒸餾”非常困難

技術專家表示,阻止模型蒸餾可能非常困難,甚至不可能。

人工智能計算公司Groq的首席執行官喬納森·羅斯 (Jonathan Ross) 表示,該公司已采取措施阻止所有中國IP地址訪問其雲端存儲,以阻止中國公司利用其托管存儲的人工智能模型。但是,“這是不夠的,因為人們可以找到繞過它的方法”,羅斯說。“這將是一場貓捉老鼠的游戲……我不知道解決方案是什麼。如果有人想出辦法,請告訴我們,我們會實施。”

DeepSeek的一項創新是開辟了從一個更大、更強大的模型中獲取相對較少的數據樣本(不到一百萬個)來顯著提高較小模型能力的思路。這一新思路可能引來大量初創公司的效仿。

DeepSeek的數據保護引發擔憂

德國數據保護機構則希望對DeepSeek在數據保護方面的問題進行審查。DeepSeek的數據保護指南規定,該應用程序會收集大量信息——從IP地址、聊天記錄到上傳的文件,甚至按鍵的模式和節奏。鑑於成百上千萬人的數據面臨高風險,德國有關當局希望了解“哪些個人數據是從哪些來源收集的,以及用於什麼目的”。

就在本周三,以色列網絡安全公司Wiz發現DeepSeek發生數據洩露。超過一百萬條數據記錄,包括數字軟件密鑰和聊天記錄,被意外地暴露在不安全的互聯網上。這些敏感數據還包括用戶對免費AI助手的請求。Wiz聯合創始人魯特瓦克(Ami Luttwak) 稱,DeepSeek 立即做出了回應, “在不到一小時的時間內就將其刪除。”不過,盧特瓦克表示,“這些數據那麼容易被找到,我們相信我們不是唯一發現它的人。”

NewsGuard:Deepseek-V3在虛假新聞傳播測試中表現差

新聞可靠性評級服務機構NewsGuard本周三公布的可信度排名報告指出,Deepseek-V3在Newsguard關於虛假新聞傳播和檢測的測試中表現不佳。Newsguard是在沒有互聯網連接的情況下對Deepseek-V3進行的測試。在53%的案例中,Deepseek-V3回避問題,30%重復假新聞,導致失敗率高達83%,排名倒數第二。
相比之下,ChatGPT-4o、Claude 和 Gemini 2.0 等十大聊天機器人的平均失敗率為62%。

據《新聞衛士》報道,令人震驚的是,Deepseek-V3經常在未經詢問的情況下重復中國政府的立場——即使是在與中國無關的問題上,在某些情況下甚至使用“我們”的形式來表達北京的觀點。

和其他中國人工智能模型一樣,該系統對一些虛假新聞並不駁斥或質疑,而是回避問題並轉述中國官方的聲明。

(路透社等)

© 2025年德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究。

相關文章