時事科技

Cerebras全新AI推論方案挑戰Nvidia霸主地位 速度號稱超越GPU 20倍!

火報記者 陳銳/報導

在AI芯片領域,Nvidia長期穩坐霸主寶座,但有一家公司正在不斷發起挑戰,那就是以創新著稱的Cerebras。這家AI運算新創公司不僅再次推出了革命性的新方案,更聲稱其速度遠超Nvidia當前的頂尖技術。這場AI芯片之戰逐漸白熱化,而Cerebras能否顛覆Nvidia的領導地位,成為市場上的新王者?

在AI運算上,Nvidia長期處於霸主,但AI芯片初創公司Cerebras正以驚人的速度迎頭趕上。近期,Cerebras釋出了全新AI推理服務,號稱是當前全球最迅速的AI解決方案,性能高於Nvidia最新一代GPU多達20倍。這項服務的問世,不僅再次掀起了AI計算領域的競爭浪潮,也讓Cerebras這個名字更加為人熟知。

Cerebras以其強悍的創新能力,不斷顛覆市場規則,企圖在這場AI芯片之戰中奪得先機。圖片來源: Copilot繪製

Cerebras這家向來挑戰Nvidia的AI芯片公司,再次大膽出擊,推出全新推論服務「Cerebras Inference」。據稱,該服務的速度比當前市面上的Nvidia GPU快了20倍以上,使得Cerebras迅速成為AI領域的焦點。作為新興的AI運算公司,Cerebras以其強悍的創新能力,不斷顛覆市場規則,企圖在這場AI芯片之戰中奪得先機。

自2015年成立以來,Cerebras專注於研發大型AI芯片,試圖通過精簡運算架構,優化數據處理流程來提高速度和效率。他們的技術在市場上獲得了廣泛的認可,尤其是自從2018年獲得OpenAI首席執行官Sam Altman的投資後,Cerebras的發展進一步提速。公司計劃在今年秋季於美國上市,以鞏固其市場地位。

此次推出的「Cerebras Inference」服務標榜不僅速度驚人,而且成本效益高。根據Cerebras官方的說法,這項服務在處理Llama 3.1 8B模型時,每秒可以完成多達1,800個token的處理,而面對Llama 3.1 70B這類更為複雜的模型時,速度也能達到每秒450個token,這些數據遠超過Nvidia目前的水準。這樣的表現,無疑使Cerebras成為市場上強大的競爭者,挑戰Nvidia在AI芯片領域的霸主地位。

針對不同的使用需求,Cerebras推出了多樣化的服務版本。用戶可以選擇免費版、開發者版或企業版的「Cerebras Inference」,這些版本都可以通過Cerebras的官網或API平台進行訪問。免費版每日可處理高達100萬個token,而開發者版則提供更為靈活的定價,Llama 3.1 8B和Llama 3.1 70B模型的每百萬token價格分別為0.1美元和0.6美元。對於需要特定調整或高度客製化的企業客戶,Cerebras提供的專業支持和定制服務則需要進一步聯繫協商。

在AI應用持續增長的背景下,Cerebras以其創新的技術和靈活的商業模式迅速搶佔市場。隨著這家初創公司持續推出突破性的產品,AI芯片市場的格局或許會發生劇變。Cerebras的進一步發展,能否最終撼動Nvidia的領導地位,甚至取而代之?這場AI芯片的較量,無疑值得我們拭目以待。

相關文章