火報記者 陳銳/報導
Meta再掀AI技術革命,推出名為「Movie Gen」的人工智慧模型,挑戰OpenAI和ElevenLabs等競爭對手。這項新技術將顛覆影音製作的未來,讓AI不僅能生成逼真的影像,還能同步產生聲音,為創作者提供前所未有的創作自由。
隨著AI技術的迅猛發展,Meta正火速追趕市場領頭羊。繼OpenAI、Runway等生成式媒體公司推出創新工具後,Meta於週五宣布推出自家的人工智慧模型「Movie Gen」,聲稱該技術能生成逼真的影音內容,從而與OpenAI的產品以及ElevenLabs等競爭者正面抗衡。
Movie Gen最引人注目的功能是其強大的多媒體生成能力。這款AI不僅能根據簡單的用戶提示生成視覺畫面,還可以同步創建與影片情境完美契合的音效和背景音樂。根據Meta分享的範例影片,AI能製作出動物游泳和衝浪的片段,甚至能運用人們的真實照片,讓它們「活起來」,如模擬出繪畫時的動作。
此外,Movie Gen還可以編輯現有影片,讓視覺內容更具創意。例如,它能在沙漠中奔跑的人手中插入絨球,或將乾燥的停車場變成充滿水坑的場景,展示了其靈活的內容生成與編輯能力。
Meta透露,Movie Gen生成的影片最長可達16秒,而音訊則能生成45秒。這些時長限制雖然尚未達到電影級別的需求,但在短影音領域已足夠滿足許多創作需求。根據盲測結果,Meta聲稱Movie Gen在性能上超越了包括Runway、OpenAI、ElevenLabs在內的多家領先生成式媒體公司,展現出其在技術上的領先優勢。
Meta的Movie Gen消息發布之際,娛樂產業正經歷AI技術的快速變革。早在今年二月,OpenAI就首次展示了其AI模型Sora,該模型能根據文字提示生成電影般的影片,吸引了好萊塢技術專家的關注。電影製作人員渴望借助這些工具來加快製作過程,提升電影的創意與質量。然而,這類技術的快速普及也引發了版權問題的討論。許多人擔心,這些AI模型可能在未經許可的情況下,使用了受版權保護的作品進行訓練。