時事

Nvidia 推出音頻 AI Fugatto 聲音生成與修改樣樣行

火報記者 陳銳/報導

Nvidia新推出一項人工智慧技術——Fugatto。這款生成式音頻 AI 模型不僅能創作音樂和聲音,還能對現有音頻進行修改。雖然尚無公開發布計劃,但 Fugatto 已為音樂、電影和遊戲領域提供無限可能。

Nvidia公布了一款代號為 Fugatto 的生成式音頻模型。該技術名為 “生成音頻變壓器”(Generative Audio Transformer),是一款可以根據文字提示創造全新音樂與音效的 AI 工具。與此同時,Fugatto 還具備修改現有音頻的能力,能實現如改變口音或調整情緒表達等複雜操作。

Nvidia 深度學習應用研究副總裁 Bryan Catanzaro 表示,生成式人工智慧正逐步改變音樂與影視產業的格局。過去幾十年,電腦技術和合成器已經深刻影響了音樂的創作方式,而 Fugatto 則為普通人和專業人士提供了更便捷且多元化的音頻創作工具。

Nvidia 強調仍在審慎評估其應用場景以及如何防止潛在的濫用問題。圖:istockphoto

儘管如此,該技術尚未對外釋出。Nvidia 強調仍在審慎評估其應用場景以及如何防止潛在的濫用問題。例如,生成的內容可能觸及版權侵權或散播錯誤資訊等倫理挑戰。

生成式人工智慧已成為科技與娛樂產業的熱點議題。OpenAI 等公司正與好萊塢洽談 AI 技術的使用規範,但這一過程並不順利。此前,好萊塢女星斯嘉麗·約翰遜曾指控 OpenAI 未經授權模仿其聲音,引發業界對生成式技術侵權問題的擔憂。

Nvidia 表示,Fugatto 是基於開源資料訓練的,這在開發過程中已經大幅降低侵權風險。然而,是否開放大眾使用仍在討論中。Catanzaro 指出,“任何強大的生成式技術都伴隨風險。我們需要確保其用途在可控範圍內,這也是為何 Fugatto 尚未公開的原因。”

相關文章