Google領跑生成式AI革命 Imagen 3圖像生成技術全新突破

火報時事新聞2024 年 8 月 16 日

Less than a minute

Google公開了大量嶄新的AI技術，並計劃在今年內逐步將這些技術推向市場。圖片來源:Copilot

火報記者陳銳/報導

在全球科技競賽中，生成式人工智能（GenAI）正成為各大企業爭相投入的領域，而Google無疑走在了這場革命的最前沿。隨著2024年Google I/O大會上多項AI技術的發布，Google再次展示了其推動技術創新和應用的強大能力。本文將深入探討Google最新推出的圖片生成AI模型Imagen 3，揭示其技術亮點、應用前景以及在安全性與倫理考量上的重要舉措。

Google在人工智能領域的佈局愈發深入，其對於生成式人工智能（GenAI）的發展展現了極大的決心。今年的Google I/O 2024大會上，Google公開了大量嶄新的AI技術，並計劃在今年內逐步將這些技術推向市場，Google悄然發布了其最新的圖片生成AI模型Imagen 3，並首先向美國地區的企業和一般用戶開放試用。

Google在人工智能領域的佈局愈發深入，其對於生成式人工智能（GenAI）的發展展現了極大的決心。圖片來源:Copilot

Imagen 3的核心技術進步與功能特點

Google在宣佈Imagen 3的同時，強調了這一代模型在多個層面上實現的技術突破。首先，Imagen 3顯著增強了對提示語的理解能力，這意味著用戶可以輸入更為複雜、詳盡的文字描述，模型也能夠準確地解析並生成符合預期的圖像。這項能力的提升，讓Imagen 3在生成圖像的細節、色彩豐富度以及整體視覺設計上達到了前所未有的高度。

Imagen 3還支持生成高解析度圖片，最高可達1024×1024像素。這對於需要高品質圖像的商業應用和創作者來說，無疑是重大利好。此外，這款模型還提供了多種生成選項，用戶可以選擇2倍、4倍或8倍的採樣來生成更符合需求的圖像。這樣的靈活性使得Imagen 3能夠滿足從個人創作到專業設計的廣泛需求。

更值得一提的是，Imagen 3具備圖像編輯功能，允許用戶通過修改原提示來調整生成的圖片內容。如果對最初生成的結果不滿意，用戶可以針對具體的細節進行調整，從而實現更精確的圖像表達。

安全性與倫理考量——Google的謹慎與承諾

在技術創新之外，Google也對生成式人工智能的安全性和倫理問題給予了高度重視。為了避免因不當使用技術而引發的社會爭議，Google為Imagen 3設計了嚴格的內容生成限制。該模型會自動拒絕生成受版權保護的名人形象，例如Taylor Swift等公眾人物，以此來避免法律和道德上的潛在風險。

這一策略與Elon Musk本周推出的AI影像生成模型Grok形成了強烈對比。Grok的設計相對寬鬆，允許生成各類圖像內容，甚至包括涉及毒品、暴力以及公眾人物肖像的影像。這種不設限的做法雖然可能在某些創意領域受到青睞，但也不可避免地引發了外界對其安全性和倫理問題的廣泛質疑。

Google與競爭者的未來之戰

在生成式人工智能領域，Google與其他科技巨頭的競爭日益激烈。隨著Imagen 3的發布，Google無疑在市場上佔據了一個重要的位置。然而，這一領域的發展不僅僅是技術上的競賽，更是一場關乎信任與責任的較量。

Google的安全策略和技術防護措施，表明其希望在推動技術進步的同時，最大限度地減少可能引發的社會問題。與此同時，其他企業如Elon Musk的Grok則在試圖通過不受限的技術應用來突破創意的邊界。這種策略上的分歧，將在未來對整個生成式人工智能領域產生深遠影響。

Google在生成式人工智能技術上的堅定投入，反映了其對未來技術走向的清晰認知。隨著Imagen 3的推出，我們看到了技術應用的新可能，也看到了更多值得關注的倫理與安全議題。在這個快速變化的科技時代，如何平衡創新與責任，將成為所有技術推動者面臨的共同課題。

未來的生成式人工智能，無論在創作自由度、應用範圍，還是社會影響上，都將不斷擴展其邊界。Google的謹慎與深思熟慮或許會為行業樹立新的標杆，而這一切也將為整個科技界帶來更深遠的變革。