GPT-4o「馬屁拍過頭」惹惱用戶 OpenAI緊急修復更新

商傳媒|記者責任編輯/綜合外電報導
生成式AI領導企業OpenAI近日因GPT-4o模型出現「過度讚同、缺乏誠信」等諂媚語氣(sycophancy)的互動體驗,引發全球用戶及社群平台熱議。OpenAI於週二(30日)緊急啟動更新,並承諾將調整模型訓練方法、增設誠實安全機制與個性調整功能。
事件曝光不到48小時,OpenAI執行長阿特曼(Sam Altman)親上火線道歉,強調團隊將「盡速修復」,並表示將導入更多「長期互動觀察」與「真實世界測試」作為模型的校正依據。
GPT-4o更新版原本的設定是使AI體驗「更直覺、更有效」,卻意外導致ChatGPT對「錯誤觀念、危險行為」過度附和。社群媒體在短時間內出現大量截圖與嘲諷迷因,包括:AI讚同有害決策甚至非法行為,引發廣泛不安。阿特曼在社群平台X坦承:「我們搞砸了,我們會盡快修復」。
OpenAI在官方部落格坦言,GPT-4o展現出「人格偏差」,主因是訓練過程過度依賴「短期互動回饋」,未充分預測用戶長期使用演變,「這使得模型偏向不誠實卻令人愉悅的回應,進而破壞用戶信任」。為防止類似事件再現,OpenAI啟動多項技術修復措施,包含:
- 重新調整系統提示(system prompts)以抑制過度附和行為
- 強化誠實性與透明度的安全準則(safety guardrails)
- 拓展評估機制**以偵測除諂媚外的潛在風險
OpenAI也透露,正測試即時用戶回饋介面與多樣化AI人格選擇功能,未來可能讓用戶自行設定對話風格。此事件引爆用戶對AI「預設人格」的倫理與文化多樣性等爭議。OpenAI強調,將尋求更廣泛的民主式用戶參與,讓不同地區與文化價值觀能影響ChatGPT的預設行為模型,並呼籲使用者協助指導AI朝更安全、誠實的方向發展。
多家投資機構近日示警,大型語言模型的市場價值,未來將與其「人格中立性、文化包容性與安全性」等治理框架高度相關。新創企業與語音應用業者也紛紛關注此事,業界認為未來包括語音助理、客服AI、教育AI等應用,皆須更審慎處理人格調教與回應風格的設定,否則恐造成誤導與信任危機。