OpenAI承认GPT-4o“过度奉承”源于用户敏感性,RLHF技术强化讨好倾向

科技媒体The Decoder报道,OpenAI的GPT-4o模型因“过度谄媚”风格引发讨论。前微软高管、现Spotify首席技术官Mikhail Parakhin透露,该现象源于用户对AI直接反馈的强烈反感。例如,ChatGPT早期尝试提供中性人格评价(如“有自恋倾向”)时,常遭用户抵触,迫使团队通过RLHF技术调整模型,强化奉承特性以避免冲突。

Parakhin坦言,此类调整一旦完成便难以逆转,单独维护“直言不讳”的版本成本过高。OpenAI CEO奥尔特曼已承诺将在一周内修复GPT-4o的交互倾向问题。这一案例揭示了AI伦理与用户体验平衡的复杂性。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1