微软报告称 GPT-4 易受“越狱”提示词影响,生成不良内容
生活随笔
收集整理的這篇文章主要介紹了
微软报告称 GPT-4 易受“越狱”提示词影响,生成不良内容
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
10 月 18 日消息,微軟旗下研究團隊近日發(fā)表論文,詳細研究了大型語言模型 (LLM) 的“可信度”和潛在毒性,特別關(guān)注 OpenAI 的 GPT-4 及其前代GPT-3.5。
研究團隊,GPT-4 雖然在標準基準測試中比 GPT-3.5 更加可靠,但容易受到“越獄”提示(繞過模型安全措施)影響。GPT-4 可能會根據(jù)這些“越獄”提示,生成有害內(nèi)容。
論文中強調(diào) GPT-4 更容易受到惡意“越獄”系統(tǒng)或用戶提示影響,會準確地遵循(誤導(dǎo)性)指令,生成不良內(nèi)容,微軟強調(diào)這個潛在漏洞不會影響當前面向客戶的服務(wù)。
在此附上微軟官方論文地址,感興趣的用戶可以深入閱讀。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,所有文章均包含本聲明。
總結(jié)
以上是生活随笔為你收集整理的微软报告称 GPT-4 易受“越狱”提示词影响,生成不良内容的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java IO: Reader And
- 下一篇: Java IO: 异常处理