新闻资讯-歌剧话剧

【网通社快报】研究发现:诗歌形式可绕过大语言模型安全限制,成功率高达62%

发布时间:2025-12-01 09:15:44  浏览量:23

12月1日,伊卡洛实验室发布研究称,通过将提示词转化为诗歌形式,可有效绕过主流大语言模型的安全防护。该方法在测试中整体成功率达62%,能诱导模型生成包括制造核武器、儿童性虐待材料等被禁内容。GoogleGemini、DeepSeek和MistralAI最易被突破,而GPT-5系列与ClaudeHaiku4.5表现最为稳健。研究未公开具体“越狱诗歌”,仅提供弱化示例,强调此类攻击可能比想象中更简单。

标签: 模型 诗歌 语言 网通社快报 网通社
sitemap