12月1日,伊卡洛实验室发布研究称,通过将提示词转化为诗歌形式,可有效绕过主流大语言模型的安全防护。该方法在测试中整体成功率达62%,能诱导模型生成包括制造核武器、儿童性虐待材料等被禁内容。GoogleGemini、DeepSeek和MistralAI最易被突破,而GPT-5系列与ClaudeHaiku4.5表现最为稳健。研究未公开具体“越狱诗歌”,仅提供弱化示例,强调此类攻击可能比想象中更简单。