新闻资讯-歌剧话剧

【网通社快报】研究发现：诗歌形式可绕过大语言模型安全限制，成功率高达62%

发布时间：2025-12-01 09:15:44 浏览量：71

12月1日，伊卡洛实验室发布研究称，通过将提示词转化为诗歌形式，可有效绕过主流大语言模型的安全防护。该方法在测试中整体成功率达62%，能诱导模型生成包括制造核武器、儿童性虐待材料等被禁内容。GoogleGemini、DeepSeek和MistralAI最易被突破，而GPT-5系列与ClaudeHaiku4.5表现最为稳健。研究未公开具体“越狱诗歌”，仅提供弱化示例，强调此类攻击可能比想象中更简单。

标签：模型诗歌语言网通社快报网通社

相关资讯更多>>
苹果研究揭示：大型语言模型存在重大AI推理缺陷

10-17 09:00
中信建投：海内外视频模型密集发布 API打开商业化空间

10-17 08:47
AI翻译界杀手诞生！阿里国际翻译大模型吊打谷歌和GPT-4

10-16 14:18
苹果研究揭示大型语言模型“推理”能力的深层缺陷

10-15 16:00
天玑9400全面支持全球主流大模型，深度优化体验更佳

10-15 11:16
谷歌提出RAG推理scaling laws；苹果推出多模态大语言模型MM-Ego｜大模型论文日报

10-11 14:30
强制谷歌交出私有AI模型数据？美政府要对谷歌进行重大拆分

10-10 19:42
果然视频|我爱你中国！AI同声大合唱，跨越时空的告白

10-01 08:03