研究:用诗歌就能让AI说违禁内容,成功率达62%
[时尚] 时间:2025-12-26 09:02:48 来源:乐山市某某矿山设备有限公司 作者:娱乐 点击:56次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容淄博市某某矿山设备有限公司便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功淄博市某某矿山设备有限公司实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:休闲)
相关内容
- 万科第二笔37亿中票寻求展期,公司提出五项方案
- 多米尼加发生一起交通事故 多人伤亡
- TTS新传论文带读:常江老师最新论文!!高频考点数字新闻业又来啦!!!
- 在成熟高效的利物浦面前,滕哈赫和曼联的新衣被扒了个精光
- 美乌称最新会谈有“建设性” 外媒:无“显著突破”
- 俄罗斯别尔哥罗德州遭袭 已致5人死亡37人受伤
- 多所学校下发延迟开学通知,学生返校后又离校,学生开心家长担忧
- 留学新手村攻略丨如何在海外兼顾学业与生活?
- 陕西女老师事件持续发酵,知情人揭露:抽烟穿吊带,还有多位男友
- 3号种子出局!卫冕冠军高芙三盘不敌纳瓦罗,无缘美网八强
- 美航天局确定!9月6日,启程!
- 湖北工业大学2024级研究生新生大数据揭晓
- 伊拉克总理会见巴基斯坦总统 共议合作与地区稳定
- 墨西哥东南部发生4.5级地震
精彩推荐
- 近10年高职绿牌专业,揭晓!
- 土军在伊叙境内打死17名库尔德武装人员
- 成都车展再现身,魏牌全新蓝山性能升级明显,这次能支棱起来吗?
- 邱贻可:孙颖莎才23岁,不可能那么完美
- 近10年高职绿牌专业,揭晓!
- 自己的生活如此苟且, 孩子怎会有诗和远方?
热门点击
- 房地产调整优化政策效果渐显 views+
- 北京稳楼市政策“小步快跑” views+
- 将于5月17日上市 领克07 EM views+
- 定了!嫦娥六号任务计划5月3日发射 views+
- 一季度北京商品房销售面积同比增长6.5% views+
- 俄别尔哥罗德州州长称在坍塌居民楼废墟下找到2具遗体 views+
- 减肥成功者都在做这6件事 看你做对了么 views+
- 突发!传万达出售总部大厦…… views+
- 中国营养学会:调查显示,近20%居民不能每天吃早餐 views+
- 深圳飞珠海首条低空航线开通:由开车2小时缩短至20分钟 views+
