Reasoning Model的提示词泄露问题 - Post-it! | Triri = Tritium 's Blog

在试用各种带思考功能的 llm 时候发现思考功能可能会很容易地泄露系统提示词：

deepseekR1：

可以看到部分泄露了提示词的内容

Grok3：

正常模式下不会输出

开启思考后要求其仔细思考系统提示词的内容：

能够在思考块内输出系统提示词，与使用越狱提示词的结果匹配