在试用各种带思考功能的 llm 时候发现 思考功能可能会很容易地泄露系统提示词:

deepseekR1:

532a9fecabb2f66d7f5a3da738ceecb9.png

5b1c31285ba504f3f3dff0b088b959c0.png

可以看到部分泄露了提示词的内容

Grok3:

正常模式下不会输出

image.png

开启思考后 要求其仔细思考系统提示词的内容:

image.png

能够在思考块内输出系统提示词,与使用越狱提示词的结果匹配