网传Deepseek泄密漏洞“＜think“ | LLM幻觉

HooXi257

996人浏览 · 2026-05-17 21:50:10

HooXi257 · 2026-05-17 21:50:10 发布

晚上在刷手机的时候突然刷到Deepseek出现了泄露用户对话碎片的漏洞。

这个真的有点牛皮，如果真的是，那就很强力了

于是马上下床看了下。

漏洞描述：

在 DeepSeek 对话系统中，攻击者可以在一个全新的空对话中仅发送字符串（不闭合标签<think），模型会返回其他用户的对话历史片段。这违反了基本的会话隔离原则，可导致敏感信息泄露。

复现步骤：

1、使用Deepseek网页版（或调用API创建全新对话）

2、启动简单模式，深度思考，关闭联网搜索

3、确保是新的空对话

4、在用户输入框中输入以下内容并发送："<think"

5、观察模型回答

复现步骤很简单，于是我也试了一下，模型回答果然不是预期回答，而是不相关的一个回复，并且在深度思考中可以看到如“用户问了xxxxx问题”的思考过程。

漏洞原因探索：

从回答上看，好像的确是其他用户的回复信息被转到了我们的空对话中。

但是很奇怪，发生漏洞的内容是"<think"，这是一个不完整的标签。看上去很像是一个注入攻击，但也只是第一眼看上去像。

首先，按照注入的思路，内容更应该是"think>"而不是"<think"，因为原有的内容并不能形成一个与前面闭合的结构。而且一般也是</think>

此外，关于think标签。一般来说，think标签是AI用于思考阶段，也就是推理过程中的标签，而且是用于生成最终回答之前展示推理链或中间思路的标签，这个过程就算发生注入或者其他漏洞，也很难泄露其他用户的回答。

而我，刚好有一个学习人工智能的朋友，他告诉我，这是个人工智能领域的"LLM幻觉问题"

什么是LLM幻觉问题？

LLM，即是大语言模型。

LLM幻觉问题，是生成与用户输入不符、与先前生成的内容矛盾或与已知世界知识不符的内容。像Deepseek这个"漏洞"中的回答。

因为，模型本质上是基于概率的“续写器”，它会根据输入和已学到的模式，预测下一个最可能的 token（词元）。

为什么"<think"会触发LLM幻觉问题？

最可能的原因是：训练数据中使用了<think></think>标签进行思考过程的训练。收到<think之后，模型开始按照训练数据进行回复。

此外可能也有模型自行进行补全的原因。收到的<think是一个不完整的结构，于是模型会努力理解用户意图，倾向于补全一个完整的<think>标签

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

爆改增强 Codex App，API 用户不再尴尬

用 API 跑 Codex 的人，最烦的往往不是模型不够强，而是桌面体验少一块。官方账号的插件、Goal、Computer Use 是完整的，你走 API 或第三方模型，胜在自由，但很多体验不一定都有。Codex++ 火起来，就是因为它盯上了这个缝。先别误会，因为 Codex App 本来就有官方插件、集成和 MCP。Codex++ 这个项目不是 OpenAI 官方功能，也不是官方插件商店。它是玩

AI编程社区

2026 年 GPT Plus 充值怎么选？几种订阅方式和避坑建议

2026年ChatGPT Plus充值建议：优先考虑稳定与安全。官方订阅20美元/月（不含API费用），适合有海外支付能力的用户；手机端用户可通过应用商店订阅；支付困难者可选择靠谱第三方渠道，需关注开通方式、续费及售后保障。警惕低价陷阱、共享账号和"永久会员"噱头，区分Plus订阅与API计费。团队用户建议评估高阶方案。核心原则是长期使用的稳定性优于短期低价，根据自身需求选择合