核心洞察:AI 不是无限记忆的。它有一个「白板」,写满了就只能擦掉最旧的内容来写新的。你聊得越长,它忘得越多——不是变笨了,是白板满了。
你跟一个朋友聊天,从下午 2 点聊到 6 点。你觉得他会记得下午 2 点你说的第一句话吗?
大概率记不住——人的短期记忆是有限的。
AI 也一样。
想象你面前有一块白板:
所以你跟 AI 聊了 100 轮之后,它还记得第 95 轮说了什么,但第 1 轮的内容已经被擦掉了。
这块「白板」的大小,就叫上下文窗口(Context Window)。
每个 AI 模型都有一个固定的「记忆容量」——它一次性能「看到」多少文字。这个容量就叫上下文窗口。
如果你用的 AI 是比较新的模型(2025-2026 年发布的),它的上下文窗口通常在 100K tokens 以上——相当于一本几万字的短篇小说。
模型迭代很快,具体哪个模型有多大窗口这个信息几个月就会变。你只需要记住一个大趋势:
查你用的模型有多大窗口:直接问 AI 自己。输入「你的上下文窗口有多大?」——它会告诉你。
上下文窗口的大小是用「token」来衡量的。简单来说:
不需要记住 token 的精确算法。你只需要知道:
上下文窗口是用 token 衡量的。你发的每句话、AI 回的每句话,都在消耗这个窗口。
这就是为什么:上传一整本小说让 AI 分析,可能直接把窗口占满了——它只能记得小说内容,记不住你之前问了什么。
你聊着聊着,AI 突然不记得某个信息了——最常见的两个原因:
对话太长,最早的内容被挤出去了。
(中间聊了 50 轮各种细节)
第 1 轮提到的「网站」已经被挤到窗口之外了。
即使窗口没满,中间的内容太多也会「稀释」注意力。
(AI 生成了很长的代码,中间又问了好几个其他问题)
AI 的注意力被中间的内容稀释了。
不管是哪种原因,都不是 AI「变笨了」——这是它的底层设计决定的,所有模型都这样。
知道了 AI 有记忆上限,你可以做一些很简单的事来改善体验:
做这个实验来感受上下文窗口的存在:
预期结果:大概率 AI 已经忘了文章里的具体内容——因为窗口被中间 20 个无关问题和回答占满了。
这不是 AI 的错,是窗口满了。
AI 有「短期记忆」——它记得你刚才说了什么,所以对话能连贯。
但记忆是有限的——白板会满,满了就会忘。不是变笨了,是设计如此。
📏 AI 的记忆像一块白板——
写满了就要擦掉最旧的内容。话题变了就开新对话,是最简单的应对方法。
推荐阅读: Understanding Context Windows in LLMs(英文)— 用比喻和图表解释了上下文窗口的原理。
有疑问?回到 AI 工具,试着故意把对话聊到「窗口满」的程度,观察 AI 什么时候开始忘记。这是最好的学习方式。