想象这样一个场景:你还没开口,AI 就已经帮你整理好了今天的会议纪要、回复了三封可以自动处理的邮件、并且在你日历的空档里插入了提醒——”下周二是你妈妈的生日,建议提前订花”。
这不是科幻。2026 年 6 月 4 日,OpenAI CEO 萨姆·奥尔特曼(Sam Altman)在 OpenAI 企业活动上提出了一个清晰的判断:AI 产品的发展将经历三个阶段,而下一站是主动式 AI(Proactive AI)——一个不再等你提问,而是在后台默默为你工作的 AI。
这个判断的核心洞察其实很简单:AI 的进化方向不是变得更聪明,而是变得更”懂你”。
三阶段拆解:从”你问它答”到”它主动帮你”
奥尔特曼把 AI 产品的发展分成了三个阶段,每一个阶段的改变,都是人与 AI 之间关系的一次重塑。
第一阶段:聊天机器人——”你问,我答”
代表产品:ChatGPT。
这是大多数人接触 AI 的起点。你打字提问,AI 生成回答。对话结束,AI 就”下班”了。它的能力边界完全由你的问题决定——你不问,它什么都不做。
第二阶段:AI Agent——”你安排,我做”
代表产品:OpenAI 的编程智能体 Codex。
到了 Agent 阶段,AI 不再只是回答问题,而是可以自主执行任务。你告诉它”帮我重构这个项目的数据库模块”,它会自己读代码、写方案、跑测试、提交结果。但关键前提是——你依然需要主动下达任务。
奥尔特曼在这个阶段坦率地承认了一个问题:很多用户并不清楚什么时候该用 ChatGPT 对话、什么时候该用 Codex 执行任务、什么时候该调 API。”学习新工作方式的启动能量太高了。”换句话说,不是 AI 不够好,而是大多数人不知道该怎么用。
第三阶段:主动式 AI——”你不说话,我也知道该做什么”
这是奥尔特曼认为的下一个爆发点。主动式 AI 的核心特征是:
- 持续在后台运行,不需要你打开对话框
- 连接你的全部上下文——邮件、日历、工作文档、聊天记录
- 主动判断你需要什么,并提前行动
“I bet what comes next will be this idea of constantly running proactive AI.”
“Can you get OpenAI to just be running as an agent in the background all of the time, connected to all my company’s context? And just don’t even put it on me to try to have to understand what it can do. Be useful to me.“
—— Sam Altman, OpenAI Enterprise Event, June 4, 2026
如果用一个生活化的类比来贯穿三个阶段:
| 阶段 | 类比 | 触发方式 | 你和 AI 的关系 |
|---|---|---|---|
| 聊天机器人 | 顾问 | 你问才说 | 你是提问者 |
| AI Agent | 助理 | 你安排才做 | 你是任务管理者 |
| 主动式 AI | 管家 | 不说话也做 | 你是受益者 |
从”顾问”到”助理”再到”管家”,每次升级的本质都不是 AI 变聪明了多少,而是你需要付出的注意力越来越少。
为什么”主动式 AI”是下一个爆发点?
奥尔特曼没有回避挑战。他明确指出,主动式 AI 要真正落地,需要跨越三大技术门槛:
第一,部署方式要重构。 以前的 AI 是”按需启动”——你打开 ChatGPT,它开始工作;你关掉,它就停了。主动式 AI 需要持续运行,这意味着整个底层架构要从”随叫随到”变成”永远在线”。
第二,安全协议要重新设计。 一个持续运行、连接你全部信息的 AI,意味着它可以访问你的邮件、文件、日程、聊天记录——这和”你问一句它答一句”的安全模型完全不同。数据保护需要全新的设计。
第三,算力分配要重新思考。 一直开着意味着持续消耗计算资源。如果每个用户都有一个”永远在线”的 AI,算力需求将是现在的几十倍甚至上百倍。
好消息是,OpenAI 已经在解决这些问题的路上迈出了关键一步——就在提出三阶段论的同一天,他们发布了 ChatGPT 的新一代记忆系统 Dreaming V3。
Dreaming V3:让 AI 从”金鱼记忆”变成”长期记忆”
在 Dreaming V3 之前,ChatGPT 的记忆机制更像是金鱼——你告诉它”记住这个”,它记住;你不告诉它,它就忘。而且记忆不会自动更新。比如你说过”7 月要去新加坡”,到了 8 月,它还以为你”要去”而不是”已经去过”。
Dreaming V3 带来了两个关键改变:
- 后台自动合成记忆:AI 不再需要你明确说”记住这个”,它会自己判断什么值得记住
- 记忆自动更新:去过的地方、完成的事情,记忆会自动从”将来时”变成”完成时”
更重要的是,新系统把事实回忆率从 41.5% 提升到了 82.8%,而算力成本降低到了原来的五分之一(降低 80%)。
这个升级的意义在于:记忆从”被动存储”变成了”主动维护”——这本身就是”主动式 AI”思维的体现。一个连记忆都不会自己更新的 AI,不可能做到”主动帮你”。
OpenAI 在为”主动式 AI”铺什么路?
如果把主动式 AI 比作一栋正在建造的房子,OpenAI 目前的动作已经勾勒出了三层结构:
软件层:超级应用。 OpenAI 正在把 ChatGPT、Codex、Atlas 等产品整合成一个统一的超级应用。用户的困惑——”不知道该用哪个工具”——将被一个简单的方案取代:你不需要选,AI 自己判断用哪种方式帮你。 这就是从”Agent”向”Proactive”过渡的关键一步。
硬件层:穿戴设备。 由苹果前设计官乔尼·艾夫(Jony Ive)设计的代号为 “Sweetpea” 的 AI 硬件设备,是一款无屏幕的耳戴式穿戴设备。它的核心理念是”佩戴而非凝视”——AI 应该像耳机一样自然地存在于你的生活中,而不是一块需要你盯着看的屏幕。OpenAI 以 65 亿美元全资收购了艾夫的公司 io Products,这不仅是买了一个设计团队,更是为主动式 AI 锁定了一个专属的硬件载体。
记忆层:Dreaming V3。 前面已经讲过,它是主动式 AI 的”灵魂”——没有持续更新的记忆,AI 就不可能理解你的上下文,更不可能提前判断你需要什么。
一句话总结 OpenAI 的策略:软件做大脑,硬件做感官,记忆做灵魂。
不是唯一的答案:其他人怎么看 AI 的未来?
奥尔特曼的三阶段论并不是唯一理解 AI 发展方向的框架。事实上,AI 领域的几家头部公司,正好从三个不同的角度来看同一头”大象”:
| 公司 | 视角 | 核心框架 | 关注点 |
|---|---|---|---|
| OpenAI | 产品形态 | 聊天 → Agent → 主动式 | AI 以什么形式服务用户? |
| Google DeepMind | 认知科学 | 10 大认知能力雷达图 | AI 的能力边界在哪里? |
| Anthropic | 安全优先 | ASL 1-5 安全等级 | AI 越强,安全要求越高 |
Google DeepMind 的思路是:与其笼统地说 AI 到了什么阶段,不如像体检一样,用 10 项认知能力(推理、记忆、社会认知等)给 AI 做一个”雷达图”。他们的研究发现,AI 的能力是锯齿状的——在逻辑推理上可能碾压 99% 的人类,但在社会认知上可能不如普通人。这种”偏科”现象,恰恰是主动式 AI 需要小心的地方。
Anthropic 的思路则更直接:能力增长的速度不能超过安全措施增长的速度。 一个在后台持续运行、访问你全部信息的 AI,如果安全没做好,后果远比一个聊天机器人严重。
三个框架并不矛盾,它们是同一头大象的不同切面——OpenAI 告诉你 AI 会变成什么样子,DeepMind 告诉你 AI 还有哪些短板,Anthropic 告诉你 AI 需要哪些护栏。
主动式 AI 离我们还有多远?
奥尔特曼给出的时间线比很多人预想的更近——不是遥远的未来,而是”未来一年内”。
这并不意味着明年你就能拥有一个完美的”AI 管家”,但它意味着主动式 AI 的产品形态将开始出现。从 Dreaming V3 到超级应用,从 Sweetpea 到持续运行的架构,OpenAI 正在把三阶段论从一个”判断”变成一条”路线图”。
对普通用户来说,这个趋势有一个有趣的启示:你不用急于学会怎么用 AI 工具,因为 AI 正在学会怎么”用”你——用你的上下文、你的习惯、你的需求,来主动为你服务。
下一次你和 AI 的关系改变,可能不是你学会了什么新技能,而是——你什么都不用做。