2025-08-01

AI 不应该一直停在聊天窗口里

我越来越相信，下一阶段的 AI 不只是更会聊天，而是开始理解现实空间、接入传感器、管理环境，并在人的授权下做有限但真实的动作。

aireal-world-aimultimodalontologysystems

AI 不应该一直停在聊天窗口里

我有一段时间很迷恋聊天窗口。

不是说界面本身，而是那种感觉：一个输入框，什么都能问。写代码、拆需求、改文章、查日志、解释错误。它确实把很多复杂东西压扁了。

但我最近越来越觉得，它也把 AI 困住了。

你问，它答。

你贴日志，它分析。

你上传截图，它看。

这已经很强了。只是它大部分时候还在等你把世界搬进窗口。

它不在现场

我经常会遇到一种情况：明明模型很聪明，但我还是要自己先跑一圈。

服务器是不是掉了，我要先去看。

某个服务是不是抖，我要先翻。

摄像头里到底发生了什么，我要先截图或描述。

一段网络空间里的变化，得我先把线索整理出来。

整理完以后，AI 才能接手。

这就有点奇怪。

如果 AI 永远只能处理我整理过的材料，它就像一个很强的二线顾问。真正的一线，还是人。

Infra Monitor 给我的感觉

Infra Monitor 做到后来，我对这件事的感受更明显。

它表面上是主机监控。

但我需要的不是“问 AI：这台机器怎么了”。

我需要的是它一直在那里看着：哪些机器在线，哪些服务不对，哪些安全姿态变差，哪些动作可以做，哪些动作不能做。

这和聊天窗口不是一类东西。

聊天窗口是我把问题拿过去。

Infra Monitor 更像问题自己浮上来。

当然它现在还没到“AI 管理”的程度。很多东西只是状态、规则、dashboard、受控任务。但方向已经不一样了。

它更接近一个真实系统旁边的观察层。

聊天窗口不是错的

我不想把聊天窗口说得很低。

它可能会一直存在。

就像命令行一直存在，搜索框一直存在，编辑器一直存在。输入框是一个很好的入口。

问题是，如果 AI 的全部想象都停在入口上，那就太薄了。

现实里的东西不是天然长成 prompt。

房间不会写 prompt。

服务器不会写 prompt。

用户行为不会写 prompt。

医疗流程也不会写 prompt。

它们只留下信号。

视频、日志、指标、证书流、访问记录、影像、权限变化、设备状态。

这些东西很乱，很多还互相矛盾。以前靠人自己拼。以后如果 AI 要更有用，它不能只等人拼完。

我说的走出窗口

不是给 AI 一个身体。

也不是让它马上控制所有设备。

我说的更小一点：让 AI 有机会持续观察一个环境，理解里面有哪些对象，知道哪些边界不能碰，然后在很小的范围里帮人解释和建议。

能不能动作，先放后面。

先能不能看懂。

这就是为什么我会同时做一些看起来不太相干的东西：主机监控、NVR、证书流、图像相似、自动 research、PaaS、MaaS。

它们不是一个宏大计划里拆出来的模块。

更像我一边做，一边发现聊天窗口不够用。

我需要 AI 站到系统旁边。

不是坐在窗口后面等我提问。

这个差别可能就是下一阶段很多产品的差别。