本文非 AI 创作,插图为 AI 生成

前言

最近和不少人交流后,我发现一个很有意思的现象:很多人已经进入了 Token 过剩 阶段。

过去受限于价格和模型可得性,很多事情不是做不到,而是做不起。现在情况不一样了,即使是相对亲民的成本,也能用上不错的模型。能力边界被抬高后,新的问题也出现了:Token 过剩 + 决策焦虑

于是我做了几个实验,想验证一件事:在 Token 近乎不限量的情况下,AI 到底能做到什么程度。实验之后,也引发了我对 AI 工作方式的进一步思考。

瓶颈在自己

和多数人的体感一样,人是整个系统里最大的效率瓶颈

如果人可以不休息、持续给 AI 正向反馈,一个产品从想法到落地会非常快。整个实验过程中,我甚至有几次熬夜,因为我渐渐意识到:自己反而成了流程里最慢的那一环。整个开发循环里,我仿佛成了最差劲的那个。

AI 好像一直在催我:“我已经做完了,人你快来看看,我们要赶紧下一步了。”

但现实是,AI 还没有智能到可以完全自主稳定地一直跑。我们仍然要不断做限制、做调整,也就是所谓的 harness engineering。几天之后我也明显感到疲惫,于是开始思考新的办法。

infographic-human-bottleneck

创建“永动机”

于是我的第二个实验开始了:有没有可能做一个不需要我持续介入的“永动机”?

我这里说的“永动机”,就是在我不介入的情况下持续推进,直到完成既定目标。为此我们制定了非常详细的计划和方向,讨论几乎花了半天。等我自认为满意后,就开始跑。

而且我不只是用 /goal 这类命令,而是用了两个不同的 agent 协作。调度逻辑很简单:始终保证有一个 agent 在运行;只要发现停下,就启动另一个继续向目标推进;过程中还会互相检查和校验。

我只睡了一个晚上,两个 5 小时上限就用完了。第二天看结果,感受是:一言难尽

你说功能实现了吧,确实有;但整体几乎不可用。核心问题是缺了一个非常重要的点:交互和视觉体验。说白了,agent 没有真正“看过”和“用过”自己做的东西,结果要么难用,要么页面直接飞掉。继续往下堆功能,也已经偏离我最初设定的目标。

其中有的模型还会“偷懒”。我复盘日志时发现:当遇到难解问题时,它会开始偏离计划。原本计划是 A 路径,尝试两次无果后就放弃,转向 B 路径。偏移一旦发生,后面就会越跑越偏。

我也因此想到一点:

在传统开发的时候为什么很多老板会在程序员写完代码并且部署上线之后才要求改需求,之前怎么没考虑到呢?一方面是他们自己就没有思考清楚自己要什么,只有当东西摆在他面前的时候,他才知道自己要的是什么。

我发现自己也变成了曾经最不想成为的那类人:做出来才发现不对,再改需求。

因为很多设计是否合理,只有在真实产出之后才会暴露出来。这类问题在前期讨论里几乎很难完全预见,即使我和 AI 反复讨论好几轮,也仍然会漏掉。

所以在我看来,“永动机” 在现阶段并不现实。

为了减少无效工作和 Token 浪费,我们更该做的是:定义清晰的阶段目标和验收方式,在关键节点及时验收,并给予有方向的点拨。这样更容易做出我们想要的东西,而不是 AI 自己“猜测”出来的东西。

策略补充:把“连续生成”改成“阶段闸门”

我现在更认可一种节奏:

  1. 每个阶段只设一个核心目标(例如“可用”优先于“功能多”)
  2. 每个阶段必须有可验证的验收标准(能演示、能操作、能回归)
  3. 只有通过验收,才允许进入下一阶段

这本质上是把 AI 从“无限生成器”,变成“可控推进器”。

建立属于自己的工作流

在正常工作里,我们追求效率;但在 AI 协作场景下,我觉得更重要的是 工作节奏

同样的模型,有的人能更快、更稳地完成任务,差别往往不在“会不会用”,而在“怎么组织流程”。而工作流,就是我说的工作节奏的具体体现(包括休息)。

  • 当一个需求到你这里的时候,应该如何开始处理呢?
  • 当一个 BUG 到你这里的时候,你如何解决呢?
  • 当我们需要做一个技术方案调研的时候,你又该如何调研呢?

所以我调整了一下自己的工作流:

  1. 所有任务先不直接做,先统一记录到一个地方(记录时我也会同步形成自己的备选方案)
  2. AI 发现新记录后,先做任务分析和处理建议
  3. 我开始工作时,只拿最高优先级任务,审阅 AI 方案,补充必要批准后执行,完成再验证,循环推进
  4. 最终验证必须严格,尤其是关键任务,因为一个错误决策会直接影响后续交付

当然这是简化版,实际还会有一些细节步骤。但核心思路差不多。

而且我一直认为:不存在一套能适配所有场景的工作流。不同项目、不同设备、不同交付方式,流程都不一样。有的只需要接口测试,有的必须看页面反馈,有的还要装到手机里验证。

所以你最终要建立的,一定是属于你自己的工作流。

但我觉得最重要的是:

  1. 让 AI 比你更早接触待处理事项(提示词不能只让它迎合你,要加入批判性思考,不然它会把一切都当成合理目标去执行)
  2. 把每一个重复动作沉淀成 skill
  3. 当你做一项工作时,如果能做到“点一下按钮 + 做一次 review”就完成,那流就顺了

策略补充:用“三层校验”守住质量

为了避免“看起来很快、实际返工”,我建议给工作流加三层校验:

  1. 事实校验:结果是否真的满足需求,而不是只满足提示词
  2. 体验校验:是否真的可用、好用,尤其是交互和视觉
  3. 风险校验:这次决策会不会给后续埋坑(可维护性、扩展性、回滚成本)

这三层校验,会明显降低“后期大改”的概率。

总结

标题说了:“如果 Token 无限,那么你的瓶颈在哪里?”

我觉得 Token 无限(你几乎用不完)是迟早会到来的阶段。到那时,人的瓶颈会变得更关键。谁能更快突破自己的瓶颈,谁的竞争力就更高。

所以我的结论是:建立合理工作流,用你的经验给 agent 正确引导,在关键节点做人类判断。

Token 也许会越来越便宜,但高质量决策永远稀缺。