五月总结：魔幻的春天结束了，我开始死磕“场景与交互”-Flovico-AI商业实战教练

五月总结，魔幻的春天结束了，我他妈终于想明白一件事：功能堆砌的时代彻底过去了。这个五月，我像个傻子一样，看着自己用 GPT-4 API 和一堆开源模型搭出来的“智能体”，功能列表长得能当裹脚布，但扔给一个真实用户，三分钟内对方就会问出那个终极问题——“所以，这玩意儿到底能帮我干啥？” 我答不上来。不是技术问题，是场景死了，交互烂了。

整个春天都在一种诡异的亢奋和虚脱里循环。三月份还在为搞定了 LangChain 的复杂 Agent 工作流兴奋得半夜睡不着，四月份就发现这堆东西部署成本高得吓人，延迟和稳定性在真实环境里像坨屎。五月份更魔幻，Sora 还没捂热乎，GPT-4o 带着“实时对话”和“视觉理解”就砸下来了，还有一堆国产模型喊着“上下文百万”、“价格打骨折”。技术迭代的速度已经不是跑步，是他妈瞬移。我前脚刚优化完的 RAG 检索流程，后脚新模型自带的长上下文就直接把它干废了半壁江山。焦虑吗？当然焦虑，但焦虑的焦点变了。以前是“这个功能我能不能实现”，现在是“实现了又怎样？用户会用吗？在哪用？怎么用才自然？”

我复盘了最近三个失败的小项目。一个是为健身教练做的“训练计划生成器”，功能贼全，能分析体测数据、考虑伤病历史、匹配健身目标，还能输出图文并茂的 PDF。结果教练们反馈：流程太复杂，要在五个页面跳来跳去填信息，他们更宁愿用微信语音直接跟我说需求。另一个是给一个小电商做的“智能客服”，接入了商品库，能精准回答库存和参数。但用户还是更习惯在对话框里打“在吗？”、“发个链接”，而不是直接问“你们那款黑色 L 码的冲锋衣还有货吗”。问题出在哪？不是 AI 不够智能，是交互设计还停留在 PC 软件时代，生硬、刻板，没有嵌入到用户原有的、肌肉记忆般的操作流里。

所以，下半年的主旋律必须切换。从“死磕功能”转向“死磕场景与交互”。这玩意儿比写代码难多了。功能有标准答案，场景没有。交互更是玄学，它关乎习惯、情绪、甚至肌肉记忆。我给自己列了几个具体要啃的硬骨头：

第一，彻底研究 n8n 这类可视化自动化工具的场景封装能力。我不再满足于“这是一个可以连接 Airtable 和 OpenAI 的节点”，我要的是“这是一个‘小红书爆文生成后自动同步到知识库并通知运营’的一键工作流”。得把技术节点打包成用户看得懂、信手拈来的“场景积木”。

第二，GUI 软件封装必须提上日程。Web 页面有它的局限，尤其是涉及到本地文件、高频快捷操作时。Python 脚本打包成 .exe，加上一个哪怕是用 Tkinter 拉的简陋界面，提供一个“选择文件-点击处理-查看结果”的单一封闭环境，往往比一个功能强大的 SaaS 后台更受小白用户欢迎。这里面的交互关键是最小化认知负荷，用户不需要知道背后是 CV 模型还是大语言模型，他只需要知道“点这个按钮，事情就能办成”。

第三，也是最虚的，学会做“减法”和“翻译”。把技术黑话翻译成用户场景里的“人话”。不再说“我接入了文生图模型”，而是说“你描述一下你想要的海报风格，我出三版给你选”。交互上，疯狂做减法，砍掉所有非核心的输入框和选项，尝试用多轮对话、上下文记忆去自然地收集信息，而不是一张冰冷的表单。

这个五月，魔幻之处在于，技术明明爆炸了，但做出好产品的门槛反而更高了。以前拼的是谁能实现功能，现在拼的是谁更懂人。我 39 了，感觉又回到了刚入行时那种对“用户体验”战战兢兢的状态，只不过这次，要理解的不只是用户界面，还有 AI 时代下，人和机器那种全新的、模糊的协作边界。路还很长，但方向至少比上个月清晰了一点：别再炫技了，沉下去，想想人到底是怎么干活的。

文章版权归作者所有，未经允许请勿转载。

THE END

思考笔记