五月总结,魔幻的春天结束了,我他妈终于想明白一件事:功能堆砌的时代彻底过去了。这个五月,我像个傻子一样,看着自己用 GPT-4 API 和一堆开源模型搭出来的“智能体”,功能列表长得能当裹脚布,但扔给一个真实用户,三分钟内对方就会问出那个终极问题——“所以,这玩意儿到底能帮我干啥?” 我答不上来。不是技术问题,是场景死了,交互烂了。
整个春天都在一种诡异的亢奋和虚脱里循环。三月份还在为搞定了 LangChain 的复杂 Agent 工作流兴奋得半夜睡不着,四月份就发现这堆东西部署成本高得吓人,延迟和稳定性在真实环境里像坨屎。五月份更魔幻,Sora 还没捂热乎,GPT-4o 带着“实时对话”和“视觉理解”就砸下来了,还有一堆国产模型喊着“上下文百万”、“价格打骨折”。技术迭代的速度已经不是跑步,是他妈瞬移。我前脚刚优化完的 RAG 检索流程,后脚新模型自带的长上下文就直接把它干废了半壁江山。焦虑吗?当然焦虑,但焦虑的焦点变了。以前是“这个功能我能不能实现”,现在是“实现了又怎样?用户会用吗?在哪用?怎么用才自然?”
我复盘了最近三个失败的小项目。一个是为健身教练做的“训练计划生成器”,功能贼全,能分析体测数据、考虑伤病历史、匹配健身目标,还能输出图文并茂的 PDF。结果教练们反馈:流程太复杂,要在五个页面跳来跳去填信息,他们更宁愿用微信语音直接跟我说需求。另一个是给一个小电商做的“智能客服”,接入了商品库,能精准回答库存和参数。但用户还是更习惯在对话框里打“在吗?”、“发个链接”,而不是直接问“你们那款黑色 L 码的冲锋衣还有货吗”。问题出在哪?不是 AI 不够智能,是交互设计还停留在 PC 软件时代,生硬、刻板,没有嵌入到用户原有的、肌肉记忆般的操作流里。
所以,下半年的主旋律必须切换。从“死磕功能”转向“死磕场景与交互”。这玩意儿比写代码难多了。功能有标准答案,场景没有。交互更是玄学,它关乎习惯、情绪、甚至肌肉记忆。我给自己列了几个具体要啃的硬骨头:
第一,彻底研究 n8n 这类可视化自动化工具的场景封装能力。我不再满足于“这是一个可以连接 Airtable 和 OpenAI 的节点”,我要的是“这是一个‘小红书爆文生成后自动同步到知识库并通知运营’的一键工作流”。得把技术节点打包成用户看得懂、信手拈来的“场景积木”。
第二,GUI 软件封装必须提上日程。Web 页面有它的局限,尤其是涉及到本地文件、高频快捷操作时。Python 脚本打包成 .exe,加上一个哪怕是用 Tkinter 拉的简陋界面,提供一个“选择文件-点击处理-查看结果”的单一封闭环境,往往比一个功能强大的 SaaS 后台更受小白用户欢迎。这里面的交互关键是最小化认知负荷,用户不需要知道背后是 CV 模型还是大语言模型,他只需要知道“点这个按钮,事情就能办成”。
第三,也是最虚的,学会做“减法”和“翻译”。把技术黑话翻译成用户场景里的“人话”。不再说“我接入了文生图模型”,而是说“你描述一下你想要的海报风格,我出三版给你选”。交互上,疯狂做减法,砍掉所有非核心的输入框和选项,尝试用多轮对话、上下文记忆去自然地收集信息,而不是一张冰冷的表单。
这个五月,魔幻之处在于,技术明明爆炸了,但做出好产品的门槛反而更高了。以前拼的是谁能实现功能,现在拼的是谁更懂人。我 39 了,感觉又回到了刚入行时那种对“用户体验”战战兢兢的状态,只不过这次,要理解的不只是用户界面,还有 AI 时代下,人和机器那种全新的、模糊的协作边界。路还很长,但方向至少比上个月清晰了一点:别再炫技了,沉下去,想想人到底是怎么干活的。














