引擎再好,车身是纸糊的也跑不起来。今天跟一个做财税 SaaS 的老哥聊,他焦虑得快秃了,说现在客户一开口就问“你们接 GPT 还是 Claude?”,好像没个大模型 logo 在官网首页,产品就没法卖了。我问他,你那个自动算税、一键报税的核心流程,用 GPT-4o 重写一遍,体验能提升多少?他愣了半天,说可能就对话自然点,但关键的数据准确性、跟各地税务系统 API 的奇葩兼容性、票据的模糊识别,该踩的坑一个都不会少。
这就是问题所在。AI 把所有人的预期都吊到了“智能”的层面,但垂直领域里真正的“智能”,是藏在无数脏活累活里的。一个引擎,它不知道上海浦东和深圳南山对“研发费用”的认定口径能差出百分之二十,它也没法处理某个老国企财务系统导出的、带隐藏字符和合并单元格的 Excel 表。这些不是 prompt 能解决的,这是需要人肉踩坑、写死 if-else、甚至靠线下饭局换来的“本地化知识”。AI 把这些显性化了,反而让那些只做了表面功夫的 SaaS 原型死得更快——以前你还能用“技术门槛”忽悠一下,现在客户会直接拿 ChatGPT 生成的竞品分析报告来质问你。
我自己的 n8n 工作流封装也是这个逻辑。最开始想炫技,搞了个全自动的、能理解模糊指令的智能客服工单分类。demo 很酷,用户说“打印机卡纸了急急急”,AI 能自动归类到“硬件故障-打印机”并@IT部门。一上线就崩了。真实场景里,用户会发来一张对着屏幕拍的、模糊的、带反光的照片,会说“那个 thing 不 work 了”,甚至直接扔一段语音。你指望通用大模型去理解这些?成本上天,效果看命。后来我拆了,不搞“智能”分类了,就死磕“结构化”。用 n8n 强行把用户输入框拆成:设备类型(下拉选择)、问题现象(带历史记录的标签输入)、紧急程度(滑块)。看起来“笨”,但交付深度出来了——数据干净了,流转确定性 100%,下游的 IT 同事不用再猜谜。AI 用在哪儿?用在用户输入“卡纸”时,自动在“问题现象”标签里推荐“纸张卡住”、“异响”、“多张进纸”这几个选项。引擎在后台默默提供助力,但车身的方向盘和仪表盘,必须是我亲手焊的、符合这个公司具体 IT 管理流程的。
本地化体验更是信任问题,不是技术问题。医疗、法律、财税这些领域,客户买的从来不是“更聪明的机器”,而是“更少让我背锅的责任主体”。你给他一个黑盒般的 AI 助手,生成了一段看似完美的合同条款,他敢直接用吗?他需要的是,你的工具能明确告诉他,这条款依据的是《XX市高级人民法院关于XXX的指导意见(2023)》,并且在高亮旁边给出一个按钮,一键连接到本地司法局官网的具体页面。这种“可验证的深度”,才是信任的基石。AI 在这里的角色,是快速索引和关联,而不是替代专业判断。
所以现在我的迭代方向非常明确:所有工具,底层能力积极拥抱大模型,能用 AI 提速、扩边的环节绝不手软。但面向用户的那一层交互和交付物,必须越来越“重”,越来越“具体”。就像造车,引擎可以采购顶尖的,但底盘调校、内饰人体工学、甚至4S店的维修手册,必须自己死磕。因为用户最终为完整的、可靠的、省心的旅程买单,而不是为发动机的峰值马力参数买单。那些只忙着把旧工具套个 AI 壳子的,很快就会发现,客户要的是一辆能开上路、能适应本地路况的车,而不是一个放在展厅里轰鸣的引擎模型。














