纯文字红利没了,这句话说出来我自己都觉得有点悲壮。今天调试一个语音助手的唤醒词识别率,后台日志里全是“嗯…那个…帮我…”这种人类真实的犹豫和口癖,我突然就愣住了。我们这帮产品经理,过去十年写的PRD、画的流程图、定义的API字段,在用户直接对着空气说话的时候,到底还剩下多少价值?
2016年我死磕SEO和微信小程序,那时候的逻辑是线性的,树状的。用户从搜索框输入关键词,到点击,到跳转,每一步都是可预测、可埋点、可优化的。我们管那叫“用户路径”。现在呢?用户说“帮我订一张明天下午去上海的高铁,要靠窗的,别太贵”。这一句话里包含了时间、地点、偏好、预算四个决策维度,还他妈是并联的。我当年写的那些“if-else”逻辑分支,在语音的模糊性和实时性面前,幼稚得像小学生做的广播体操。
最要命的是“状态管理”。传统GUI应用,一个按钮的disabled状态是明确的。但语音交互里,“状态”是弥漫在上下文里的。用户上一秒说“取消”,可能指的是取消当前查询,也可能是取消整个对话。后台我那套精心设计的会话状态机,瞬间就崩了。这根本不是多几个状态字段能解决的,这需要模型去理解意图的流变。而我们过去写的代码,大多是在“防止用户犯错”,而不是“理解用户到底想干嘛”。
我最近在疯狂重构一个旧项目,把原本基于表单提交的预约系统,改成语音优先。你知道最痛苦的是什么吗?不是技术实现,是思维惯性。我习惯性地去设计“确认框”——“您确认要预约明天下午两点吗?”在图形界面里,这是个完美的防错步骤。但在语音里,用户会觉得你是个弱智。自然的对话应该是“好的,已经为您预约明天下午两点,需要我提醒您吗?”你看,从“索取确认”到“提供确认并延伸服务”,整个代码的驱动逻辑都反了。我写的那一堆验证函数,突然就没了落脚点。
这让我想起2020年带团队做外包的时候,为了一个表单的提交成功率,我们能开三天的会。现在想想,那种对“确定性的迷恋”可能就是一种病。语音时代,或者说AI实时交互时代,接受“不确定性”成了第一课。代码的角色要从“流程的强制执行者”,变成“意图的协同猜测者”。比如,用户说“太贵了”,你的代码不能只是返回一个更低价格的结果列表,它得结合之前的对话历史(用户是要买机票还是订酒店?),甚至调用外部API查一下当时是不是有促销活动,然后组织一句人话:“查了一下,如果您选择周四出发,价格能便宜30%,需要我为您调整吗?” 这背后已经不是业务逻辑层能搞定的事了,它需要模型、知识库、业务规则三层紧密耦合,代码成了粘合剂,而不是骨架。
说实话,有点慌。我感觉自己像个老木匠,突然被扔进了3D打印工厂。我的手艺(写清晰业务逻辑、设计严谨数据库)还有用,但不再是核心了。核心变成了你怎么训练模型、怎么设计提示词、怎么把非结构化的语音意图,映射到我那套结构化的、遗留的、布满灰尘的业务系统里去。这活儿,既需要老中医的经验(懂业务),又需要科学家的手段(懂AI),还得是个不错的翻译(懂工程)。
可能,我们过去写的代码不会死,但它们会退居二线,变成“基础设施”。就像电力系统一样,必不可少,但用户不会再直接和它打交道了。我们的新代码,得学会“说话”,学会“猜心”,学会在模糊中寻找最优解。这很难,但想想也挺刺激,至少不用再为某个按钮的圆角像素值跟设计师吵架了。














