既然不想回消息,我就用语义匹配搞定了自动回复。今天又处理了三个客户关于“发票抬头怎么改”的重复问题,一模一样的话术我复制粘贴了三次,感觉自己的时间像被扔进了碎纸机。不是他们烦,是我烦这种毫无增量的重复劳动。2019年那会儿养团队,还得专门招个客服来干这个,现在?去他妈的,让机器干。
语义匹配这玩意儿,说穿了就是给机器装个关键词雷达。但别直接用死板的字符串匹配,那太蠢了,“发票”和“开票”都认不出来。我用的方案是 sentence-transformers 加余弦相似度。先把那些高频问题,比如“修改发票”、“合同模板在哪”、“怎么退款”,转化成向量存起来。用户消息一来,也转成向量,然后去库里算相似度得分。阈值我设在了0.78,超过这个数,就触发对应的预设回复模板。这里面的坑在于语料库的构建,一开始我只放了五六个标准问法,结果用户稍微换个说法,比如“你们能重开发票吗”,机器就哑火了。后来我爬了自己过去两年的聊天记录,用 GPT-4 提炼了将近两百个意图分类和常见表述变体,这个匹配引擎才算是有了人样。
真正的难点在于上下文。用户可能上一句在问功能,下一句突然甩个“多少钱”。早期的规则引擎会断片。我现在用了个土办法,结合了短暂的历史消息缓存。如果连续两条消息的语义向量都与“价格”、“费用”、“付费”类意图高度相关,即使第二条消息本身很短,比如就一个“?”,我也会优先推送定价表。这需要点状态管理,但用 Redis 存个 session 就能解决,比招个人盯着成本低太多了。
API 永远准时,这就是超级个体的尊严。凌晨两点客户发消息问部署进度,我的 n8n 工作流被触发,语义匹配识别出“部署”、“进度”、“好了吗”的混合意图,自动从飞书文档里拉取最新的项目甘特图截图,拼接上一段固定话术,一分钟内就回了过去。客户回了个“牛逼,还没睡?”,这次匹配到了寒暄意图,自动回复“工具在跑,我先睡了,有进展会同步”。这种感觉,就像在数字世界里给自己克隆了一个永不抱怨、永不疲倦的守夜人。2021年我断尾求生,砍掉团队,怕的就是自己的时间被琐碎吞没。现在,吞没琐碎的是我写的流程。
但你说完全高枕无忧了?也不是。语义匹配不是 AGI,它还是会犯二。有次用户说“这个方案感觉有点贵”,本意可能是想砍价,但系统匹配到了“价格咨询”意图,自动回了一封长长的价目表和一封购买优惠券的邮件,直接把天聊死了。所以我现在加了个置信度分级,高置信度(>0.85)全自动回复,中等置信度(0.78-0.85)的,会先给一个快速确认选项,比如“您是想了解XX功能的价格吗?”,用户点一下再触发完整回复。留个后手,不把路走绝。
搞这套东西,花了我差不多三个周末。但算笔账:每天至少省下两小时机械回复时间,一个月就是六十小时。这六十小时,我能学多少新东西,能陪家人多久,或者单纯就是发呆,价值都远超那点电费和 API 调用费。2024年了,焦虑的不再是技术会不会,而是你的时间杠杆在哪里。用旧手艺(代码)当撬棍,用新魔法(AI模型)当支点,去撬动那些曾经淹没你的泥沙。这感觉,比当年靠 SEO 堆外链搞流量,踏实多了。














