既然不想招客服,我就用 GPT-4 封装了全自动售后。这话说出来我自己都觉得有点狂,但被去年那波交付泥潭搞怕了,现在看到“团队”俩字就生理性反胃。招人?管理?沟通成本?算了,我宁愿花三天三夜跟 API 死磕。
去年这时候我还在为三个人的小团队头疼,一个客服回复慢还总带情绪,客户截图发群里质问,我他妈还得两头安抚。现在?我让 GPT-4 去处理这些破事。核心逻辑其实粗暴:把过去三年积累的所有用户咨询记录——邮件、工单、聊天记录——全部喂给它,让它总结出五十个最高频的问题模板。然后写了个中间件,用户在前端输入问题,先做一轮关键词粗筛,匹配到模板就直接调预设回复;匹配不到,才把问题原文和上下文扔给 GPT-4,让它生成回复,同时把这次问答对存进数据库,丰富我的模板库。这玩意儿比人稳定多了,不会累,不会闹情绪,凌晨三点有用户骂街它也能心平气和地回“非常理解您的心情”。
但真动手搞,全是坑。第一个是成本。GPT-4 的 API 贵得肉疼,要是每个问题都直接抛给它,我这点流水还不够付 OpenAI 账单的。所以必须做分流,用关键词和意图识别做第一道闸。我用了本地部署的 BERT 小模型做粗分类,效果还行,但调试阈值就花了半天,太松了 GPT-4 调用频繁,太紧了用户觉得是智障机器人。第二个坑是上下文管理。用户对话是连续的,你不能让它失忆。我用了 Redis 存会话链,把最近五轮问答作为背景喂给模型。但有时用户跳着问,或者突然引用几个小时前的问题,这逻辑就有点抓瞎,目前还在优化会话窗口的算法。
最让我感慨的不是技术,而是某种冰冷的效率。API 不会像那个前客服一样,因为和男朋友吵架就把情绪带到工作里,回复一句“你自己不会看说明吗?”。它永远基于概率给出最“合理”的回应。这种理性,在服务业里近乎一种奢侈。我现在每天就看看日志,监控一下那些被标记“需要人工介入”的异常对话——比例已经压到 3% 以下了。省下的不止是工资,更是那种无时无刻不在的、对人性的失望和拉扯。
当然,隐患不是没有。如果模板库被恶意提问污染,或者 GPT-4 哪天突然抽风生成个政治不正确的回复,那就是灾难。所以我加了两层审核:一层是敏感词过滤,一层是对于“退款”、“投诉”、“法律”这类高危关键词,自动转人工(也就是我)的强规则。这系统现在跑在我自己的服务器上,用 n8n 串起了整个流程:接收问题 -> 分类 -> 调用本地模型或 GPT-4 -> 记录 -> 发送。下一步我打算把它封装成个 SaaS 工具,卖给那些同样被售后搞得焦头烂额的小老板们。他们需要的不是又一个员工,而是一个永远在线、永远冷静的“数字副脑”。这生意,可能比接项目做交付干净多了。














