36岁国庆:书房外的红旗,书房内的代码

36岁国庆,书房窗外飘着红旗,书房内我对着屏幕上的代码,调试那个该死的开源 NLP 模型。不是员工,不是团队,就我一个人。这套自动化沟通系统,是我断尾求生后,给自己搭建的“数字员工”。

国庆假期,别人在旅游,我在处理堆积如山的客户咨询。之前招的两个助理,一个嫌工资低跑了,一个理解不了技术问题,回复总出错,最后还得我擦屁股。身心俱疲。现在,我决定用代码替代他们。核心是那个开源模型,我选的是 BERT 的一个轻量版,本地部署,不用 API,省得被频率限制卡脖子。预处理逻辑是关键。客户的问题千奇百怪,但 80% 可以归类。我写了个脚本,先把问题里的“怎么”、“如何”、“为什么”这些虚词去掉,提取核心名词和动词组合。比如“小程序怎么调用摄像头权限报错”,预处理后变成“小程序 调用 摄像头 权限 报错”。然后扔给模型做意图分类。

分类器我训练了十几个标签:“小程序开发”、“API 对接”、“部署问题”、“支付配置”、“UI 异常”…… 模型输出置信度。超过 0.85 的,直接触发预设的答案模板,模板里留了几个变量,用正则表达式从原问题里抠出关键参数填进去。低于 0.85 的,标记为“待处理”,存到数据库,我每天集中看一次。这比雇人靠谱多了,至少它不会因为心情不好就乱回复。

但坑太多了。中文分词的准确性是个噩梦,客户打错字或者用方言词,模型就懵了。我不得不加了个纠错模块,用编辑距离去匹配一个技术词库。还有,有些问题看似简单,比如“页面白屏”,可能是前端资源没加载,可能是后端接口挂了,也可能是微信开发者工具缓存问题。模型分不了这么细,这时候就需要多层逻辑:先让客户提供截图或错误日志的代码片段,用 OCR 或者代码解析提取关键信息,再进入第二轮判断。这部分的规则引擎我写了快两百条 if-else,臃肿但有效。

超级个体,听起来很酷,本质是把自己逼成一座孤岛上的全栈工程师。以前管团队,觉得人难管,心累;现在对着代码,觉得机器更蠢,但至少它不会抱怨,不会提加薪。我需要的不再是员工,而是一个个“连接器”——连接我和重复工作的自动化脚本,连接我和潜在客户的引流渠道,连接我和健康数据的运动手环。身体是第一生产力,这话我今年才痛彻心扉地明白。去年熬夜交付,心脏早搏进了次急诊。所以现在,代码跑着,我就去举铁。系统自动回复着,我就去准备低卡午餐。

这个国庆,红旗在飘,我的代码在跑。我在中间,既是船长,也是唯一的船员。我把这套系统的后台监控页面开着,看着一条条咨询被自动分类、回复、归档,有一种冰冷的掌控感。这比管理活人简单,也孤独得多。但这就是 2021 年的选择:用绝对的代码控制力,换取那一点点可怜的个人自由。至少,今晚不用加班回复“在吗”了。

© 版权声明
THE END
喜欢就支持一下吧
点赞56 分享