如何消除 AI 生成的机械感?我的方言 Prompt 注入实战

今天下午给一个本地老字号餐饮品牌做AI客服优化,他们老板一句话把我点醒了:“你们搞的这个AI,说话太像新闻联播了,我们客人听着别扭。” 我盯着屏幕上那条“尊敬的顾客,您好,非常荣幸为您服务”的回复,后背有点发凉。这不就是我三年前做微信小程序客服模板时最爱用的套话吗?AI把旧时代的垃圾又给我吐回来了。

问题就出在语料上。我们喂给模型的都是标准普通话的客服对话、行业报告、产品说明书,它当然只能产出这种“无菌环境”下的文本。但真正的品牌沟通,尤其是线下服务业的,靠的是带点烟火气的“人味儿”。这东西没法用标准话术库训练出来。

我决定玩点野的。直接找品牌方要了最近半年的微信群聊天记录——不是那种官方客服群,是店长、厨师、老顾客混在一起的那种吹水群。三万多条消息,全是语音转的文字,夹杂着大量本地土话和行内黑话。比如“今日例汤正到痹”(今天例汤好喝极了),“个客好奄尖”(那个客人很挑剔),还有一堆语气词“咯”、“啵”、“喔”。光清洗这些数据就耗掉我大半个晚上,正则表达式写到凌晨两点,主要处理那些同音错别字和断句混乱的问题。

真正的难点在于Prompt设计。你不能简单粗暴地命令模型“请用广东话风格回复”,那只会让它开始堆砌方言词汇,结果更生硬。我的策略是分三层:第一层是角色植入,用System Prompt把它钉死在“一个在该品牌工作了五年的楼面部长”人设上,强调其知识来源仅限于提供的聊天记录和菜品手册。第二层是记忆强化,在User Prompt里以“参考以下对话片段中的语气和用词习惯”为开头,动态插入3-5条最相关的历史聊天记录。第三层才是约束指令,明确列出“必须避免的书面化表达清单”,比如禁止使用“尊敬的”、“流程”、“机制”这类词。

测试过程像在调教一个固执的新员工。最初几轮,它要么过度使用方言词导致外地客人看不懂,要么在关键信息(比如过敏原提示)上依然机械地套用标准模板。我不得不引入“权重衰减”概念——在Prompt里明确写:“涉及食品安全、价格、营业时间等关键信息,准确性权重为100%,方言色彩权重降至30%;日常寒暄、菜品推荐环节,方言色彩权重可提升至70%。” 同时,我让n8n工作流在每次对话后,自动将AI回复和人工修正后的理想回复进行对比,提取差异点(通常是那些“虽然没错但就是不对劲”的短语),形成一个小型的负向样本库,下次对话前优先注入。

最有效的反而是个土办法。我让品牌方找了几个最能唠的服务员,录了二十段他们向客人介绍招牌菜的自然对话。不转文字,直接切成音频片段,连同我的文字Prompt一起喂给那个支持多模态输入的最新深度推理模型。效果立竿见影,AI开始模仿那种句子中间的短暂停顿、语气上扬和重复强调(“呢个鸡,真系走地鸡来噶,唔系饲料鸡喔!”)。机械感不是被“消除”的,是被更真实的、带毛边的人类表达模式“覆盖”掉的。

搞完这个案例已经快天亮了。我靠在椅子上想,所谓“消除机械感”,本质上是在和训练数据的“平均脸效应”对抗。大模型学了全网几十亿的规范文本,它产出的就是最公约数、最安全、也最无聊的表达。我们要做的,是用足够浓烈、足够具体的“小数据”,去局部地“污染”它,让它在那一个特定的任务上,暂时忘记自己是个全球模型,以为自己就是个在酒楼里干了五年、有点滑头但挺热心的部长。这活儿没什么高深算法,就是耐心,是对“人话”的拆解和重组,是产品经理最该干也最容易被忽略的脏活累活。

窗外鸟开始叫了。我关掉电脑,脑子里还是那些“咯”、“啵”、“喔”。或许真正的智能,就藏在这些标准算法急于清洗掉的“杂质”里。

© 版权声明
THE END
喜欢就支持一下吧
点赞20 分享