腊月二十五的成都:我在鞭炮声里,看完了 o4 的架构白皮书

这实验其实是被逼出来的。上个月接了个成都本地生活号的单子,甲方要求“要有成都烟火气,但每天更新三十条”。我第一反应是套用之前的伪原创流水线——同义词替换+句式重组+热点关键词植入,结果生成的东西连我自己都看不下去。“巴适得板”这种词像撒味精一样到处乱塞,读起来像外地人硬学四川话。

腊月二十五,窗外的鞭炮声已经断断续续响了一整天。我把自己关在书房,把 GPT-4 的 temperature 调到 0.9,开始往系统提示词里灌真正的方言语料。不是网上那些“川普大全”,而是从九十年代《成都晚报》副刊的电子存档里爬下来的市民投稿,加上我自己在玉林菜市场录的摊主闲聊音频转的文字。这些材料里,“安逸”有时候是真心赞叹,有时候是反讽,“瓜娃子”在熟人之间可以是亲昵的。AI 不懂这个,它只会统计词频。

我的突破点在于强制 GPT-4 进行“场景-情绪-方言映射”。我写了个三层结构的提示词:第一层定义内容类型(比如“小区门口水果摊降价促销”),第二层明确叙述者身份和情绪(“一个有点斤斤计较但心肠不坏的嬢嬢,半信半疑”),第三层才是方言词库,但特别标注了某些词的禁忌语境。比如“铲铲”后面绝对不能接正面评价。然后我让 n8n 跑了个循环,每次随机组合场景和情绪,生成二十个版本。

出来的东西终于有点人味了。有一条是模仿菜市里肉铺老板吹嘘自己的土猪肉:“你看这个肉膘,亮汪汪的,不是那种喂饲料的虚泡泡。煮出来你尝嘛,抿抿甜。” “抿抿甜”这个词用得精准,它不是单纯的“甜”,是一种扎实的、厚重的甜味,AI 从语料库里关联到了“红烧肉”和“土猪肉”的上下文,自己拼出来了。代价是生成速度慢了三倍,而且有百分之三十的产出会突然崩坏,冒出一些完全不合逻辑的方言乱码,比如“这个火锅吃得人毛焦火辣,就像在洗桑拿一样巴适”。我得在后面加个校验层,用简单的正则匹配过滤掉明显矛盾的词组。

搞到凌晨两点,鞭炮声基本停了。我意识到所谓的“个性化和辨识度”,本质上是在用技术手段还原人类语言中那些模糊的、依赖语境的部分。GPT-4 是个概率怪物,你给它越精确的约束,它反而能在这个框里跳得更活。但框本身,还是得人来画。这活儿比我去年死磕微信小程序云开发的时候更磨人,它不考验你多线程或者破解 API 频率限制的硬功夫,它考验你对“人味儿”的理解和拆解能力。拆得越细,机器学得越像,而你自己,反而会在这种拆解里,变成那个最不懂“安逸”到底是什么意思的人。

© 版权声明
THE END
喜欢就支持一下吧
点赞28 分享