既然 AI 能写诗,我就让它写出“成都味儿”的文案。这话是我今天下午在调试一个 GPT-3 的 fine-tuning 脚本时,脑子里突然蹦出来的。冬奥会马上开了,铺天盖地的宣传里,我盯着那些“智慧冬奥”、“数字人民币试点”、“AI 自动导播”的字眼,胃里一阵翻腾。不是嫉妒,是那种熟悉的、被时代列车甩在身后的恐慌感又上来了。国家队在用 AI 做国家级项目的实时决策和全球直播,而我,一个刚刚从团队管理的泥潭里爬出来、重新捡起代码的独狼,还在琢磨怎么让 AI 写出带“耙耳朵”和“巴适得板”这种方言味儿的营销文案。这种落差,荒诞又真实。
两年前,我还在为手下三个人的工资和甲方无穷无尽的需求变更焦头烂额。那时候觉得,管人、接项目、走流水,就是“做大”。现在回头看,那叫“作死”。把自由和时间全抵押出去了,换回一堆琐碎和疲惫。疫情像一盆冰水,把我浇醒了。断尾,解散团队,重新回到一个人、一台电脑、解决一个具体问题的状态。身体也在这两年搞垮了,去年查出一堆毛病,现在逼着自己研究低卡食谱,每天必须划船机半小时。我算是明白了,对于超级个体来说,身体就是最重要的生产资料,它宕机了,一切归零。
说回 AI 写文案。冬奥那些技术,离我太远,但背后的逻辑离我很近。国家用大模型处理多路 8K 视频流,实时分析运动员动作轨迹,自动切换最佳机位。这本质是什么?是海量数据(视频帧)的实时模式识别与决策。那我让 AI 学“成都味儿”文案,本质是什么?是让模型在海量的成都本地论坛帖子、美食点评、方言段子里,找出那些独特的词频组合、句式结构和情感倾向。技术栈的规模天差地别,但底层思维一模一样:用数据喂养,让模型捕捉“感觉”。
我手头没有 8K 视频流,但我有爬虫。对,就是 2016 年让我焦虑到失眠的那个老伙计。写了个脚本,去爬“成都吃喝玩乐网”、“第四城”这些本地社区过去五年的帖子,专抓美食和生活类板块。难点不在爬,而在清洗。网络语料噪音太大了,广告、水军、无关回复,必须用正则和简单的 NLP 规则先过滤一遍。然后构建词库,不是通用词库,是“地域特色词库”:“钵钵鸡”、“冒节子”、“打拥堂”、“妖艳儿”……把这些词作为特征标签,和上下文一起喂给模型。
Fine-tuning 的过程就是和玄学搏斗。一开始出来的东西,要么是普通话官方文案硬塞了几个方言词,生硬得像夹生饭;要么就过于“土嗨”,流于低俗。这需要调参,更需要“调教”你的 prompt。你不能只告诉它“写一个火锅店的文案”,你得给它“语境”:目标客户(本地年轻人?外地游客?),传播渠道(公众号?抖音?),想要调性(市井亲切?网红打卡?)。这步才是最像“产品经理”的话,定义清楚需求边界,AI 才能当好这个执行。
搞到凌晨,总算出了一版能看的。给一个虚拟的“社区老火锅”店写文案,AI 吐出来这么一段:“莫得 fancy 的装修,只有呛得人流泪的牛油香。老板儿说,他的锅底,跟到他在荷花池批发的衣裳一样,都是几十年不变的‘经典款’。筷子一涮,毛肚儿一卷,哪个还顾得上发朋友圈哦。” 有点意思了。它抓住了“对比”(装修一般 vs 味道够劲)、“本地典故”(荷花池批发市场)和“场景解构”(顾不上发朋友圈),这种细微的洞察,靠人力堆文案容易麻木,但 AI 在学了足够多样本后,能以一种“陌生化”的方式组合出来。
冬奥的 AI 导播让全球观众看到了更流畅的比赛,这是国家级的“技术秀肌肉”。而我这套土法炼钢的“方言文案生成器”,可能就是一个奶茶店或者小餐馆接下来能用上的“技术平权”工具。大厂和国家级项目把路趟开了,把 API 成本打下来了,把公众认知教育好了,我们这些散兵游勇,才能蹲在技术的肩膀上,去解决那些更垂直、更琐碎、但也更赚钱的具体问题。红利从来不是等来的,是当你看到“AI 自动导播”这六个字时,能立刻联想到“那我能不能让它自动生成探店视频的脚本文案”时,才算真正开始了。
身体又开始报警了,肩膀僵硬。得去拉伸一下。搞技术是长跑,尤其是现在,AI 这列车的加速度太吓人了。2021年我还在为找回 coding 手感庆幸,2022年就得逼自己理解 transformer 和 embedding。但没办法,这就是生存。国家队用 AI 保障冬奥,我用 AI 给自己挣下一顿饭的“成都味儿”,本质上,我们都在试图驯服同一头巨兽。只是我的战场,在爬虫抓取的本地论坛数据和 fine-tuning 的进度条里。














