百度文心一言发布会前夜,我盯着后台那套刚跑完一轮的自动化系统,感觉像在看一个即将被时代淘汰的工业流水线。这套东西我管它叫“国产替代”计划,核心就两件事:伪原创和分发。伪原创不是简单的同义词替换,那太低级了,我写了个基于jieba分词和TextRank的摘要提取器,先把一篇行业分析长文的核心段落抽出来,然后用百度翻译API来回倒腾几次中英日韩语,最后再用一个基于规则和简单LSTM的“人话生成器”把语序打乱重组,生成五篇语义接近但字面不同的文章。分发就更粗暴了,用Selenium模拟登录了知乎、头条、百家号、搜狐号等八个平台,每个平台注册了三个马甲号,系统定时把伪原创好的文章配上不同的标题和头图,全自动发布。
那感觉,就像在互联网的土壤里埋下了几十个数字孢子,它们自己会生长、会呼吸。凌晨三点,手机钉钉的机器人还会给我推送日报:“今日自动发布文章24篇,知乎专栏新增阅读量预估1.2万,百家号获得推荐指数提升,捕获潜在客户咨询线索3条。”看着那些冰冷的数字,有一种诡异的掌控感,仿佛我坐在一个满是屏幕的暗室里,指挥着一支沉默的军队。流量像涓涓细流一样汇进来,虽然不多,但24小时不间断。我甚至给每个马甲号设定了不同的人设:一个是“十年产品老炮”,言辞犀利;一个是“转型中的技术人”,口吻温和;还有一个是“野生运营观察家”,专发数据图表。商机有时候就藏在评论区的一句“老师,这个能详细说说吗?”里。
但今晚,这种成就感有点发虚。圈里都在传明天百度的发布会,说是要出对标ChatGPT的东西。我这套系统所有的“智能”,都建立在规则和浅层模型上,需要我不断去维护词库、调整规则、对抗平台越来越严的封号策略。上个星期为了绕过某个平台新增的拖动验证码,我花了整整两天研究轨迹模拟算法,最后用贝塞尔曲线生成了人类鼠标移动路径才搞定。如果明天百度拿出来的东西,真的能理解语义、能连贯对话、能创作,那我这些绞尽脑汁的“分词”、“打乱”、“重组”,就像是在蒸汽机车面前炫耀自己手工打磨的马车轮子一样可笑。
我的焦虑不在于百度本身,而在于一种降维打击的可能性。我这套系统,是我2021年断尾求生、回归超级个体后,赖以生存的核心“手艺”。它让我不用再管团队那些糟心事,一个人、一台服务器就能创造现金流。它是我对抗焦虑的武器,是我“身体是第一生产力”理念的数字延伸——我健身,我的数字分身们干活。但如果AI的能力真的跨过那个临界点,我这套需要精心维护的、脆弱的自动化生态,会不会一夜之间就变得毫无价值?就像当年SEO算法大更新,多少站长的“野路子”一夜归零。
我关了后台页面,系统还在跑,下一个发布任务在半小时后。窗外一片漆黑,但我知道,某个实验室的服务器集群正轰鸣着,准备在明天扔下一颗石子。我的“国产替代”计划,替代的是过去人力堆砌的重复劳动,但很可能,它自己马上就要成为被替代的对象。这种感觉很熟悉,就像2016年死磕爬虫时,面对网站反爬策略升级的那种无力感。只不过这次,对手可能不再是某个平台的工程师,而是一个时代。














