体脂率 14% 这个数字,是我用体脂钳和 InBody 反复校准测出来的,比上个月降了 0.5%。代码库瘦身 40%,是我用 Python 脚本遍历了 2018 年那堆野路子爬虫项目,把重复的、废弃的、硬编码的垃圾逻辑全删了,顺便重构了 API 调用层。这两个数字放一起,就是我 2022 年上半年的全部:身体和代码,必须有一个是干净的,最好两个都是。
唐山那个视频,我是在一个健身教练的微信群里看到的。不是新闻推送,是群里直接炸了。接下来的 72 小时,我的所有社交信息流,从微博到知乎到 B 站,全被这件事塞满。愤怒是真实的,但那种被算法无限放大的、排山倒海的、同质化的情绪洪流,让我后背发凉。我太熟悉这套了。2016 年我做 SEO 垃圾站群的时候,干的就是类似的事:抓热点关键词,用爬虫批量生成“情绪化标题+伪原创内容”,塞进 CMS 模板,靠友链和蜘蛛池把排名顶上去。流量来了,转化?道德?关我屁事。那时候想的是,技术是刀,刀本身没善恶。
现在不这么想了。刀没善恶,但铸刀和挥刀的人有。我们这些写代码的,尤其是搞数据抓取、内容生成、推荐算法的,每一行 if-else 背后,都可能是一个情绪的放大器,或者一个信息的牢笼。唐山事件里,那些基于地理位置、社交关系链、历史点击行为做的实时推荐,像疯了一样把极端案例、情绪化评论、未经核实的信息推到每个人眼前。这不是技术中立,这是技术作恶。我们搭建了这套能瞬间点燃十亿人情绪的管道,却从来没在代码里写过“冷静期”函数,没设计过“信息多样性”的校验规则。
删那 40% 的垃圾代码时,我就在想这个。当年为了绕过反爬,我用多线程模拟不同 User-Agent,用 Selenium 渲染动态页面,甚至研究过 TLS 指纹伪装。目标很单纯:把数据扒下来,存进数据库,变现。至于这些数据被用来做什么,会不会成为某个谣言传播的燃料,我没考虑过。现在看,那些代码就像身体里的脂肪,冗余、低效,甚至有害。清理它们,不仅是技术债,更像一种道德上的赎罪。我把那些粗暴的 xpath 选择器、写死的正则匹配、为了绕过频率限制而写的无限重试循环,全删了。代码库清爽了,心里也好像卸掉一块石头。
健身也是同理。2021 年回归个人交付后,高压项目一个接一个,颈椎和腰椎一起报警。我才意识到,过去几年所谓“管理”,就是把身体熬干,去填那些永远填不满的交付坑。现在,低卡饮食和力量训练是我的另一套“代码规范”。摄入(数据输入)要干净,消耗(逻辑处理)要高效,输出(身体状态)要稳定。体脂率 14% 意味着,我的身体这台“服务器”,冗余脂肪(技术债)很少,基础代谢(系统性能)很高,能扛住突发的高压力请求(项目冲刺)。
但身体的“算法”是公平的,吃多少练多少,结果一目了然。社交媒体的算法呢?我们设计它时,KPI 只有日活、时长、互动率。没人把“社会情绪稳定性”设成一个优化目标,更没人敢把这个目标写进 OKR。结果就是,算法学会了拼命推送能刺激多巴胺和肾上腺素的内容,因为数据证明这有效。我们这群产品经理和程序员,在深夜喝着咖啡敲着键盘,讨论着如何优化一个点击率提升 0.1% 的推荐模型时,可能正在无意中给下一场舆论海啸拧开阀门。
这个月,我把一个老客户的营销自动化项目停了。他们想用爬虫抓竞品用户评论,然后用刚兴起的 GPT-3 接口批量生成“真实用户好评”去刷榜。我说这活儿不干,尾款不要了。对方觉得我疯了。我没疯,我只是不想在 40 岁的时候回头看,发现自己写的代码,成了这个时代情绪垃圾场的主要承包商。体脂率要降,代码要瘦,良心上的赘肉,更得减。
技术这行,尤其是摸到了 AI 边儿的现在,能力越大,越他妈的得自己给自己划底线。因为法律和伦理,永远跑不过代码迭代的速度。














