窗外是深圳凌晨三点的雨声,咖啡机早就空了。我盯着屏幕上的爬虫日志,第127次抓取失败。32岁,还在写这种脚本,是不是有点可笑?
但这就是起点。Flovico.cn 从来不只是个博客。它是我在互联网上唯一能完全掌控的资产。那些年给平台写内容,流量说没就没,规则说改就改。像条狗一样追着算法跑,最后连根骨头都剩不下。
我得有个自己的地盘。
技术选型就纠结了半个月。WordPress 太重,Hexo 太轻。最后选了 Typecho,就因为它够简单,代码我能全看懂。但简单意味着什么都要自己动手。那天为了一个 RSS 全文输出功能,我对着 PHP 手册查到天亮。不是不会用插件,是怕插件一更新,整个站又崩了。这种控制欲很病态吗?也许是。但当你经历过公众号文章因为“技术原因”消失,当你看着知乎回答被折叠连个通知都没有——你就会明白,把内容存在别人服务器上,等于把命脉交出去。
更关键的是数据闭环。我在博客每篇文章底部都埋了统计代码,不只是看 PV。我要知道用户从哪个关键词进来,在页面停留多久,最后点击了哪个链接离开。这些数据在第三方平台里,永远只是他们报表里的一行数字。但在我自己的服务器上,它们是活的。我能用 Python 脚本分析,能画出用户路径图,能知道那篇讲“Python 异步爬虫”的技术文,居然吸引了不少想学编程的家庭主妇。这个发现让我愣了很久。
流量从哪来?早期全靠 SEO 硬啃。那时候还没这么卷,但已经够难受了。为了一个“Python 教程”的长尾词,我写了八千字的系列,手动做了三十多个内部链接。朋友说你这效率太低了,用工具群发不就行了?我试过。结果就是被百度降权,三个月没收录。那段时间每天查收录量,像得了强迫症。最后明白一件事:搜索引擎要的不是快,是稳定。你得像个老农,每天浇一点水,除一点草,它才会慢慢信任你。
信任。这个词在2016年的互联网上,已经快成古董了。
有时候半夜改完 CSS,看着博客在手机和电脑上显示得整整齐齐,会有种奇怪的满足感。这满足感很虚,不能变现,不能带来新客户。但它让我觉得,我在建造什么东西。哪怕它现在只是个几十个日活的小站。至少,这里的每一行代码、每一个字,都听我的。
最讽刺的是,我靠给企业做 SEO 方案赚钱,却在自己的博客上坚持最“笨”的方法。因为我知道,那些速成技巧迟早会反噬。流量可以买,内容可以洗,但一个能持续带来精准用户的入口,必须用时间和真实价值去换。虽然……我也不知道要换多久。
雨好像停了。天快亮了吧。
也许再过几年回头看,这个博客依然没什么流量。但至少它还在那里。像一个锚点,把我钉在互联网的某个坐标上。别人通过搜索找到它,读到我写的东西,然后离开——这个过程里,没有任何中间商抽成,没有算法决定他们该看什么。这本身,就已经是某种自由了。
虽然为了这点自由,我得自己扛服务器费用,自己写备份脚本,自己对付莫名其妙的攻击。值吗?
咖啡因的劲头过了,头疼得厉害。但后台显示,那篇关于 Scrapy 中间件的文章,刚才又有了个新访问。来源关键词是:“如何爬取需要登录的网站”。
我揉了揉眼睛,打开编辑器。也许,该写篇续集了。














