618大促的峰值流量终于过去了。我盯着监控面板上那条代表CPU使用率的曲线,从触目惊心的90%红线缓缓滑落到40%的绿色区域,整整七分钟,没敢眨眼。阿里云后台的账单估计会很难看,但值了——我的几十个B端客户,他们的店铺、订单、库存同步,在零点那波洪峰里没崩。一个报错的工单都没有。
这感觉就像你一个人守着一座随时会决堤的土坝,手里只有几把铁锹和一堆自己写的破烂脚本,而对岸是灯火通明、机械轰鸣的正规军大坝。他们有成建制的运维团队,有云厂商的架构师贴身服务,有预案ABCDEFG。我有什么?三台按量付费的ECS,一台负责核心业务,一台做缓存和队列,还有一台是随时准备顶上去的“敢死队”。扩容脚本是用Python写的,逻辑粗暴到不好意思给人看:监控到CPU连续30秒超过85%,就调用阿里云API,克隆那台预装了基础环境的镜像,挂载到负载均衡后面。缩容更粗暴,凌晨三点流量低谷,直接关机释放。
真正的压力测试从来不在实验室里。你永远不知道客户会怎么用你的东西。有个卖母婴用品的客户,他的运营在零点整手动执行了“全店商品历史订单导出”,这个查询差点直接打满数据库连接池。告警邮件瞬间弹出来,我一边手抖着在终端里杀那个慢查询,一边祈祷自动扩容脚本别在这个时候掉链子。脚本得先判断实例状态,再调用API,阿里云那边创建实例、初始化、启动服务,至少需要两分钟。这两分钟,就是生死线。我当时脑子里闪过的念头是,如果这次崩了,明天就得面对至少五个客户的退款和索赔,这个刚有点起色的SaaS项目可能就直接归零了。
所以当曲线开始回落,所有服务状态灯都倔强地绿着的时候,那种疲惫感是带着甜味的。你打赢了一场根本没人知道发生了的战斗。没有掌声,没有战报,唯一的观众就是这满屏的监控图表。你维护的也不是什么了不起的系统,无非是帮中小卖家同步一下平台订单、管管库存,但你知道,就在刚才,可能有几千个真实的包裹因为你这套系统的“未宕机”而顺利生成了。这种价值感很虚幻,又很具体。
喝了一口早就冷掉的速溶咖啡,胃里一阵抽搐。看看时间,凌晨一点半。窗外当然是一片漆黑,但我不想描述它。我只知道,明天,不,是今天白天,我可以平静地打开电脑,回复客户那些关于“功能能不能再加一个”的日常需求,而不是面对一片狼藉的服务器日志和愤怒的来电。对于一个Solo Founder来说,这种平静,就是最大的奢侈和胜利。技术人的狂欢,从来都是静默的。你所有的成就感,都封装在那条平稳的曲线里,只有你自己看得懂。














