零点洪峰过境:我的SaaS扛住了双11的并发大考,这是一人公司的胜利

零点洪峰过境,阿里云监控大屏上那条CPU占用率的曲线,像一根被拉满的弓弦,直挺挺地戳向95%的红线。阿里那边战报在喊几分钟破千亿,我这边一百多个商家客户的抽奖、秒杀、订单同步接口在零点整同时被触发,服务器在呻吟。

我提前三天就没睡过一个整觉。什么SEO、什么流量焦虑,在今晚都成了屁话。今晚只有一个真理:服务器不能崩。崩了就不是掉排名,是直接掉客户,掉口碑,掉我这个小破SaaS的命。我那些野路子爬虫技巧、Axure画的原型,此刻都帮不上忙,能靠的只有我提前埋好的那几个脚本。限流降级的逻辑很简单粗暴:非核心的查询请求,比如用户浏览历史、活动页面装饰元素加载,一旦超过阈值就直接返回一个静态兜底页,或者干脆丢进队列延迟处理。核心的交易链路——下单、支付回调、库存扣减——必须用独立的线程池和Redis缓存护住。最怕缓存穿透,我用了布隆过滤器的前置校验,无效的请求在进Redis之前就被挡掉,虽然误杀率可能有千分之几,但比起数据库被瞬间打穿,这代价微不足道。

峰值持续了十七分钟。那十七分钟里,我盯着不断刷新的错误日志,看着被主动抛弃的请求计数往上跳,手心全是汗。有几个商家设置的秒杀活动太狠,瞬间请求量超出了我预设的二级限流阈值,触发了熔断。后台警报响了,我手动把他们的活动页面静态化,暂时关闭了实时库存显示。这是断臂求生,我知道明天肯定会有抱怨,但比起整个系统雪崩,这只能算皮外伤。当CPU曲线开始扭头向下,缓慢回落到60%以下时,我才感觉到后背的衬衫已经湿透了,紧紧贴在椅背上。

瘫在椅子上,脑子里一片空白,然后是一种近乎虚脱的狂喜。没有团队,没有运维,就我一个人,一台云服务器,一堆自己写的脚本,扛过了双十一零点的洪峰。这种用纯粹的技术逻辑对抗物理极限的感觉,比赚多少钱都他妈刺激。什么管理,什么扩张,都是狗屁。这一刻我无比确信,代码不会背叛你,你给它什么指令,它就给你什么结果。这种掌控感,是组建团队、陷入无尽沟通和交付泥潭后永远失去的东西。

SaaS的稳定性承诺(SLA)不是合同里的一行字,是今夜这十七分钟里每一毫秒的决策。赢了,客户觉得理所应当;输了,万劫不复。这场一人公司的胜利,代价是我未来三个月都不想再看见监控大屏。但值了。至少证明,在2018年,一个焦虑的独狼,靠死磕技术,还能在巨头的阴影下,守住自己的一小块阵地。虽然我知道,这种玩法不可持续,体力终有耗尽的一天。但今晚,让我先享受这片刻的、属于手艺人的尊严。

© 版权声明
THE END
喜欢就支持一下吧
点赞98 分享