排序
瞧不上直播的体力活?我用TTS和循环视频搞了个24小时无人直播间
瞧不上直播的体力活?我他妈就是瞧不上。每天熬到凌晨两三点,扯着嗓子喊“家人们”,嗓子哑了还得上,这种纯体力消耗的活儿,在我看来就是原始。我承认直播带货转化率吓人,但我这身板,这性格...
数据的“干净度”:我为什么开始重视单元测试
数据“干净度”这词儿,是我上周盯着数据库里那堆乱码和重复条目硬生生憋出来的。凌晨两点,客户在群里发了个截图,问“为什么这个商品价格采集出来是负数?”,我后背瞬间就湿透了。不是紧张,...
当我开始写管理手册,我就知道那个极客 Flovico 死了
当我开始写管理手册,我就知道那个极客 Flovico 死了。这玩意儿写了给谁看呢?我自己吗?我他妈连自己都管不住了。但没办法,上个月招的第三个前端又跑了,理由是“工作流程不清晰,沟通成本太...
ZAO App 一夜爆火:Deepfake 的平民化与危险信号
ZAO App 一夜爆火,我的朋友圈和几个产品群全炸了,都在传那个用一张正脸照片就能换进经典影视片段里的视频。我第一时间就下载了,不是为了玩,是职业病,想看看它怎么实现的。这玩意儿本质上就...
多线程采集的瓶颈:不是带宽,是人心的耐心
多线程采集的瓶颈从来不是带宽,是人心的耐心。客户今天说只要商品标题和价格,我吭哧吭哧把爬虫调度器写好了,用asyncio搞了五百个并发,代理池轮转得跟风火轮似的。明天他一个电话过来,说“F...
百度“惊雷算法”2.0 后的生存:关键词密度已经死了
百度“惊雷算法”2.0 更新日志一出来,我就知道之前那套堆关键词的老办法彻底完蛋了。什么3%-8%的黄金密度,现在往文章里硬塞就是找死,蜘蛛爬过去直接给你权重清零,连降权都省了,直接不收录...
上海强制垃圾分类第一天,我连夜上线了识别脚本
上海强制垃圾分类第一天,我连夜上线了识别脚本。这玩意儿本质上就是个缝合怪,用 requests 库爬了官方发布的分类名录,存成个本地 JSON 数据库,前端用 Flask 搭了个简陋页面,核心是调了某云...
双 11 前夜的流量突袭:我的防盗链策略
双 11 前夜的流量突袭,本质上是一场成本与意志的消耗战。凌晨一点半,服务器监控的告警短信像催命符一样响个不停,带宽曲线直接拉成 90 度角往上飙。我那个刚有点起色的在线 PDF 转换工具站,...
应对SaaS的“过路费”:在服务器上自建开源的GitLab和监控系统,省下第三方费用
看着公司这个月又新增的几千块第三方服务账单,我他妈肺都要气炸了。代码托管、服务器监控、邮件推送,每一项都像温水煮青蛙,等你反应过来,已经是一笔巨大的固定开销。巨头们收租的逻辑太清晰...
用代码实现“健身自由”:我的卡路里自动化看板
这玩意儿本质上是个自虐系统。我写了个爬虫每天凌晨三点去抓我体脂秤的数据,再用Selenium模拟登录Keep把运动时长扒下来,最后用Python的schedule模块搞了个定时任务把数据怼进Airtable。整个流...










