排序
当爬虫遇到“验证码 2.0”:这不仅是代码的较量,是成本的战争
当爬虫遇到“验证码 2.0”,我才真正意识到,技术对抗已经演变成一场赤裸裸的成本消耗战。极验的滑块验证刚出来那会儿,我还在用传统的 OCR 库加图像处理硬刚,成功率从 90% 暴跌到 30% 以下,...
用代码实现“健身自由”:我的卡路里自动化看板
这玩意儿本质上是个自虐系统。我写了个爬虫每天凌晨三点去抓我体脂秤的数据,再用Selenium模拟登录Keep把运动时长扒下来,最后用Python的schedule模块搞了个定时任务把数据怼进Airtable。整个流...
放弃幻想:我用Python写了个微信群自动抓取脚本
窗外是上海凌晨三点的寂静,路灯把梧桐树的影子拉得很长,投在写字楼的玻璃幕墙上。我坐在电脑前,屏幕的光映在脸上,手边是第三杯冷掉的速溶咖啡。32岁,一个产品经理,本该在画原型图、写PRD...
玩点野的:用抓包工具逆向分析单车App的位置数据
窗外又飘起雨,路灯把湿漉漉的柏油路面照得发亮。我坐在书桌前,屏幕上是 Charles 那个熟悉的灰色界面。32 岁了,还在干这种事。但没办法,好奇心像猫爪子一样挠着。满大街的橙色、黄色单车,它...
用Python监控主流交易所的比特币价格波动曲线
窗外是深圳南山区科技园凌晨三点的灯火,稀疏,但固执地亮着。我揉了揉发酸的眼睛,屏幕上的Python终端还在稳定地吐着数据流。三十二岁,一个尴尬的年纪,卡在技术狂热和现实骨感之间。勒索病毒...
锁定B端猎物:用Python自动化抓取全城企业黄页数据
窗外是成都七月的闷热,空调外机嗡嗡作响,像是我脑子里那根绷紧的弦。32岁,坐在这个租来的小办公室里,我盯着屏幕上企查查那个“联系电话”字段,它显示着一堆乱码似的字符。不是数字,是些“...
对抗微信反爬:实战抓取公众号阅读数和点赞数用于竞品分析
窗外是上海凌晨三点半的寂静,只有机箱风扇的低鸣在回应我。三十二岁,一个本该安稳的年纪,我却像个独狼黑客,蹲守在数据战场的边缘,目标直指微信生态里最核心的指标——公众号文章的真实阅读...
戳破无人便利店神话:用OpenCV跑个最基础的人脸/物体检测有多难?
这行代码我敲了第三遍,还是报同样的内存溢出错误。 为了证明那些吹嘘“深度视觉识别”的无人便利店在扯淡,我决定自己动手。不就是调用个OpenCV吗?我甚至没打算训练自己的模型,就用现成的Haa...
告别第三方接口依赖:重写爬虫,从“粗放抓取”转向“智能解析”
手指敲下最后一行模拟鼠标移动轨迹的代码,屏幕右下角的IP代理池监控窗口又红了三个。妈的,这已经是今天报废的第17个代理IP了。不是被302重定向到验证码页面,就是直接返回空数据包——对方服...
既然人靠不住,那就把所有的 SOP 封装进软件
既然人靠不住,那就把所有的 SOP 封装进软件。今天下午,那个刚招来两个月、信誓旦旦说能搞定微信生态运营的小伙子,又他妈给我撂挑子了。理由是他觉得“重复性工作没有成长性”。我看着他工位...










