排序
进军短视频测试:用Python+FFmpeg自动合成带BGM的垃圾视频
窗外是上海凌晨三点的寂静,只有机箱风扇的低鸣在回应我。桌上散落着几张草稿纸,上面画满了FFmpeg命令行的各种参数组合,像某种神秘的符文。我,32岁,一个试图用代码对抗整个内容生态的独狼。...
对抗微信反爬:实战抓取公众号阅读数和点赞数用于竞品分析
窗外是上海凌晨三点半的寂静,只有机箱风扇的低鸣在回应我。三十二岁,一个本该安稳的年纪,我却像个独狼黑客,蹲守在数据战场的边缘,目标直指微信生态里最核心的指标——公众号文章的真实阅读...
咬牙租下GPU云服务器:艰难跑通第一个RNN文本生成模型
窗外是上海凌晨三点的寂静,只有机箱风扇在嘶吼。我盯着屏幕上那行“CUDA driver version is insufficient for CUDA runtime version”的报错,感觉太阳穴在突突地跳。这是第三个晚上了,就卡在...
放弃幻想:我用Python写了个微信群自动抓取脚本
窗外是上海凌晨三点的寂静,路灯把梧桐树的影子拉得很长,投在写字楼的玻璃幕墙上。我坐在电脑前,屏幕的光映在脸上,手边是第三杯冷掉的速溶咖啡。32岁,一个产品经理,本该在画原型图、写PRD...
放弃追热点:用脚本全自动挖掘知乎长尾的医疗/法律问题
窗外是上海凌晨三点的寂静,只有机箱风扇的低鸣在回应我。刚刚过去的六月高考热点,像一场绚烂却短命的烟花,流量曲线冲上顶峰又急速坠落,留下满屏狼藉和一种掏空般的疲惫。我盯着屏幕上那些断...
结合长尾词词库,用Python批量生成内容模板
窗外是深圳南山区凌晨三点的寂静,路灯的光晕在薄雾里化开。我盯着屏幕上爬下来的最后一批长尾词数据,三十二岁的身体里,某种近乎偏执的兴奋感在血管里窜动。做垂直赛道,别人想的是怎么砸钱买...
与验证码死磕:接入打码API让自动化脚本长出眼睛
窗外是深圳南山区凌晨三点的灯火,稀疏的几盏,像没睡醒的眼睛。我瘫在转椅里,屏幕上是第无数次失败的请求返回。又是一个“Sign Error”。手边的烟灰缸早就满了,烟蒂堆成一座绝望的小山。三十...
证明算法作恶:用Python挂机监控同一酒店的千人千面定价
窗外是深圳南山区凌晨三点的灯火,稀疏的几盏,像没睡醒的眼睛。我坐在出租屋的电脑前,屏幕的光映在脸上,三十二岁的脸,有点油。桌上摊着半包红双喜,烟灰缸里塞满了烟蒂,像某种奇怪的现代雕...
翻越流量柏林墙:用Python+图像处理自动生成“抖音口令码”海报
这套脚本的核心逻辑其实很脏,但有效。微信的文本风控像一堵密不透风的墙,链接、关键词、甚至特定数字组合都会被瞬间吞掉。但图片,至少在2018年这个节点,还是相对宽松的“法外之地”。抖音的...
实战演练:用NLP情感分析挖掘推特/微博上的世界杯伪球迷热点
伪球迷才是流量大盘,真球迷聊战术那点搜索量连塞牙缝都不够。今晚跑完了分布式爬虫抓下来的比赛时段数据,NER模型抽出来的实体和情感分析跑出来的倾向,结论就一句话:越位规则没人关心,大家...










