排序
逆向分析微信“看一看”的点赞权重:写个爬虫追踪文章的二次传播曲线
既然“在看”这么重要,必须用数据摸透它的传播规律。我花了三天,用Mitmproxy在安卓模拟器上搭了个中间人环境,专门抓我自己的手机。难点不在证书,在于微信的请求是加密的,而且参数里一堆时...
尝试自动化剪辑Vlog:用FFmpeg拼接短视频碎片的灾难级观影体验
我他妈又干了一件蠢事。为了证明我不出镜、不拍视频也能蹭上 Vlog 这趟车,我再次祭出了我最引以为傲的武器:写代码。结果就是,我亲手制造了一坨视觉垃圾,并且把它发布了出去,现在后台全是骂...
那些消失的“伪原创”神效:百度算法升级后的惨案
那些“伪原创”神效消失得比想象中快。上周流量曲线像被砍了一刀,垂直往下掉,我盯着百度统计后台,胃里一阵发紧。不是缓慢下滑,是断崖。我第一反应是服务器挂了,查了一圈屁事没有,然后才意...
爬虫、伪原创与搜索引擎的“猫鼠游戏”
爬虫、伪原创和搜索引擎,这三者之间的猫鼠游戏,本质上是一场关于“内容价值”的零和博弈。我今天花了整整六个小时,试图用当时最新的语义理解模型,比如 BERT 的变种,去生成一篇关于“冬季汽...
训练营自动化:用脚本自动拉群、踢人与沉淀每日打卡数据
训练营自动化这套脚本的核心就一个:用机器执行代替人工讲人情,把沉没成本变成极限施压的工具。我那做职业考证培训的客户,训练营客单价三千,一期三百人,完课率不到50%。助教每天花四小时在...
服务器大扩容:用自动化脚本迎战双11的零点并发洪峰
服务器大扩容,意味着今晚零点前必须把自动扩缩容脚本的每一个if-else都跑通。SaaS后台显示,超过三百家B端商户绑定了双11活动,他们的抽奖、发券、积分兑换全挂在我的API上。去年这时候我还在...
远程办公的幻觉:带不动的人,在哪都带不动
远程办公的幻觉,本质上是对人性懒惰和沟通惰性的严重低估。上个月为了省下每月两万八的办公室租金,我拍板让团队全部回家干活,结果不到三周,项目进度直接瘫痪。 问题根本不是技术工具。钉钉...
既然员工靠不住,我尝试用 Python 自动化了人事管理
既然员工靠不住,我尝试用 Python 自动化了人事管理。这个念头是在上周三凌晨,盯着后台那个又延期了三天的项目进度表时冒出来的。我受够了每天追着人问“进度怎么样了”,也受够了那些“快了快...
我用 Python 写了一个“体能管理”脚本,提醒自己该去跑步了
这脚本的核心逻辑是:如果今天步数没达标,就自动从我的微信零钱里转 200 块钱给我老婆。不是开玩笑,真转。 2019 年到现在,身体状态断崖式下跌。以前通宵改原型,第二天灌两杯冰美式还能接着...
爬虫的伦理边界:在灰色地带行走的最后警告
爬虫的伦理边界?这词儿现在听起来真他妈讽刺。昨天下午三点,我们用来抓取“优品汇”商品数据的整个 C 段 IP,192.168.23.0/24,被对方防火墙永久拉黑了。不是单个IP,是整个段。这意味着我们...










