排序
抓取知乎Live数据:看看大V们到底赚了多少钱
窗外是上海凌晨三点的寂静,路灯把梧桐树的影子拉得很长,投在空无一人的街道上。我坐在出租屋的电脑前,屏幕的光映在脸上,手边是第三杯冷掉的速溶咖啡。知识付费的风吹得震天响,朋友圈里到处...
玩点野的:用抓包工具逆向分析单车App的位置数据
窗外又飘起雨,路灯把湿漉漉的柏油路面照得发亮。我坐在书桌前,屏幕上是 Charles 那个熟悉的灰色界面。32 岁了,还在干这种事。但没办法,好奇心像猫爪子一样挠着。满大街的橙色、黄色单车,它...
重新搭个WordPress:抛弃执念,用最土的方法搞流量
窗外是深圳凌晨三点的雨声,咖啡已经凉透了。我盯着屏幕上自己写了三个月的“完美CMS系统”的代码,突然觉得这一切都他妈的可笑。32岁了,还在纠结架构的优雅和代码的复用性?流量呢?钱呢?用...
试水火车头采集器:不懂技术也能玩转的流量神器
窗外是上海凌晨三点的夜色,电脑屏幕的光映在脸上有些发烫。刚写完一个对付某网站动态加载的Scrapy中间件,手指因为长时间敲击键盘而有些僵硬。三十二岁,还在用最原始的方式,一行行代码去扣取...
结合长尾词词库,用Python批量生成内容模板
窗外是深圳南山区凌晨三点的寂静,路灯的光晕在薄雾里化开。我盯着屏幕上爬下来的最后一批长尾词数据,三十二岁的身体里,某种近乎偏执的兴奋感在血管里窜动。做垂直赛道,别人想的是怎么砸钱买...
分析竞争对手的网站架构:一个Python脚本看透你的底牌
窗外是上海凌晨三点的寂静,只有键盘声在响。三十二岁,还在用这种最原始的方式去“看”对手,想想有点可笑。但没办法,那个做了十年的老站,像块石头一样压在搜索结果第一页,我得知道它到底凭...
拥抱信息流:用Python监控头条热门爆款的特征词
窗外是上海漕河泾软件园凌晨三点的灯光,几台显示器幽幽地映着我的脸。三十二岁,一个不上不下的年纪,焦虑像藤蔓一样从胃里往上爬。别人在睡觉,我在写爬虫。今天的目标是今日头条的热门榜单,...
给我的小网站加点料:用第三方API实现简单的内容推荐
窗外是上海漕河泾软件园傍晚特有的那种安静,办公楼里的灯一盏盏暗下去。我盯着屏幕上那个孤零零的WordPress后台,心里那股子焦虑又上来了。32岁,还在跟一个日访问量不到五百的小破站死磕,说...
数据的清洗与脱敏:实战百万级用户数据的基本操守
窗外是深圳南山区凌晨三点的寂静,只有机箱风扇的低鸣在房间里回荡。屏幕上,刚刚跑完的Python脚本吐出了最后一行日志:“Crawling finished. Total records: 1,203,457。”一百二十万条数据,...
跑通第一个完整的自动化挂机闭环:我的Q1期末作业
凌晨三点半,咖啡已经凉透了。屏幕的光映在脸上,我盯着终端里那个绿色的“OK”标志,足足看了五分钟。三十二岁,感觉像在等一个新生儿的第一声啼哭。 然后它动了。 不是那种惊天动地的动。是安...










