排序
搜索引擎的寒冬,是个人的春天吗?
百度今天的算法更新公告又来了,这次是“惊雷算法3.0”,专门打击跨站采集和恶意构造聚合页。我盯着屏幕,感觉胃里一阵抽搐。这已经是今年第三次大调整了,每次调整,手里那几个靠长尾关键词吃...
2019 最后一版自动化框架上线:为了那个即将到来的十年
这破框架终于能跑起来了,我把最后一行监控日志的阈值调到了 99.5%,低于这个数就自动发邮件给我。不是为了完美,是为了能让我在 2020 年睡个安稳觉。 2019 年我最大的教训就是,人比代码难管一...
用代码实现“冬至节”的仪式感:我的自动送礼脚本
冬至这节气,在北方是吃饺子,在南方是吃汤圆,在我这儿是 300 封定制邮件和 50 份顺丰快递单。仪式感?对,用 Python 写的。 去年这时候我还在手动整理客户名单,复制粘贴祝福语,复制到眼瞎。...
用代码实现“冬至节”的仪式感:我的自动送礼脚本
冬至这节骨眼上,人情债比技术债难还。去年这时候我还在吭哧吭哧手动发祝福,今年团队扩张了,客户名单滚到了三百多个,再这么干我得死在微信上。所以上个月就逼着自己写了这套自动化系统,核心...
既然 AI 还没那么聪明,那我就写个更聪明的规则引擎
这玩意儿根本不是什么“规则引擎”,就是个正则表达式加一堆 if-else 的缝合怪。但对付那些乱七八糟的客户数据,它比任何花里胡哨的 AI 都管用。 客户扔过来一个 3G 的 Excel 文件,打开直接卡...
我的 2019 编程日志:这一年我写了多少垃圾代码?
删了,全删了。今天下午把那个为“管理团队”而写的内部协作系统整个代码库从Git里永久删除了,连备份都没留。命令行敲下 rm -rf 的时候,手指头都在抖——不是舍不得,是恨自己当初为什么写了...
高德发布“室内地图”:数据的精细化采集还有多少坑?
高德发布“室内地图”,这消息让我在办公室盯着屏幕愣了好几秒。不是因为它多震撼,而是它精准地戳中了我最近半年的焦虑核心:数据的精细化采集到底还有多少坑没填上?我们团队接的那个连锁餐饮...
用代码实现“健身自由”:我的卡路里自动化看板
这玩意儿本质上是个自虐系统。我写了个爬虫每天凌晨三点去抓我体脂秤的数据,再用Selenium模拟登录Keep把运动时长扒下来,最后用Python的schedule模块搞了个定时任务把数据怼进Airtable。整个流...
爬虫、伪原创与搜索引擎的“猫鼠游戏”
爬虫、伪原创和搜索引擎,这三者之间的猫鼠游戏,本质上是一场关于“内容价值”的零和博弈。我今天花了整整六个小时,试图用当时最新的语义理解模型,比如 BERT 的变种,去生成一篇关于“冬季汽...
既然不想招人,我就把所有的流程都写进 Docker
既然不想招人,我就把所有的流程都写进 Docker。这话说出来,一半是赌气,一半是绝望。团队扩张到第七个人,我他妈每天不是在开会,就是在去开会的路上。张三的代码跑不通李四的环境,王五的测...










