排序
既然写代码没出路,我就用强化学习破解了复杂的 DOM
既然写代码没出路,我就用强化学习破解了复杂的 DOM。今天下午,一个做电商数据的朋友扔过来一个网址,说这家的商品详情页结构又变了,之前用 BeautifulSoup 写的解析器彻底报废。我打开一看,...
知识的“保鲜期”:我为什么让智能体定期自检数据库
知识的“保鲜期”这个概念,今天把我坑得够呛。一个去年还跑得飞快的自动化流程,今天卡在数据验证环节死活过不去。查了半天,不是代码问题,是底层调用的那个第三方数据接口,上个月悄无声息地...
既然一个人就是一家公司,我就用 Swarm 实现了自动报税
既然一个人就是一家公司,我就用 Swarm 实现了自动报税。这种快感不是来自省了多少钱,而是来自凌晨两点,手机弹出“1月税务申报已完成,无异常”的通知时,你他妈知道背后是一串冰冷的代码在替...
既然想压榨单兵成本,我就用 DeepSeek 做了本地化部署
既然想压榨单兵成本,我就用 DeepSeek 做了本地化部署。这念头不是突然冒出来的,是看着 OpenAI API 账单上那串数字,再想想自己 40 岁还在为这点算力成本焦虑,一股火就上来了。什么技术情怀都...
代码的“安全性”:我为什么建立了一套自动化纠错逻辑
这次数据损坏的直接原因,是我在爬虫的解析函数里偷懒,用了一个过于宽泛的正则表达式去匹配价格字段。我以为能覆盖99%的情况,结果上周对方网站改版,在价格后面偷偷加了个带HTML注释的星号,...
既然数据要私有,我就自己设计了博客系统的底层表结构
既然数据要私有,我就自己设计了博客系统的底层表结构。这念头不是今天才有的,是从去年被 Notion API 坑了之后就开始盘算的。当时做自动化流程,Notion 那边一个字段类型更新,我这边几十个 n8...
内存的“压榨”:我为什么对 Rembg Pro 做了最后一次调优
内存的“压榨”这事,说到底就是跟机器抢那几毫秒和几百兆的显存。Rembg Pro 的 GPU 版本跑起来,用户反馈最集中的就两个点:大图处理慢,以及动不动就爆显存。我知道,这问题不解决,所谓“专...
我终于明白交付深度和信任才是 SaaS 的护城河
今天又跟一个做垂直工具 SaaS 的朋友聊崩了。他还在纠结怎么把 GPT-4 的 API 包装一下,加个壳就敢叫“AI 赋能”,然后涨 30% 的年费。我直接说,你这玩意儿,明年就得死。不是咒他,是现在这个...
如何让脚本写出“成都味儿”?我的语料库实验 (o1 推理版)
让脚本写出“成都味儿”,这事儿我折腾了快一个月。一开始我以为就是加几个“巴适”、“安逸”、“瓜娃子”当关键词,结果生成的东西像川普考试卷,生硬得抠脚。直到我把 o1 的推理链打开,才意...
既然 Excel 让人想吐,我就用多模态 AI 自动核对合同
今天又核对了一百多份采购合同,眼睛都快瞎了。这活儿不是人干的,甲方发来一堆扫描件,PDF 里表格歪七扭八,我得手动把关键条款抠到 Excel 里,再跟我们的标准模板逐条比对。关键是那些扫描件...










