排序
既然数据是核心资产,我就用 n8n 把十年的博客连上了向量库
这个项目终于跑通了。我坐在电脑前,看着自己过去十年写的几百篇博客,现在能通过一个搜索框,用自然语言找到任何一篇里提过的细节,而不是靠记忆里的关键词。这感觉,有点像给自己的大脑外接了...
既然不能出国,我就用智能体集群自动抓取并分发了海外需求
这活儿搁五年前我得雇三个人干,现在一个 n8n 工作流加三个智能体就搞定了。核心就三件事:抓、改、发,但每个环节的坑都能让传统爬虫工程师掉层皮。 先说抓。海外需求源我选了三个:Indie Hack...
既然采集数据又坏了,我就逼 AI 写了极高强度的回归测试
数据又坏了,这次不是 API 频率限制,也不是反爬策略升级,是我自己写的清洗逻辑里一个该死的边界条件没处理好。凌晨两点半,看着数据库里那堆被错误截断、字段错位的脏数据,胃里一阵翻腾。这...
既然不想被情绪内耗,我就用最新 RAG 做了一个永远准时的客服
既然不想被情绪内耗,我就用最新 RAG 做了一个永远准时的客服。今天下午三点,一个老客户在群里@我,问一个关于 n8n 工作流里 OpenAI 函数调用传参格式的问题。搁两年前,我肯定秒回,然后陷入...
我写了一个“自动化复盘”脚本,把这十年的往事固化成永恒
今天这个脚本跑通了,它把我过去十年写的三千多篇博客全喂给了 Claude 3。不是那种简单的关键词提取,是让 AI 一个字一个字地读,然后告诉我,这十年我到底在折腾什么。 我盯着终端里滚动的日志...
数据的“安全性”:我为什么开始构建自动化纠错逻辑
数据的安全性,今天想聊的根本不是加密或者防火墙,而是更底层的东西:代码逻辑漏洞导致的采集数据结构性损坏。上周一个爬虫任务跑了三天,入库时才发现因为目标网站一个不起眼的CSS类名变更,...
数据的“信噪比”:我为什么开始重视自动化数据清洗
RAG 的幻觉问题,一半是模型的问题,另一半是喂进去的数据本身就是一锅馊饭。今天被一个客户案例打脸了,他们用自己那套混乱的 CRM 对话记录做知识库,问个标准流程,AI 能给你编出三个版本,还...
如何让 AI 写出“成都味儿”?我的 Claude 3.5 方言实验
让 AI 写出“成都味儿”这事,本质上是在对抗大模型的“普通话霸权”。我拿 Claude 3.5 开刀,不是因为它不行,恰恰是因为它太“行”了——行得过于标准、过于礼貌,像个从没在玉林路烧烤摊喝过...
既然划掉了“招聘”计划,我就用推理模型训练了一个会吐槽的客服分身
划掉“招聘”那两个字的时候,笔尖把纸都戳破了。不是愤怒,是解脱。2019年那会儿,我招过三个人的小团队,结果呢?每天80%的精力在管人,催进度、安抚情绪、解释为什么客户的需求像一坨不断膨...
代码的“健壮性”:我为什么开始让 AI 自动写测试用例
这次数据损坏的直接原因是一个边界条件没处理好,爬虫在解析某个商品页的 DOM 树时,因为商家把“库存”字段写在了两个不同的 div 里,我的正则匹配到了第一个就返回了,结果那个 div 里写的是...










