排序
数据的“安全性”:我为什么开始构建自动化纠错逻辑
数据的安全性,今天想聊的根本不是加密或者防火墙,而是更底层的东西:代码逻辑漏洞导致的采集数据结构性损坏。上周一个爬虫任务跑了三天,入库时才发现因为目标网站一个不起眼的CSS类名变更,...
既然不想回消息,我就用语义匹配搞定了自动回复
既然不想回消息,我就用语义匹配搞定了自动回复。今天又处理了三个客户关于“发票抬头怎么改”的重复问题,一模一样的话术我复制粘贴了三次,感觉自己的时间像被扔进了碎纸机。不是他们烦,是我...
既然云端太贵,我就在 Apple Silicon 上压榨性能
云端 API 的账单快把我逼疯了。这个月光是调用 GPT-4 和 Claude 的接口就烧掉一台 Mac mini 的钱,关键是每次请求发出去,等回复的那几秒,我脑子里都在自动换算成人民币——这根本不是创作,这...
既然员工不懂人情世故,我就让 AI 去识别客户的“愤怒指数”
既然员工不懂人情世故,我就让 AI 去识别客户的“愤怒指数”。这念头是昨天半夜盯着客服后台数据冒出来的,一个客户在十分钟内发了十七条消息,从“你们这个功能怎么回事”一路升级到“我要投诉...
数据的“信噪比”:我为什么开始重视自动化数据清洗
RAG 的幻觉问题,一半是模型的问题,另一半是喂进去的数据本身就是一锅馊饭。今天被一个客户案例打脸了,他们用自己那套混乱的 CRM 对话记录做知识库,问个标准流程,AI 能给你编出三个版本,还...
既然文字不再值钱,我就把十年的博客喂给了本地模型
既然文字不再值钱,我就把十年的博客喂给了本地模型。硬盘里那三千多个.md文件,从2016年Axure原型拆解到2023年LangChain踩坑实录,加起来快两个G的纯文本,在今天的AI眼里就是一堆廉价燃料。以...
既然不想手填 Excel,我就用 GPT-4o 写了个“自检循环”
客户甩过来一摞手写体检单,让我把数据录入系统。扫了一眼,血压、血糖、尿酸,字迹跟医生开的药方似的,龙飞凤舞。第一反应是骂娘,这得录到猴年马月?时间就是金钱,我这把年纪(39了)的时薪...
既然买不到高配,我就在国产办公本上跑 AI 模型 (剪枝版)
既然买不到高配,我就在国产办公本上跑 AI 模型。这话说出来自己都觉得有点悲壮,但这就是 2024 年的现实。英伟达的卡?想都别想。别说 4090,连 3060 都成了理财产品。看着那些动辄几万块的 AI...
代码的“健壮性”:我为什么开始让 AI 自动写测试用例
这次数据损坏的直接原因是一个边界条件没处理好,爬虫在解析某个商品页的 DOM 树时,因为商家把“库存”字段写在了两个不同的 div 里,我的正则匹配到了第一个就返回了,结果那个 div 里写的是...
既然要做本地化,我就连夜给原型接入了成都方言识别
既然要做本地化,我就连夜给原型接入了成都方言识别。这玩意儿根本不是技术问题,是产品经理的尊严问题。客户在会议室里用川普说“打开那个文件”,我的原型像傻子一样沉默了三秒,然后弹出一句...










