既然不想买高价显卡,我就在国产算力芯片上跑通了 RAG
既然不想买高价显卡,我就在国产算力芯片上跑通了 RAG。这话说出来自己都觉得有点魔幻,但确实是今天下午四点二十七分,在昆仑芯的卡上,看着日志流最后一行跳出“retrieval success”时,我脑...
苹果 iPhone 17 发布:AI 真的让手机变成“器官”了吗?
苹果 iPhone 17 发布,铺天盖地的“AI 器官论”又来了。我关掉发布会直播,打开自己正在用 n8n 和 OpenAI API 封装的那个本地化客户服务自动化流程,看着里面错综复杂的节点和条件判断,突然觉...
既然不想招客服,我就用 GPT-4o 封装了“全自动化售后”
既然不想招客服,我就用 GPT-4o 封装了“全自动化售后”。这念头不是凭空来的,是上个月被一个傻逼客户连续三天半夜打电话问同一个弱智问题给逼出来的。招人?开什么玩笑,2019年那会儿组团队搞...
既然不想买高价显卡,我就在代码里优化每一个 Token(年终版)
既然不想买高价显卡,我就在代码里优化每一个 Token。这话说出来,自己都觉得有点悲壮,像是个守着老手艺不肯放下的匠人,眼睁睁看着隔壁用上了全自动流水线。 今天跟团队里一个 97 年的后端聊...
既然不能去外地,我就用爬虫抓取全球的 AI 实战案例(2024总结版)
既然不能去外地,我就用爬虫抓取全球的 AI 实战案例。这句话现在听起来像个笑话。2023年5月,我还在用老本行对抗新世界,以为多抓几个案例就能缓解恐慌。到了2024年底回头看,那根本不是缓解,...
Llama 4 发布前夕:开源社区的“最后反击”还是“全面胜利”?
苹果发布会刚结束,M3芯片的神经网络引擎算力又翻了一倍。我盯着屏幕上的性能曲线图,脑子里算的不是换不换新Mac,而是Rembg Pro的抠图速度能快多少毫秒。 这玩意儿是我年初用PyTorch和ONNX Run...
39岁,我在成都 40 度的热浪里,感受代码的冰冷
39岁,我在成都40度的热浪里,感受代码的冰冷。空调开到18度,汗水还是从太阳穴往下淌,不是热的,是焦虑催出来的。左手推着20公斤的哑铃,肱三头肌在发抖,右耳塞着AirPods,里面一个硅谷口音...
既然特朗普赢了,我的出海 SaaS 必须开启“去中心化”
特朗普又赢了。这次不是总统,是那个 NFT 交易卡。荒诞感扑面而来,但背后那条线越来越清晰:中心化的叙事正在被一个个击穿。我的出海 SaaS,客户有一半在北美,数据还老老实实放在 AWS 弗吉尼...
既然不想买高价显卡,我就在代码里优化每一个 Token(终极版)
既然不想买高价显卡,我就在代码里优化每一个 Token。这话说出来,自己都觉得有点悲壮。双十一刚过,朋友圈里晒的不是订单,是各种“流量红利彻底消失”的焦虑文章。大盘数据确实难看,用户增长...
数据的“干净度”:我为什么开始重视向量数据库的“动态清洗”
数据的“干净度”这玩意儿,以前我根本不当回事。爬虫时代,能抓到就是胜利,脏数据扔给实习生或者写个正则糊弄一下,反正下游业务方也分不出来。但现在不行了,大模型喂进去的是垃圾,吐出来的...











