百度发布“自由画布”与“iRAG”：大厂在卷场景，我在卷“深度”-Flovico-AI商业实战教练

百度今天那场发布会我全程开着后台听，一边听一边对着我那堆爬虫框架的代码发呆。他们讲“自由画布”和“iRAG”，讲场景融合，讲智能体生态。我脑子里嗡嗡响的，全是过去七年里，为了绕过反爬、解析动态DOM、处理验证码、对抗IP封锁写下的那些if-else。那感觉就像你还在吭哧吭哧打磨一把手工弩箭，人家已经把自动化步枪的生产线铺到你脸上了。

痛苦不是AI本身带来的，是它像一面镜子，把我过去赖以生存的那套东西照得原形毕露。我那套框架，巅峰时期有超过四万行代码。从最初的requests+BeautifulSoup，到后来集成Selenium做动态渲染，再到自己写分布式调度和IP代理池管理。为了应对某宝某东的滑块验证，我甚至用OpenCV搓过一个图像识别模块。每一行代码都沾着“生存”两个字，是跟平台风控工程师斗智斗勇的疤痕。我以为这是护城河，是手艺人的骄傲。现在看，这他妈是一座用技术债堆起来的坟。

晚上十一点，项目目录全选，右键删除。不是移到回收站，是Shift+Delete。几万行代码，几十个工具类，十几个为特定网站定制的解析器，瞬间没了。手一点没抖，心里反而松了一下。这些东西在过去七年里是我的饭碗，也是我的枷锁。每次新项目来了，我第一反应不是“这个需求用什么新方法解决最快”，而是“我框架里的哪个模块可以改改再用”。为了维护这套越来越臃肿的体系，我花了多少时间去写文档、调参数、给团队新人做培训？这些时间，本来该用来学点新东西的。

不打碎旧的Flovico，就没法迎接智能化的2023。这个“旧”，不只是代码，是那种“一切问题都能用更复杂的脚本和更精巧的架构来解决”的思维定式。GPT-4的API调用，五句话就能把以前需要两千行爬虫逻辑才能搞定的数据，通过模拟对话的方式“问”出来。我还搁这儿研究怎么用多线程异步提高0.5秒的采集速度，有意义吗？大厂在卷场景落地，在拼谁能把AI塞进更多用户的工作流里。而我过去半年在卷什么？卷怎么用更“优雅”的面向对象设计来封装一个迟早要被淘汰的技术。

但你说完全没用吗？也不是。那些年跟反爬机制死磕，训练出了一种对数据源“脾气”的直觉，对异常和脏数据有近乎本能的警惕。这种“数据感”，可能是接下来玩转RAG（检索增强生成）为数不多的老本钱。iRAG的核心不就是把非结构化数据喂给模型吗？我以前干的就是把乱七八糟的网页变成结构化数据的脏活累活。只是工具彻底变了，从自己造的轮子，变成了调用现成的、强大得多的引擎。

删完代码，关掉IDE。窗外其实没什么夜色可看，就对面楼还有几盏灯亮着。但这次感觉不一样，以前是焦虑“不会这个新技术就要被淘汰”，现在是清楚地看着自己把旧船凿沉，虽然不知道新船在哪，但至少知道必须得游了。百度发他们的，我卷我的“深度”——这个深度，不再是技术栈的深度，而是理解“在AI时代，一个产品经理的核心技能到底是什么”的深度。可能得从重新学习“提问”开始。

文章版权归作者所有，未经允许请勿转载。

THE END

思考笔记