今天看到新闻,说斯坦福那帮人又搞了个端到端的炒菜机器人,看视频,从识别食材到颠勺出锅,一条龙,动作比我妈还利索。我盯着屏幕愣了半天,手里的冰美式都忘了喝。这感觉,和去年初看到GPT-4写代码时一模一样,一种熟悉的、冰凉的恐慌又从脚底板爬上来。
2016年那会儿,我焦虑的是爬虫怎么绕过反爬,是Axure的动态面板交互逻辑能不能更炫,是微信小程序的审核规则又他妈变了。那时候觉得,手里有技术,心里就不慌。技术是护城河,是铁饭碗。我吭哧吭哧学了Python多线程,就为了把豆瓣小组的数据扒得更快一点;我研究DOM树解析,就为了从那些刁钻的网页里抠出几个关键字段。这些技能,在当时能直接换成钱,能接到单,能让我在朋友圈晒出又一个“项目上线”的截图。那种对具体技能的掌控感,是安全感的核心来源。
但现在呢?端到端学习,这词儿听起来就他妈吓人。它不跟你讲步骤,不拆解“识别火候-调整火力-加入调料”这些子任务。它直接给目标:一盘合格的鱼香肉丝。然后海量的数据喂进去,它自己学出从像素到动作的映射。这玩意儿要是普及了,那些依赖固定流程和模式识别的工作,第一个被冲垮。写代码在某种程度上,不也是模式识别吗?if-else,循环,调用API,处理异常……很多业务逻辑代码,本质上就是“如果用户点了A按钮,就调用B接口,把C数据展示在D位置”。这种模式化的东西,大模型现在写得比我快,比我规范,bug可能还比我少。
我去年有整整三个月,陷入这种价值虚无。觉得自己过去十年攒下的手艺,正在以肉眼可见的速度贬值。我熬夜调试的n8n工作流,GPT能根据自然语言描述直接生成个八九不离十;我精心设计的用户旅程图,Midjourney配合一些提示词,能瞬间给出几十个视觉方案,虽然细节狗屁不通,但方向和感觉有了。那种“我独有的、复杂的、需要经验积累的技能壁垒”,正在被一种粗暴的、数据驱动的暴力破解。这感觉就像你苦练十年刀工,结果人家发明了切菜机,还是全自动的。
但恐慌之后,是不得不进行的残酷反思。机器能炒菜,但机器知道今晚这桌宴席,是招待客户还是家庭聚餐吗?知道客人里有不吃辣的,有海鲜过敏的吗?知道预算卡在500块,但又要显得有面子吗?它不知道。它只知道“炒出一盘标准化的鱼香肉丝”。同理,GPT能写代码,但它能理解这个功能背后,是为了提升哪个核心业务指标吗?是为了堵上运营流程的哪个漏洞吗?是为了满足老板哪个没明说的政治诉求吗?它也不能。
所以答案变得清晰,也变得更残酷:我们这些“手艺人”的价值,必须被迫向上迁移,迁移到机器暂时(或许永远)难以触及的领域——决策层。不是“怎么写这段循环”,而是“为什么要写这段循环”;不是“如何画这个原型图”,而是“这个功能该不该做,做了对用户、对数据、对团队士气会产生什么连锁反应”。你的价值,不再体现在执行的具体动作上,而体现在你做的每一个“为什么”的判断里。你需要更懂业务,更懂人性,更懂资源分配和政治博弈。你需要从“代码实现者”变成“问题定义者”和“价值判断者”。
这很难,比学Python难多了。这意味着你要离开舒适的技术细节,去面对模糊的需求、冲突的利益和不确定的结果。但这就是趋势,端到端学习只是加速了这个进程。要么往上走,去承担决策的风险和压力;要么就被困在越来越窄的执行层,和不断进化的机器竞争谁更便宜、更快速、更不出错。后一条路,我看不到赢面。
放下杯子,咖啡已经彻底凉了。我打开电脑,不是去写代码,而是点开了上个季度的业务复盘数据。既然机器都能炒菜了,那我至少得学会,怎么决定今晚到底该炒哪道菜。














