既然网页端变复杂了,我就改用“视觉 Agent”去硬刚

Copilot 这玩意儿一出来,我盯着那个演示视频看了三遍,后背有点发凉。不是因为它多酷,是它直接把我过去十年赖以生存的“产品经理手动操作技能树”给连根刨了。以前我们说“产品经理要懂点技术”,潜台词是你会用 Axure 画个交互,能跟开发掰扯两句 DOM 树和 API 字段,最多再写点 Python 脚本做点数据清洗。现在好了,Copilot 直接告诉你:画交互?你描述,它生成。写 SQL?你问,它出结果,连带图表都给你画好。做 PPT?你丢个草稿,它给你排版、配图、写演讲者备注。我们那点“手动操作优势”,在 AI 面前跟手工作坊一样可笑。

办公室软件彻底智能化,这不是功能升级,这是生态位灭绝。我 2016 年那会儿,为了抢流量,死磕 SEO 算法和微信小程序审核规则,觉得掌握了这些“黑盒”就掌握了主动权。后来带团队,陷在无穷无尽的 PRD 评审、原型迭代、数据看板搭建里,以为这就是“交付价值”。现在回头看,大部分时间我都在干“信息搬运工”和“格式调整器”的活儿。把业务方的口水话整理成需求列表,把数据从后台导到 Excel 里拉个透视表,把一堆截图和文字塞进 PPT 模板里对齐。这些活儿,Copilot 类工具分分钟干得比我好、比我快、还不会抱怨加班。

那我们的核心价值到底在哪?这个问题我焦虑了整整一个周末。肯定不是“更会使用 Office 三件套”,这条路已经被 AI 堵死了。我想起 2021 年回归个人交付时悟到的:身体是第一生产力。现在得加一句:思维是唯一的护城河。AI 再强,它也是执行指令。指令从哪来?对问题的精准定义,对目标的拆解,对路径的权衡,对结果的批判性评估——这些“元能力”,AI 暂时还不会。或者说,它需要极高质量的人类输入才能发挥威力。我们的价值,正在从“熟练操作者”向“策略定义者”和“质量评判者”迁移。

但这迁移谈何容易。这意味着我们过去引以为傲的“经验”——比如知道 PPT 哪个动画效果最炫、Excel 哪个函数组合能解决特定问题——全部贬值。新的经验是什么?是如何给 AI 设计清晰、无歧义、可迭代的指令。是如何在 AI 生成的一堆“看起来都对”的方案里,快速找到那个最符合业务场景和用户心智的选项。这要求更高维的抽象能力和更底层的逻辑思维。举个例子,以前我教新人:“这个按钮放这里,因为用户流程是这样走的。” 现在我得教:“我们需要设计一个引导流程,核心目标是降低新用户的首次操作认知负荷,请你向 AI 描述这个目标,并让它生成三个交互方案,然后我们从方案里反向推导出设计原则。”

所以,既然网页端、客户端都变得越来越复杂,交互层叠得让人眼花缭乱,我就不跟它玩“手动点点点”的游戏了。我改用“视觉 Agent”去硬刚。简单说,就是让 AI 去看屏幕,理解界面元素和布局,然后直接操作。我在实验用 Playwright 配合一些视觉识别库,再挂上 GPT-4 的 API,让它去自动完成一些之前需要我手动录屏、截图、标注的繁琐测试和配置任务。这不再是简单的自动化脚本,因为界面可能会变,元素位置可能会改,但 AI 能“看懂”,能适应。这感觉有点像 2018 年我疯狂写爬虫对付各种反爬策略时的状态,但这次,武器升级了,战场也彻底不同了。

恐慌是实实在在的。这种技能被瞬间颠覆的感觉,比当年从程序员转产品经理时更猛烈。但有一点没变:只能硬刚,没有退路。要么学会驾驭这些“视觉 Agent”和“Copilot”,成为它们的导演;要么就被它们替代,沦为过去时代的“手工操作遗老”。我选前者,哪怕这意味着 31 岁的我,得像个刚入行的新手一样,重新开始学习如何“思考”,而不是“操作”。

© 版权声明
THE END
喜欢就支持一下吧
点赞42 分享