既然图片处理太繁琐,我就用 AI 自动去背景。这个需求来自上周一个做电商的朋友,他每天要处理几百张商品图,抠图抠到眼瞎。我第一反应是,这玩意儿不是有现成 API 吗?但问题在于,他给的图片源五花八门,有水印的、背景复杂的、甚至有些是动态页面的截图,直接调 Remove.bg 效果不稳定,而且成本扛不住。
所以我琢磨着,能不能让 AI 自己判断图片质量,不行就预处理一下,再不行就换个源重新抓?听起来像 AutoGPT 干的事,但我不想搞个命令行黑盒子,我得把它塞进 n8n 里,变成一个可视化的、能持续跑的工作流。这中间最操蛋的就是“循环反馈”机制。你让 AI 去执行“下载这张商品图并去背景”,它可能第一步就卡在 403 报错上。传统的脚本到这里就停了,得人工介入。但我想的是,能不能让工作流自己“知道”它卡住了,然后尝试换 User-Agent,或者切换代理 IP,甚至去搜索引擎用图搜图找替代图片?
我开始在 n8n 里搭这个逻辑。用了一个 HTTP Request 节点抓图,后面接一个 Function 节点,里面写了几行判断:如果返回状态码不是 200,就把错误信息和当前图片 URL 拼成一个新的提示词,扔回给一个专门负责“决策”的 AI 节点。这个 AI 节点我用的 GPT-4,给它的系统指令是:“你是一个资源获取专家。当图片直接下载失败时,请根据错误类型,给出具体的、可执行的补救步骤,例如:1. 更换 User-Agent 为 ‘xxx’。2. 尝试通过 Google Images 搜索此商品名。步骤必须清晰,且能直接作为下一个 HTTP Request 节点的输入参数。”
第一次跑通的时候,我看着日志有点发毛。它卡在 403,然后 AI 决策节点返回了“尝试添加 Referer 头:来源页面 URL”。工作流自动把这条指令解析成参数,重新配置了 HTTP Request 节点,再次发起请求——成功了。那种感觉不是“我写了个牛逼脚本”,而是“我造了个能自己看路、自己修车的小东西”。它按照我画的轨道走,但轨道上的坑,它自己找石头填。代码自己进化的诡异感很强,伴随一种技术性的亢奋,但紧接着就是更深的焦虑:这玩意儿要是跑偏了,比如陷入无限循环去搜图,账单瞬间爆炸怎么办?
所以 PM 的老本能立马跳出来。我的新任务根本不是怎么写 prompt,而是怎么给 AI 定边界。我在那个决策 AI 的系统指令里加上了硬约束:“最多尝试 3 种补救方案。禁止提议使用付费 API。如果所有方案失败,最终输出‘失败’并附上日志。” 还在 n8n 里设置了一个全局计数器,循环超过 3 次就强制终止流程。这就像给一个能力很强的下属划出清晰的权责边界,告诉他哪些雷池绝对不能越。现在的工作流,已经能处理大概七成的异常情况,剩下的三成,要么是图片本身质量太烂,要么是需要更复杂的图像修复,那暂时不在这个自动化层解决,得抛给人工审核队列。
搞完这个 demo,我盯着 n8n 里那些连起来的节点,感觉特别分裂。一方面,这种用可视化工具“编程”的方式,让我这个产品出身的人能快速构建复杂逻辑,成就感巨大。另一方面,我清楚地知道,我那些赖以生存了十年的“产品设计”、“流程优化”技能,正在被这种 AI 驱动的自动化重新定义。边界设定成了核心竞争力,但谁知道这个边界本身,会不会哪天也被 AI 自己给优化掉?














