印度封禁 TikTok 背后，我那 50 个爬虫节点的终局-Flovico-AI商业实战教练

印度封禁 TikTok 的消息一出来，我第一反应不是市场格局，是我那 50 个 AWS 节点上的爬虫脚本全他妈废了。服务器还在跑，数据流断了，账单可不会断。这感觉就像你吭哧吭哧挖了半年的矿，矿场主直接把矿脉给炸了。

团队里的小孩还在群里问“老大，我们是不是要换目标站？”，我看着消息，连骂人的力气都没了。换？换哪儿去？整个生态链都断了，你爬回来的原始视频数据、用户标签、评论热词，一夜之间全成了数字垃圾。更讽刺的是，我们这套分布式爬虫架构，还是我19年最得意的手笔，为了对抗 TikTok 的反爬，用了动态 IP 池、模拟真人滑动轨迹、甚至拆解了他们 App 的加密协议。每个节点都像精密仪器，现在仪器还在，要测量的东西没了。这种一拳打在棉花上，不，是打在空气里的感觉，比直接被打败还难受。你所有的“技术优势”，在更高维度的行政命令面前，屁都不是。

这种无力感逼着我必须找点什么东西抓住。流量生意太脆弱了，依赖平台，依赖政策，依赖算法。我得做点“硬”的，哪怕小点，但能握在自己手里的东西。这就是“Flovico Rembg Pro”最早的念头来源。当时接了个电商客户的急单，要批量抠商品图，背景要纯白。团队试了一圈，Photoshop 动作脚本慢，在线工具要传图有泄露风险，传统算法比如 GrabCut，碰到毛发、透明纱裙就抓瞎，还得人工修，成本根本打不住。

我就在想，能不能用当时已经有点苗头的深度学习来干这个。不是那种要自己从头训练的大模型，是找到现成的、轻量的模型，把它封装成傻瓜式工具。我盯上了 U²-Net，一个做显著目标检测的模型。它的思路和传统算法完全不同，传统算法是在像素颜色、边缘梯度这些“物理特征”上做文章，而 U²-Net 是通过海量图片训练，学会了“什么是主体，什么是背景”这个抽象概念。这就是降维打击。它抠出来的边缘，尤其是复杂边缘，是基于“理解”的，不是基于“计算”的。哪怕背景和衣服颜色接近，它也能靠纹理和语义区分开。

但模型好，和能用是两回事。最大的坑在预处理和后处理。直接扔模型，速度慢，内存炸，而且原始输出是灰度掩膜，边缘有锯齿和噪点。我花了差不多两周，死磕这几个点：用 OpenCV 做图片的智能缩放，在保持长宽比的前提下尽量接近模型输入的 320×320，这样既能提速又能减少变形；模型推断用 ONNX Runtime，比原版 PyTorch 快一截；后处理更麻烦，要对掩膜做高斯模糊平滑边缘，再用二值化阈值找到轮廓，最后用这个轮廓去原图裁剪。为了处理透明物体（比如玻璃杯），还得保留 Alpha 通道，这又涉及到掩膜到 Alpha 的转换算法。

做这个工具的时候，我一个人在书房弄到凌晨。没有管理会议，没有客户催进度，没有员工跟你扯皮需求。世界很安静，只有风扇声和代码跑起来的日志输出。那种久违的、纯粹解决问题的快感又回来了一点。我意识到，可能这才是我该走的路：不再追逐瞬息万变的流量风口，而是沉下去，把一个具体的、有通用性的技术痛点打穿，做成产品。哪怕它只是一个本地运行的 exe 文件。

当然，当时这想法还很模糊。Rembg Pro 的第一个版本丑得要命，就是一个命令行工具，参数一大堆。但我隐约觉得，这种“AI 模型+工程化封装”的模式，可能是对抗未来不确定性的一种方式。技术会过时，但解决实际问题的能力不会。只是没想到，后来 AI 的进化速度，会快到连“工程化封装”本身都成了需要不断重练的基本功。

文章版权归作者所有，未经允许请勿转载。

THE END

AI实践