既然不想买服务器,我就在边缘计算上动脑筋。这话说得轻巧,背后是2023年初被ChatGPT逼到墙角后的狼狈。我引以为傲的那套爬虫+规则引擎+MySQL的“智能”系统,在GPT-3.5面前像个手摇计算器。客户问“能不能做个懂我的AI”,我总不能回“等我先租个八卡A100集群”吧。钱是一方面,更致命的是失控感——我的产品逻辑、我的知识体系,难道要全盘托付给一个我完全无法干预的API黑箱?这比2016年焦虑SEO算法时还绝望,那时候至少还能分析DOM树。
所以当看到Pinecone的向量数据库概念时,我第一反应不是兴奋,是怀疑。又一个云服务?又要按月交租?但仔细扒了文档,发现它那个“Serverless”索引和按读取次数计费的模型,戳中了我这种抠门老产品的G点。本质上,它卖的不是存储,是“最近邻搜索”这个计算动作。我脑子里那根搞了多年“降本增效”的弦立刻绷紧了:如果我能把最核心、最“Flovico”的知识,压缩成向量,存到这么一个专门为搜索优化的外部库里,那我调用OpenAI API时,就不用每次都把几万字的背景资料全塞进Prompt里烧钱了。我可以先让Pinecone帮我找到最相关的几段“记忆”,再把这几段记忆作为上下文喂给GPT。这思路,不就是把我过去做推荐系统时那套“用户画像-物品召回-精排”的流程,平移到AI对话里了吗?
但真正动手,全是坑。第一个拦路虎就是“嵌入”。OpenAI的text-embedding-ada-002接口好用,但贵,且有频率限制。我写了个脚本,把过去七年博客、客户问答记录、产品需求文档全扒出来,切成几百字的小段,准备批量转换。结果光处理断句和清理乱码就耗了一晚上,多线程爬虫的经验全用在这儿了,只不过猎物变成了我自己生产的数据。那一刻我有点恍惚,感觉在解剖自己的数字尸体。
向量灌进Pinecone后,测试查询才是见真章。我输入“Flovico对产品经理技能焦虑的看法”,它返回的前三条,一条是2017年写Axure原型的吐槽,一条是2020年管理团队时关于“执行熵增”的日记,还有一条居然是上周刚记的关于“用n8n替代人力巡检”的碎片。相关性不错,但时间线是乱的。这说明,单纯的语义相似度,无法承载“成长脉络”这个维度。我得给每段向量加上时间戳、文章类型(是技术复盘还是情绪宣泄)、甚至写作时的心率数据(如果我有的话)作为元数据。这不是建库,这是在给我的思维轨迹做数字标本。
为了省那点读取次数,我甚至琢磨起了缓存策略。把高频查询的向量ID和结果在本地存个LRU缓存,下次同样问题过来,直接走缓存,连Pinecone都不调。这毛病算是改不掉了,2016年做SEO时琢磨百度蜘蛛爬取频率的劲头,全转移到琢磨云服务API的计费颗粒度上了。朋友说我这是“用战术上的极致勤奋,掩盖战略上的路径依赖”。我认,但这就是我的生存方式。在AI这个吞金兽面前,每一分算力焦虑,都会直接转化成我的架构设计。
搞完这一套,我对着自己攒出来的这个“私有语义库”发了半天呆。它不智能,它只是一堆数字化的“我”,躺在别人的服务器里,等着被距离算法唤醒。但当我用这个库作为上下文,去问GPT“作为一个经历过管理泥潭的产品经理,我现在该如何学习AI”时,它给出的建议,竟然罕见地没有那种正确的废话感,里面提到了“用自动化解放管理负担”、“警惕技术虚荣心”这些我常挂在嘴边的词。我知道,这是因为我提前把“答案”的碎片喂给了它。这不是AI懂了Flovico,这是我强行让AI穿上了我的旧衣服。
知识工程,听起来高大上。对我而言,它就是2023年的爬虫。只不过以前爬别人的网站来获取流量,现在爬自己的大脑,试图在AI洪流里,留住一点可能被同化掉的、属于“我”的痕迹。边缘计算?不,我是在我认知的边缘,拼命地打桩。














