双 11 没买显卡，我买了一大箱电解质水和对乙酰氨基酚-Flovico-AI商业实战教练

双11没买显卡，我买了一大箱电解质水和对乙酰氨基酚。这他妈就是2023年的中年危机，硬件升级的欲望被身体预警的恐惧彻底压垮了。连续熬了三个通宵部署这个博客的向量检索后端，昨天下午心脏突突跳的时候，我第一反应不是叫救护车，是赶紧保存git commit。身体这台老机器，报警灯亮得比服务器监控面板还勤。

这个博客项目，代号“十年”，本质上是个数字化的自我体外循环系统。我不再信任我的大脑，更不信任任何第三方笔记软件。所有碎片思考、代码片段、失败的项目复盘、突然的行业洞察，都得扔进去，然后能随时捞出来。核心就一个：用n8n搭一个自动化的、语义化的记忆外挂。技术栈听起来很唬人：Next.js前端，Supabase存结构化数据和用户表，Pinecone做向量库，OpenAI的text-embedding-ada-002生成向量，再用n8n做胶水把所有管道接起来。最难的不是写代码，是让这些不同年代、不同脾气的服务互相认账。

n8n这个节点画布，真是把产品经理的流程图思维给实体化了。我搭的核心工作流就两条。第一条是“内容摄入流水线”：我在前台编辑器写完文章，点发布，触发一个webhook。n8n接到信号，先去Supabase把刚存的Markdown原始文本和元数据（标题、标签、模拟日期）捞出来，然后调用OpenAI的嵌入模型接口，把正文转换成那个1536维的向量。这步有个坑，OpenAI的API有频率限制，一次请求不能塞太多token，你得在n8n里写个循环节点，把长文本切片，分批送进去嵌入，再把生成的向量数组拼起来。最后，把这个拼好的向量数组，连同文章的ID、标题这些元数据，一起打包扔进Pinecone的索引里。Pinecone那边要配置好索引的维度数，得跟OpenAI嵌入模型的输出对上，不然就是鸡同鸭讲。

第二条是“语义检索管线”。这就是博客站内搜索的幕后黑手。用户在搜索框输入“2019年管理团队时遇到的坑”，这个查询字符串会被实时送到n8n。n8n同样先把它转换成查询向量，然后拿着这个向量去Pinecone做相似度搜索。Pinecone返回最相似的几个向量ID，n8n再拿着这些ID回Supabase把对应的完整文章内容、链接、日期等信息查出来，组装成一个JSON数组，吐给前端渲染。这里面的精度调教是门玄学，你动一动Pinecone查询时的top_k参数（返回几个最相似结果），或者调整一下元数据过滤条件（比如只检索某个时间段的文章），出来的结果天差地别。我花了整整一天时间，用我自己过去写的几十篇草稿做测试集，来回调整，才让“找相关记忆”这个感觉稍微像样点。

这整套东西跑通的那一刻，我没有兴奋，只有一种深深的疲惫和释然。我堆砌了快十年的所谓“技术壁垒”，什么爬虫反反爬、高并发架构、小程序裂变，在GPT的嵌入模型面前，薄得像张纸。它根本不在乎你文章是用什么修辞，它只理解语义空间的相对位置。过去我焦虑的是流量密码会不会变，现在焦虑的是我的思维碎片能不能被这个我自己搭建的“第二大脑”准确理解。这是一种更底层的焦虑。显卡？3080Ti还是4090，对处理文本向量来说没区别，都是过剩算力。但电解质水和止痛药是实实在在的，是维持这具还能敲代码的肉身的战略储备。我把这些药水塞进床头柜的时候，感觉就像在给我的生物服务器做冷备份。

文章版权归作者所有，未经允许请勿转载。

THE END

AI实践