22 从零写一个最小可用 RAG 系统

2026/6/28 3:10:50

22 从零写一个最小可用 RAG 系统

专栏：大模型应用开发：从原理到生产
篇号：22
内容标签：RAG、OpenAI、Chroma、向量检索、AI应用开发

前面几篇，我们已经把 RAG 的关键部件拆开讲了一轮。

第 17 篇讲 RAG 解决什么问题。
第 18 篇讲完整 RAG 系统包含哪些环节。
第 19 篇讲文档解析与分块。
第 20 篇讲 Embedding 与向量检索。
第 21 篇讲向量数据库怎么选。

现在该把这些东西串起来了。

这一篇不追求生产级架构。

目标只有一个：

写一个最小可用的 RAG 系统，让你完整看见“文档 → 检索 → 回答”这条链路。

为什么强调“最小可用”？

因为很多人第一次做 RAG，很容易一上来就想太多：

要不要接 PDF 解析？
要不要支持多租户？
要不要加 Rerank？
要不要做混合检索？
要不要支持权限？
要不要接 LangChain 或 LlamaIndex？
要不要上 Milvus？

这些问题都重要。

但第一步不是把所有能力一次做完。

第一步是确认最基本的闭

最新新闻

为什么本地优先的 AI 工作流，更适合个人开发者和小团队

为什么本地优先的 AI 工作流，更适合个人开发者和小团队

AI时代程序员迎来隐性薪资变局：Token资源两极分化，部分从业者自行承担算力成本。

AI时代程序员迎来隐性薪资变局：Token资源两极分化，部分从业者自行承担算力成本。

数据结构与算法（一）：栈与队列的Python实现

数据结构与算法（一）：栈与队列的Python实现

中小型培训机构数字化工具推荐｜一站式解决教务、财务、家校难题

中小型培训机构数字化工具推荐｜一站式解决教务、财务、家校难题

Flutter 拖动排序主流方案怎么选？

Flutter 拖动排序主流方案怎么选？

世毫九（SH9）理论体系完整进阶学习资源包

世毫九（SH9）理论体系完整进阶学习资源包

日新闻

2026/6/28 0:05:06 管理者的六个层次 2026/6/28 0:05:06 AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告 2026/6/28 0:05:06 审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

周新闻

2026/6/28 0:05:06 管理者的六个层次 2026/6/28 0:05:06 AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告 2026/6/28 0:05:06 审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

月新闻