跟gemini对话Rag架构总结

2026/7/2 3:37:12

跟gemini对话Rag架构总结

核心引擎：从“流水线”到“决策脑”

LangChain (工具库)：负责底层对接。它帮你完成 PDF 文档的加载、文字切片、以及将文字转化成数字（向量）的工作。
LangGraph (指挥官)：负责高层逻辑。它不再让 AI 走死板的直线，而是允许 AI 根据实际情况循环和回头（例如：发现搜到的资料没用，就换个词重新搜）。

2. 知识储备：RAG 检索增强生成

向量数据库 (Chroma/Milvus)：这是 AI 的“私人图书馆”。你把业务手册存进去，它不仅存文字，还存文字的“含义数字（向量）”。
检索逻辑：当用户提问时，系统不是在搜“关键词”，而是在搜“意思”。即使问法不同，只要意思相近，AI 就能从库里翻出那几页文档。

3. 记忆宫殿：基于状态的存档机制

Checkpoint (检查点)：系统每运行一步都会“存档”。这保证了 AI 哪怕由于网络波动中断，重启后也能接上话。
线程隔离 (Thread ID)：通过唯一标识区分用户，确保张三的订单信息绝不会出现在李四的对话里。
因果链条 (Parent ID)：
- 作用：它像 Git 的提交记录，把对话串成一棵树。
- 优势：支持“时间旅行”。如果用户反悔或 AI 走错路，系统可以根据父节点 ID 瞬间回滚到之前的正确状态，避免 AI 产生逻辑混乱（幻觉）。

🛠️ 落地执行三部曲

第一阶段：知识数字化（离线阶段）

收集所有客服 PDF/Markdown 资料。
将文档切成 500 字左右的小块，并保留部分重叠。
通过 Embedding 模型将这些小块变成向量，存入MySQL + Chroma。

第二阶段：逻辑图构建（核心阶段）

节点设计：定义“检索知识”、“生成回答”、“人工介入”等独立功能模块。
路线规划：设定规则。比如：如果检索结果评分低于 0.6，则触发“重新检索”或“转人工”。
存档配置：配置 MySQL 存档表，让对话具备持久化记忆和回溯能力。

第三阶段：全栈对接（上线阶段）

Java 后端：用 Spring Boot 封装 AI 逻辑，提供流式（SSE）接口，让前端显示像打字机一样流畅。
前端 UI：追求 Apple Style 的极简对话框，展示 AI 回答的同时，标注出它参考了哪份文档。
人工控制台：当 AI 处理不了时，通过看板实时提醒人工客服接管该thread_id。

最新新闻

【课程设计/毕业设计】基于 Java 的医疗设备智能监管统计系统的设计与实现【附源码、数据库、万字文档】

【课程设计/毕业设计】基于 Java 的医疗设备智能监管统计系统的设计与实现【附源码、数据库、万字文档】

机器学习股票预测：从噪声过滤到状态感知的实盘建模

机器学习股票预测：从噪声过滤到状态感知的实盘建模

用 WinSCP 安全备份交换机配置

用 WinSCP 安全备份交换机配置

计算机网络·第五章自测题精讲：网络互连设备、路由器/网关/网桥功能、广域网与NAT/IPv6技术（含答案与解析）

计算机网络·第五章自测题精讲：网络互连设备、路由器/网关/网桥功能、广域网与NAT/IPv6技术（含答案与解析）

SSH密钥生成与管理全解析：从算法选型到多场景实战

SSH密钥生成与管理全解析：从算法选型到多场景实战

如何高效解决抖音内容本地化难题：开源下载工具深度解析

如何高效解决抖音内容本地化难题：开源下载工具深度解析

日新闻

2026/7/2 0:00:29 HBM Predictor数据集完全指南：从19个数据中心收集的HBM错误数据深度解析 2026/7/2 0:00:42 如何用开源工具永久保存你心爱的小说：novel-downloader全攻略 2026/7/2 0:01:33 ASM330LHH与STM32F072RB运动跟踪系统设计与优化

周新闻

2026/7/1 15:29:28 管理者的六个层次 2026/7/1 1:46:17 AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告 2026/7/1 7:08:24 审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

月新闻

2026/7/2 2:51:13 [C++]内存管理：串顺序存储的内存回收 2026/7/2 1:54:33 ai agent框架spring ai/alibaba 源码原理分析(六) agent和组件 2026/7/2 3:14:54 抖音内容监控助手：告别手动刷新，让优质内容主动找你