基于SpringAI开发的通用RAG脚手框架，适配各种场景-酒店常州论坛

RAG 业务落地开发指导

本文面向后续把这套 RAG 能力接入业务系统的开发者，重点回答三件事：

上游业务请求怎么进入 RAG。
RAG 内部各组件怎么串起来。
数据分别存到 MySQL、文件存储、向量库和搜索引擎的哪里。

1. 总体边界

独立工程保留的是一套完整 RAG 子系统，不是简单 demo。

业务系统 -> RAG HTTP/API 层 -> 模型/存储/知识库配置 -> 文档入库 pipeline -> 检索 pipeline -> QA prompt + 模型调用

代码入口：

src/main/java/com/aizuda/snail/ai/ragforge/controller/RagForgeController.java

这个 controller 只负责暴露接口和参数转换。真正可复用的业务边界在这些类：

RagDocumentService 接收文件/URL，做去重、资源存储、文档元数据入库 DocumentPipeline 解析、切片、写 chunk、写向量库、写搜索引擎 RagSearchService 检索总入口 RagSearchPipeline 检索流水线编排 RagQAService 检索后拼 Prompt 并调用 Chat 模型 KnowledgeService 知识库配置管理 ModelFactory Chat / Embedding / Rerank 模型工厂 VectorStoreFactory 向量库工厂 SearchEngineFactory 搜索引擎工厂 ResourceService 原始文件存储

2. 配置链路

业务落地前要先准备四类配置。

模型提供商 -> 模型配置 -> 存储实例 -> 知识库

2.1 模型提供商

表：snail_ai_model_provider

作用：记录提供商，如 OpenAI、Ollama、Gemini 或内部兼容 OpenAI 协议的服务。

关键字段：

id 提供商 ID provider_name 展示名称 provider_key 代码识别用 key，如 openai is_enabled 是否启用

2.2 模型配置

表：snail_ai_model_config

作用：记录具体模型实例。

RAG 至少需要：

EMBEDDING 文档入库写向量、向量检索时使用 CHAT QA 阶段生成答案时使用 RERANKER 可选，检索后重排时使用

关键字段：

id 模型配置 ID，业务配置里引用它 provider_id 所属提供商 model_key 真实模型名，如 text-embedding-3-small model_type CHAT / EMBEDDING / RERANKER api_key 加密后的 key api_endpoint 模型服务地址 config_json 模型扩展参数，如 dimensions、temperature、timeoutMs

代码读取路径：

ModelFactory.getModel(modelConfigId) -> ModelConfigHandler.getConfigInfo -> snail_ai_model_config -> 具体模型实现

2.3 存储实例

表：snail_ai_store_instance

作用：把外部向量库和搜索引擎的连接信息配置化，不写死在代码里。

关键字段：

id 存储实例 ID category 1=向量库，2=搜索引擎 type 1=PG_VECTOR，2=MILVUS，3=ELASTICSEARCH，4=PG_FULLTEXT config 连接参数 JSON status 是否启用 is_default 是否默认

向量库由VectorStoreFactory读取：

snail_ai_rag.vector_store_instance_id -> snail_ai_store_instance.config -> PGVector / Milvus / Elasticsearch 向量适配器

搜索引擎由SearchEngineFactory读取：

snail_ai_rag.search_engine_instance_id -> snail_ai_store_instance.config -> Elasticsearch BM25 适配器

2.4 知识库配置

表：snail_ai_rag

作用：这是 RAG 的主配置表，后续所有入库和检索都以ragId为主线。

关键字段：

id 知识库 ID，也就是接口里的 ragId name 知识库名称 embedding_model_id 入库和向量检索使用的 Embedding 模型 rerank_model_id 默认 Rerank 模型 vector_store_instance_id 向量库存储实例 search_engine_enable 是否启用 BM25 搜索引擎 search_engine_instance_id 搜索引擎实例 config 切片、检索、问答参数 JSON dedup_strategy 文档去重策略 dedup_action 命中去重后的动作 upload_confirm 上传前是否二次确认

config对应代码：

src/main/java/com/aizuda/snail/ai/persistence/rag/dataobject/RagConfigDO.java

结构：

chunkParams 切片参数：mode、maxChunkTokens、chunkOverlap、regex、smart 模型等 searchParams 检索参数：resultCount、rerankEnabled、denseWeight、rrfK、threshold 等 modelParams QA 参数：modelId、nearbySliceCount、prompt

3. 文档入库上下游串联

入口：

POST /demo/rag/document/upload-and-process POST /demo/rag/document/import-url-and-process

业务上游只需要提供：

ragId 写入哪个知识库 file/url 文档来源 可选去重参数 dedupStrategy / dedupAction

完整调用链：

RagForgeController -> RagDocumentService.upload / importFromUrl -> DocumentImportFactory -> ResourceService -> snail_ai_resource -> snail_ai_rag_document(PENDING) -> DocumentPipeline.processDocument -> ResourceService.load(resourceId) -> DocumentParserFactory -> DocumentChunkingService -> snail_ai_rag_chunk -> VectorStoreFactory -> 外部向量库 index: rag_{ragId} -> SearchEngineFactory -> 外部搜索引擎 index: rag_{ragId} -> snail_ai_rag_document.status = SUCCESS / FAILED

3.1 原始文件怎么存

原始文件不直接塞到snail_ai_rag_document.content。

存储路径：

ResourceService.upload -> LOCAL 或 MINIO -> snail_ai_resource -> snail_ai_rag_document.resource_id

核心表：snail_ai_resource

id 资源 ID storage_key 本地相对路径或对象存储 key original_name 原始文件名 file_size 文件大小 mime_type MIME 类型 storage_type LOCAL / MINIO access_url 预览或访问 URL biz_type DOCUMENT biz_id ragId creator_id 上传人，可为空

3.2 文档元数据怎么存

表：snail_ai_rag_document

一份上传文档对应一行。

关键字段：

id documentId rag_id 所属知识库 name 文件名 file_type pdf/docx/xlsx/txt/md/html 等 source_type UPLOAD / URL status 0=PENDING 1=PARSING 2=PROCESSING 3=SUCCESS 4=FAILED error_msg 失败原因 chunk_count 切片数量 content_hash 原始内容 SHA-256，用于文档级去重 resource_id 指向 snail_ai_resource.id

推荐业务用法：

上传后返回 documentId 业务系统保存 documentId 与自身业务单据的关系 前端或后台轮询 document.status 判断是否处理完成 失败时展示 error_msg 并允许重试 processDocument

3.3 切片怎么存

表：snail_ai_rag_chunk

一份文档会拆成多行 chunk。

关键字段：

id chunkId rag_id 所属知识库 document_id 所属文档 paragraph_index 段落序号 chunk_index 文档内切片序号 content 切片文本 token_count 估算 token 数 vector_id 外部向量库里的向量 ID content_hash chunk 文本 SHA-256，用于 chunk 级向量复用

为什么 MySQL 还要存content：

向量库和搜索引擎负责召回，不负责业务主数据。 最终展示、拼 Prompt、权限过滤、来源展示，都应回到 MySQL chunk/document 做补全。

3.4 向量怎么存

向量不存 MySQL，存外部向量库。

索引命名：

rag_{ragId}

代码：

IndexNameBuilder.KNOWLEDGE.build(Map.of("ragId", ragId))

写入内容：

id vectorId，对应 snail_ai_rag_chunk.vector_id content chunk 文本 metadata ragId、documentId、chunkId vector embedding 后的向量

关系：

snail_ai_rag_chunk.id -> metadata.chunkId snail_ai_rag_chunk.vector_id -> 向量库 document/vector id

3.5 搜索引擎怎么存

搜索引擎用于 BM25/关键词召回。当前实现使用 Elasticsearch。

索引命名同样是：

rag_{ragId}

写入内容：

id chunkId content chunk 文本 metadata ragId、documentId、chunkId

注意：

search_engine_enable=false 时不会写搜索引擎，也不会走 BM25。 业务对编号、术语、错误码召回敏感时，建议开启 BM25。

4. 检索上下游串联

入口：

POST /demo/rag/search

请求：

{"ragId":1,"query":"设备报警 E32 怎么处理？","debug":true}

完整调用链：

RagForgeController.search -> RagSearchService.search -> RagSearchPipeline -> ConfigResolveHandler -> QueryRewriteHandler -> VectorSearchHandler -> Bm25SearchHandler -> HybridFusionHandler -> RerankHandler -> FinalizeHandler

4.1 ConfigResolveHandler

输入：

ragId

读取：

snail_ai_rag snail_ai_rag.config

输出到上下文：

knowledge searchParams modelParams query

4.2 VectorSearchHandler

读取：

knowledge.vector_store_instance_id knowledge.embedding_model_id searchParams.resultCount

下游：

VectorStoreFactory -> 外部向量库 rag_{ragId}

输出：

vectorResults: List<SearchResult>

其中SearchResult.chunkId来自向量 metadata，后面用于回查 MySQL。

4.3 Bm25SearchHandler

前提：

snail_ai_rag.search_engine_enable = true

读取：

knowledge.search_engine_instance_id searchParams.resultCount

下游：

SearchEngineFactory -> Elasticsearch rag_{ragId}

输出：

bm25Results: List<SearchResult>

4.4 HybridFusionHandler

作用：融合向量召回和 BM25 召回。

支持策略：

RRF 默认推荐，按排名倒数融合，比较稳定 WEIGHTED_SUM 按 denseWeight 做加权，适合调参后固定业务场景

配置来源：

snail_ai_rag.config.searchParams.fusionStrategy snail_ai_rag.config.searchParams.denseWeight snail_ai_rag.config.searchParams.rrfK

4.5 RerankHandler

作用：用 Reranker 模型对融合后的候选重新排序。

配置来源：

rerankEnabled rerankModelId enterRerankCount resultCount

成本控制点：

只有前 enterRerankCount 个候选会送入 rerank。 最终只保留 resultCount 个结果。

4.6 FinalizeHandler

作用：把召回结果变成可展示、可拼 Prompt 的最终结果。

处理：

按 chunkId 回查 snail_ai_rag_chunk 按 documentId 回查 snail_ai_rag_document 补齐 content、documentName、documentId 按 nearbySliceCount 合并相邻切片 重排结果，缓解 lost-in-the-middle

5. 问答上下游串联

入口：

POST /demo/rag/qa/stream

完整调用链：

RagForgeController.qaStream -> RagQAService.qaStream -> snail_ai_rag.config.modelParams -> RagSearchService.search -> buildDocumentsText -> buildSystemPrompt -> ModelFactory.getModel(modelParams.modelId) -> ChatModel.chatStreamModel -> ResponseBodyEmitter

Prompt 拼装规则：

modelParams.prompt 中必须保留 <Documents> RagQAService 会把检索结果拼成 documentsText，然后替换 <Documents>

示例：

请只根据以下参考资料回答用户问题。资料不足时明确说明不足，不要编造。 <Documents>

如果没有配置 prompt，则默认使用：

请根据以下参考资料回答用户的问题： {documentsText}

6. 最小落地表集

docs/sql/snail_ai_schema.sql是从原项目带出的全量建表脚本，里面包含 agent、memory、skill、openapi 等外围表。

如果只落地 RAG，最小核心表是：

snail_ai_model_provider snail_ai_model_config snail_ai_store_instance snail_ai_rag snail_ai_resource snail_ai_rag_document snail_ai_rag_chunk

建议保留但不是 RAG 主链路强依赖：

snail_ai_user snail_ai_model_usage_stat

可以裁剪的外围表：

snail_ai_agent* snail_ai_mcp_server snail_ai_skill* snail_ai_app snail_ai_client_node snail_ai_openapi_user memory 相关表

如果裁剪表，也要同步删除对应 mapper/PO 或限制 Spring 扫描范围，否则 MyBatis/Spring 仍可能加载不需要的组件。

7. 核心表关系

snail_ai_model_provider 1 ---- N snail_ai_model_config snail_ai_store_instance 1 ---- N snail_ai_rag.vector_store_instance_id snail_ai_store_instance 1 ---- N snail_ai_rag.search_engine_instance_id snail_ai_model_config 1 ---- N snail_ai_rag.embedding_model_id snail_ai_model_config 1 ---- N snail_ai_rag.rerank_model_id snail_ai_model_config 1 ---- N snail_ai_rag.config.modelParams.modelId snail_ai_rag 1 ---- N snail_ai_rag_document snail_ai_rag_document 1 ---- N snail_ai_rag_chunk snail_ai_resource 1 ---- 1 snail_ai_rag_document.resource_id snail_ai_rag_chunk.vector_id ---- 外部向量库 rag_{ragId} snail_ai_rag_chunk.id ---- 外部搜索引擎 rag_{ragId} 文档 ID 或 metadata.chunkId

当前 SQL 没有强制声明所有外键，主要靠代码维护关系。这样便于迁移和清理外部索引，但业务落地时要自己保证删除顺序。

8. 写入一致性和失败处理

文档状态：

0 PENDING 已创建文档行，等待处理 1 PARSING 预留状态 2 PROCESSING 解析/切片/写外部索引中 3 SUCCESS 入库完成 4 FAILED 入库失败，error_msg 保存原因

写入顺序：

1. 原始文件写 Resource 2. 文档行写 RagDocument，PENDING 3. 解析文件 4. 切片 5. 写 RagChunk 6. 写向量库，并回填 vector_id 7. 写搜索引擎 8. 更新 RagDocument 状态

注意：

向量库写入失败会导致文档处理失败。 搜索引擎写入当前是非致命失败，失败时向量检索仍可用，但 BM25 召回会缺数据。 重跑同一 documentId 前会清理旧 chunk 和不再被引用的向量。

业务落地建议：

上传接口只返回 documentId，不要立即假设可检索。 前端轮询 document.status，或后端加异步任务/消息通知。 失败时展示 error_msg，并提供重新处理入口。

9. 去重策略

文档级去重字段：

snail_ai_rag_document.rag_id snail_ai_rag_document.name snail_ai_rag_document.content_hash

策略：

0 NONE 不去重 1 BY_NAME 同库同名重复 2 BY_CONTENT 同库同内容重复 3 BY_NAME_OR_CONTENT 同名或同内容重复

冲突动作：

0 REJECT 拒收并报错 1 SKIP 跳过本次上传，返回旧文档 2 OVERWRITE 删除旧文档、chunk、向量和资源后重新入库

Chunk 级去重：

snail_ai_rag_chunk.content_hash

如果同一知识库里已有相同 chunk 且已有vector_id，新 chunk 会复用旧vector_id，避免重复 embedding。

10. 业务系统接入建议

10.1 上游业务对象和 ragId 的关系

推荐业务侧建自己的关联表，例如：

business_id rag_id document_id owner_id permission_scope created_at

RAG 子系统只关心ragId/documentId/chunkId，业务权限、租户、栏目、产品线建议放在业务侧或扩展 metadata。

10.2 权限过滤放哪里

可选位置：

上传前：限制谁能写某个 ragId 检索前：限制谁能查某个 ragId FinalizeHandler：按 documentId/chunkId 做结果过滤 向量/搜索 metadata：写入 tenantId、deptId、bizId 后在检索时过滤

如果权限是强要求，建议不要只在前端控制，至少在 search/qa 入口和 FinalizeHandler 做后端校验。

10.3 同步和异步

当前 demo 的upload-and-process是同步处理，方便学习完整链路。

生产建议：

上传接口：只写资源和文档行，返回 documentId 后台任务：异步调用 DocumentPipeline.processDocument(documentId) 查询接口：根据 document.status 展示处理进度

这样可以避免大文件解析、embedding、外部索引写入导致 HTTP 超时。

10.4 业务可扩展点

新增文件解析器 实现 DocumentParser，并注册到 DocumentParserFactory 新增切片策略 实现 ChunkStrategy，并接入 DocumentChunkingService 新增向量库 实现 SnailAiVectorStore，并注册 VectorStoreFactory.REGISTER 新增搜索引擎 实现 SearchEngine，并注册 SearchEngineFactory.REGISTER 新增模型提供商 实现 Chat/Embedding/Rerank 对应构建逻辑 检索后权限过滤 扩展 FinalizeHandler 答案引用格式 扩展 RagQAService.buildDocumentsText 或 buildSystemPrompt

11. 落地检查清单

上线前逐项确认：

MySQL 已执行核心表 SQL snail_ai_model_provider 已有提供商 snail_ai_model_config 已有 EMBEDDING/CHAT/RERANKER snail_ai_store_instance 已有向量库实例 需要 BM25 时已有搜索引擎实例 snail_ai_rag 已绑定 embeddingModelId/vectorStoreInstanceId/searchEngineInstanceId snail_ai_rag.config 已配置 searchParams/modelParams/chunkParams 原始文件存储 LOCAL/MINIO 可读写 向量库 rag_{ragId} 可写可查 搜索引擎 rag_{ragId} 可写可查 Prompt 模板保留 <Documents> 业务权限已在入口或 FinalizeHandler 处理

本项目完整源码已上传至 Gitee，需要的朋友可自行下载学习：
👉 源码地址：https://gitee.com/ww_qq_22/ragforge

企业官网建设流程全解析

RAG 业务落地开发指导

1. 总体边界

2. 配置链路

2.1 模型提供商

2.2 模型配置

2.3 存储实例

2.4 知识库配置

3. 文档入库上下游串联

3.1 原始文件怎么存

3.2 文档元数据怎么存

3.3 切片怎么存

3.4 向量怎么存

3.5 搜索引擎怎么存

4. 检索上下游串联

4.1 ConfigResolveHandler

4.2 VectorSearchHandler

4.3 Bm25SearchHandler

4.4 HybridFusionHandler

4.5 RerankHandler

4.6 FinalizeHandler

5. 问答上下游串联

6. 最小落地表集

7. 核心表关系

8. 写入一致性和失败处理

9. 去重策略

10. 业务系统接入建议

10.1 上游业务对象和 ragId 的关系

10.2 权限过滤放哪里

10.3 同步和异步

10.4 业务可扩展点

11. 落地检查清单

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

RAG 业务落地开发指导

1. 总体边界

2. 配置链路

2.1 模型提供商

2.2 模型配置

2.3 存储实例

2.4 知识库配置

3. 文档入库上下游串联

3.1 原始文件怎么存

3.2 文档元数据怎么存

3.3 切片怎么存

3.4 向量怎么存

3.5 搜索引擎怎么存

4. 检索上下游串联

4.1 ConfigResolveHandler

4.2 VectorSearchHandler

4.3 Bm25SearchHandler

4.4 HybridFusionHandler

4.5 RerankHandler

4.6 FinalizeHandler

5. 问答上下游串联

6. 最小落地表集

7. 核心表关系

8. 写入一致性和失败处理

9. 去重策略

10. 业务系统接入建议

10.1 上游业务对象和 ragId 的关系

10.2 权限过滤放哪里

10.3 同步和异步

10.4 业务可扩展点

11. 落地检查清单

热门文章

文章分类

标签云

相关文章

TortoiseSvn与TortoiseGit：从零开始的安装与汉化实战指南

PointLLM：三维点云与大语言模型融合，实现视觉语言理解新突破

分布式链路追踪在字节跳动的实践

需要专业的网站建设服务？