离线索引流概览 RAG 系统的两条数据流 数据流 英文 输入 处理流程 输出 离线索引流 Indexing Pipeline 原始文档(PDF/TXT/MD) 文档加载 → 文本切分 → 向量化 → FAISS 索引 向量索引文件(.index + .json) 在线查询流 Query Pipeline 用户提问 向量化 → 检索 → Prompt → LLM 生成 AI 生成的答案 离线索引流的目标 输入:PDF、TXT、Markdown 等原始文档 输出:可检索的向量索引文件(.index + .json) 特…