核心理论知识 在线查询阶段(Online Phase)流程 用户提问 → Top-K 检索 → Prompt 设计 → Token 控制 → LLM 生成 → 回答 关键步骤: - Top-K 检索:从向量数据库召回最相关的 K 个文档片段 - Prompt 设计:将检索结果与问题组合成合适的提示词 - Token 控制:管理上下文窗口,优化成本和性能 - LLM 生成:基于上下文生成精准答案 Token 预算控制(重点!) 为什么要控制 Token 预算? 原因 说明 模型限制 所有 LLM 都有上下文窗口上限(…

2026年3月30日 54点热度 xxs9331 阅读全文

概述 任务 日 一 二 三 四 五 六 数据标注 120 4 2 2 RAG 课程 5h 5 泛化性实验 5 论文写作 1 1 谷子项目更新 3 1 2 5 总结 上周(3-4 周:22-28 日)完成情况 数据标注 120:5 天,本周目标 720 条 ✅ 已完成 常态化任务:5 天,基本保持节奏(24 日 5/5、25-28 日完成) 论文阅读+AI 综述:4 天(24、25、27、28 日),以整理为主 RAG 课程 5h:1 天(仅 28 日),离线索引阶段完成 75% ❌ 未坚持每晚 1h 泛化性实验:2…

2026年3月30日 5点热度 xxs9331 阅读全文