RAG知识库问答工业级实战

从零RAG入门与大模型知识库问答系统开发实战！LangChain RAG API全体系教学，手撕工业级Agentic RAG系统开发！_哔哩哔哩_bilibili

2025年9月14日 357点热度 xxs9331 阅读全文

定义语言模型（LM）语言模型（LM）的经典定义是一种对令牌序列(token)的概率分布。假设有一个令牌集的词汇表 V 。语言模型p为每个令牌序列 x_{1},...,x_{L} ∈ V 分配一个概率（介于0和1之间的数字）： p(x_1,...x_L) 自回归语言模型(Autoregressive LM) 将序列 x_{1:L} 的联合分布 p(x_{1:L}) 的常见写法是使用概率的链式法则： p(x_{1:L}) = p(x_1) p(x_2 \mid x_1) p(x_3 \mid x_1, x_2) \…

2025年3月18日 559点热度 xxs9331 阅读全文

生成模型基本思路是使用一个简单分布作为桥梁，将观测数据分布映射到简单分布中，再从简单分布映射观测数据分布。使用高斯分布是因为高斯函数的运算性质很方便，也比较简单。多个高斯分布可以拟合一个复杂的分布。扩散过程人为定义，反向生成过程引入参数\theta,根据最大似然估计方法，转化为求下界的上限。 DDPM 前向扩散过程扩散模型的话通过超参数\beta将清晰图片和噪声图片加权求和，达到添加噪声的目的。对于加权求和的结果，根据重参数采样，依然符合高斯分布。对于超参数\beta，原始论文中设置为随着时间步t线性增…

2025年3月12日 354点热度 xxs9331 阅读全文

对于推理步骤，每进行一次推理需要添加一个高斯变量。对于文字生成模型来讲，如果每一次输出的都是可能性最大，那么生成结果只会输出那些使用频率最高的一些词汇，忽略了文字本身的含义。一些其他的论文主张在词汇嵌入之后添加高斯噪声。或者通过掩码预测的方式，来实现逐步预测的效果。

2025年3月8日 291点热度 xxs9331 阅读全文

扩散过程对于扩散过程中的连续两步，x_{t}由x_{t-1}和高斯噪声加权求和得到。在每一步的扩散过程中，随机采样的高斯噪声想互独立。将两个扩散步骤合并后，由于高斯函数的性质，高斯噪声经过加权求和后仍然是高斯噪声。所以最终扩散过程 x_t =(\sqrt{1-\beta_{1}}...\sqrt{1-\beta_{t}})x_0+\sqrt{1-(1-\beta_{1})\ldots(1-\beta_{t})} \ \epsilon ,\quad \epsilon \sim\mathcal{N}(\math…

2025年3月3日 299点热度 xxs9331 阅读全文

影像生成模型共同目标在一个简单样本分布中任意向量样本，通过神经网络生成复杂样本分布。这种生成的分布和真实情况作比较。对于文字生成图片的模型来说，输入不仅有简单样本分布的样本向量，文字也可以作为输入向量。最大似然估计最大似然估计（Maximum Likelihood Estimation，MLE）是一种统计学中常用的参数估计方法。这种方法的基本思想是：给定一个概率模型和一些观测数据，我们需要找到模型参数的最佳值，使得在这些参数下，观测数据出现的概率（也称为似然）最大。假设从现实世界中采样出 x^1\righ…

2025年3月1日 356点热度 xxs9331 阅读全文

基本概念训练算法推理算法

2025年2月28日 321点热度 xxs9331 阅读全文

HMM（隐马尔可夫模型）生成模型 $\pi$ ：初始概率分布 A：状态转移矩阵 B：观测概率矩阵(有的文章中称之为发射矩阵)，指从隐藏层向观测层发射的概率矩阵。生成模型建模对象为联合概率分布。假设齐次一阶马尔可夫假设当前状态只和前一个状态有关状态转移与时间无关（所有转移矩阵是同一个）观测独立假设 MEMM（最大熵马尔可夫模型）判别模型

2025年2月26日 306点热度 xxs9331 阅读全文

机器学习-白板推导系列(十七)-条件随机场CRF（Conditional Random Field）硬输出分类问题输出0或者1 SVM 几何间隔最大边界分类器 PLA 误分类驱动 LDA 线性判别分析软输出分类问题输出概率概率判别模型逻辑回归问题最大熵模型概率生成模型朴素贝叶斯模型齐次马尔可夫假设观测独立假设隐马尔可夫模型高斯混合模型 MEMM 概率判别模型最大熵马尔可夫模型打破独立性假设标注偏差问题（局部归一化原因） CRF 有向图变为无向图

2025年2月25日 424点热度 xxs9331 阅读全文

Framework 文字转成向量向量和噪声转成中间产物中间产物转图像 Text Encoder FID CLIP Decoder Generation Model

2025年2月24日 350点热度 xxs9331 阅读全文

日	一	二	三	四	五	六
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

RAG知识库问答工业级实战

大模型发展历程

扩散模型理论总结

李宏毅扩散模型（六）

李宏毅扩散模型（五）

李宏毅扩散模型（四）

李宏毅扩散模型（三）

HMM vs MEMM

CRF背景介绍

李宏毅扩散模型（二）