Transformer简介

2025年2月10日 103点热度
  • 文字转数字
  • 加入位置信息编码
  • QKV分成三份
  • 数字缩放
  • 神经网络层
  • 数字缩放
  • 全部数字列队
  • 概率转化

文字转数字

image-20250210144711989

最初字符使用的是独热编码,现在大部分使用现成的第三方库。

对于字符的复用问题,每个字符可以对应多个数字。

image-20250210145842535

image-20250210150153998

对于一句话中的每个字符,从字典里抽出对应的行组成矩阵。完成字符转向量第一步。

image-20250210150339978

位置信息编码

image-20250210152453021

image-20250210152600203

image-20250210153229468

使用正余弦映射位置信息,与字符向量相加。完成字符转向量。

xxs9331

这个人很懒,什么都没留下

文章评论