当前位置: 首页 > news >正文

网站建设综合实训总结带有网站开发的图片

网站建设综合实训总结,带有网站开发的图片,网页制作在线生成,wordpress更新通知一、结构 上面那个图其实不是那么重要,只要知道将输入的x矩阵转换成三个矩阵进行计算即可。自注意力结构的输入为 输入矩阵的三个变形 Q(query矩阵)、K(key矩阵)、V(value矩阵)构成,…

一、结构

上面那个图其实不是那么重要,只要知道将输入的x矩阵转换成三个矩阵进行计算即可。自注意力结构的输入为 输入矩阵的三个变形 Q(query矩阵)、K(key矩阵)、V(value矩阵)构成,那么Q、K、V是如何得到的呢?

假设输入矩阵是 M*N的一个矩阵,也就是意味着输入有M个单词,则:

1.1 Q矩阵:

1.2 K矩阵:

1.3 V矩阵:

注:作为中间矩阵的行数必须是N的,否则不能做矩阵乘法,且Q、K两个矩阵必须行列一致,否则不能保持最后的Q、K、V矩阵行列一致。

二、self-Attention输出

计算公式如下:

 即计算Q矩阵与K矩阵的乘积,得到了一个N * N的矩阵,N为单词个数:

为了避免数值过大,除了向量维度的平方根。

接着计算每个单词对于其他单词的注意力系数,由于是对每一行过Softmax函数,则每行之和为1.

最后将得到的注意力系数矩阵与V矩阵相乘:

eg:word1如何计算得到z1:

 

Reference:Transformer模型详解(图解最完整版) - 知乎

http://www.hyszgw.com/news/36146.html

相关文章:

  • wordpress 自己做主题手机关键词排名优化
  • 广州协会网站建设如何建设网站pdf
  • 途牛网站建设的特点大连网站建设咨询
  • 如何进行电子商务网站推广网页制作的公司推荐时代创信
  • php网站 config海珠区建设和水务局网站
  • wordpress建网站的优点php做网站弊端
  • 广州专业做外贸网站装完wordpress怎么IP访问
  • 东莞网站建设哪家公司好大润发超市网上商城
  • 广州天河区小学排名网站建设优化课程
  • wordpress音乐主题免费优化网站找哪家
  • 宿迁哪家做网站好wordpress 翻页代码
  • 先域名 还是先做网站中国建筑网招标公告
  • 世界十大互联网公司排名网络营销优化公司
  • 做网站上传电子书企业网站开发注册
  • 网站开发vs平台的功能广告策划的目的是什么
  • 做移动网站首页软个人在线做网站免费
  • 企业网站制作及cms技术泰安建站哪家好
  • 手机网站jq导航菜单网站源代码购买
  • 泰国购物网站大全en wordpress
  • 洛阳直播网站建设网站中用特殊字体
  • 网站模版化配置制作网站在哪里
  • 建立互联网公司网站石家庄网站建设公司
  • 门户网站广告的类型上海建设项目环保验收公示网站
  • 什么是响应式网站设计自己开发手机app软件的步骤
  • 上海网站建设怎么样免费字体
  • 示范校建设专题网站购物网站开发 项目描述
  • 从化免费网站建设重庆便民服务网站APP
  • 网站建设zgkr衡水网站网站建设
  • 建设工程设计备案网站专门做2k名单的网站
  • 自己搭建的ftp怎么做网站网页链接制作生成二维码