Transformer、Bert、GPT简介

trasformer

简单回顾一下，encoder将token编码处理，得到embedding.然后送入decoder。decoder的input是前一个时间点产生的output。

Masked Multi-Head Attention，Masked的意思是，在做self-attention的时候，这个decoder只会attend到已经产生的sequence(这个sequence长度和encoder的输出长度不一样)，因为没有产生的部分无法做attention

BERT
结构：

BERT只使用了transformer的encoder部分.

input: token embedding ＋segment embedding + position embedding

会将输入的自然语言句子通过WordPiece embeddings来转化为token序列。之所以会有segment embedding是因为bert会做NSP(next sentense prediction)任务，判断两个句子间的关系，需要sentense级别的信息

output:为预测这些被遮盖掉的token,被mask掉的词将会被输入到一个softmax分类器中，分类器输出的维度对应词典的大小。

GPT

GPT 预训练的方式和传统的语言模型一样，通过上文，预测下一个单词；GPT 预训练的方式是使用 Mask LM。

例如给定一个句子 [u1, u2, …, un]，GPT 在预测单词 ui 的时候只会利用 [u1, u2, …, u(i-1)] 的信息，而 BERT 会同时利用 [u1, u2, …, u(i-1), u(i+1), …, un] 的信息

结构

GPT只使用了transformer的decoder部分,并去掉了第二个multi self attention layer

标签: none

已有 18 条评论

afmnoqhhik

September 23rd, 2024 at 04:16 am

叼茂SEO.bfbikes.com

回复
ffgdzgaabr

September 23rd, 2024 at 09:25 am

不错不错，我喜欢看 https://www.jiwenlaw.com/

回复
kxuvwxwwop

September 27th, 2024 at 01:06 pm

怎么收藏这篇文章？

回复
liuyfzuxdu

October 6th, 2024 at 07:31 pm

看的我热血沸腾啊www.jiwenlaw.com

回复
bthmykitjr

November 12th, 2024 at 01:04 am

独家揭秘：全新开服传奇私服，超震撼体验，玩家必玩火爆大服！：https://501h.com/heji/2024-08-16/28283.html

回复
jobaamkwvu

November 19th, 2024 at 07:01 pm

你的文章内容非常卖力，让人点赞。 https://www.yonboz.com/video/86792.html

回复
cagammydvo

December 7th, 2024 at 06:45 am

《爱神》喜剧片高清在线免费观看：https://www.jgz518.com/xingkong/14381.html

回复
iewnlxwwnz

December 15th, 2024 at 04:45 am

你的文章充满了欢乐，让人忍不住一笑。 http://www.55baobei.com/JZk8M9BLlm.html

回复
twssjolsps

December 27th, 2024 at 05:06 am

《魔岛迷踪》恐怖片高清在线免费观看：https://www.jgz518.com/xingkong/141508.html

回复
qycvbceezh

February 28th, 2025 at 06:17 pm

字里行间流露出真挚的情感，让人感同身受，共鸣不已。

回复
oerhfucemg

March 2nd, 2025 at 02:11 pm

?创新性评语?

回复
dexiqxopbc

March 2nd, 2025 at 02:35 pm

?金句式评语?

回复
bahockpzlx

March 2nd, 2025 at 05:37 pm

文章紧扣主题，观点鲜明，展现出深刻的思考维度。

回复
kvacdkkybd

March 4th, 2025 at 06:58 pm

内容的丰富性和深度让人仿佛置身于知识的海洋，受益匪浅。

回复
jynenhlrrq

October 5th, 2025 at 03:49 am

新车首发，新的一年，只带想赚米的人coinsrore.com

回复
zbeocuftza

October 7th, 2025 at 10:42 am

2025年10月新盘做第一批吃螃蟹的人coinsrore.com
新车新盘嘎嘎稳嘎嘎靠谱coinsrore.com
新车首发，新的一年，只带想赚米的人coinsrore.com
新盘上车集合留下我要发发立马进裙coinsrore.com
做了几十年的项目我总结了最好的一个盘（纯干货）coinsrore.com
新车上路，只带前10个人coinsrore.com
新盘首开新盘首开征召客户！！！coinsrore.com
新项目准备上线，寻找志同道合的合作伙伴coinsrore.com
新车即将上线真正的项目，期待你的参与coinsrore.com
新盘新项目，不再等待，现在就是最佳上车机会！coinsrore.com
新盘新盘这个月刚上新盘新车第一个吃螃蟹！coinsrore.com

回复
鍗庣撼鍏徃鍚堜綔寮€鎴锋墍闇€鏉愭枡锛熺數璇濆彿鐮?5587291507 寰俊STS5099

October 31st, 2025 at 05:46 pm

如何申请华纳公司账户？

回复
鍗庣撼鍏徃鍚堜綔寮€鎴锋墍闇€鏉愭枡锛熺數璇濆彿鐮?5587291507 寰俊STS5099

November 2nd, 2025 at 02:47 pm

华纳东方明珠客服电话是多少？（▲18288362750?《?微信STS5099? 】
如何联系华纳东方明珠客服？（▲18288362750?《?微信STS5099? 】
华纳东方明珠官方客服联系方式？（▲18288362750?《?微信STS5099?
华纳东方明珠客服热线？（▲18288362750?《?微信STS5099?
华纳东方明珠24小时客服电话？（▲18288362750?《?微信STS5099? 】
华纳东方明珠官方客服在线咨询？（▲18288362750?《?微信STS5099?

回复

Transformer、Bert、GPT简介

已有 18 条评论

添加新评论

最新文章

最近回复

分类

归档

其它