《Attention is All You Need》,https://t.co/3cM5aDR51n,这篇论文的引用量都已经快 10w 次了,它是深度学习里面最重要的文章之一,目前市面上流行的大部分大模型,包括 ChatGPT/Claude/Bard 等等都是以 Transformer 模型为理论基础发展起来的。 推荐李沐的这集科普《Transformer 论文逐段精读》,https://t.co/3QPcDSsbXh,花了一个半小时,一段一段带着阅读这篇论文,讲的非常好。
点击图片查看原图
只需要几秒!
创建帐户
已拥有账号并想要登录?
登陆 忘记密码?