Llama2 核心技术解析— 位置编码RoPE(Rotary Positional Embeddings)

llama2 以及之前的llama 模型都从最初始的transformer 绝对位置编码转变为RPE 相对位置编码，原来位置编码存在什么问题，RPE 位置编码能解决什么问题，下面进行剖析；

原来位置编码为什么是绝对编码？transformer 论文中位置注意力计算公式如下

绝对位置编码Ui，Uj 是位置编码

对上面式子进行展开可得：

绝对位置编码

上面展开式中，最可能携带相对位置信息的就是最后一项(d)，但是实际中间添加了两个矩阵的线性变换之后，也丧失了相对位置编码能力(下方两条曲线)，具体见下图：

添加wk wq 之后编码效果

上图对位置0 对称的曲线为不添加线性变换曲线的两个位置编码做内积具备相对位置关系，具体推导如下：

第t个token 的位置embedding

可以看到下面式子和只和相对位置k有关系。

没有线性变换的位置编码乘积

这里可以看到原始transformer 位置编码transformer 结构中，进行相关的注意力机制的运算之后，会丧失相关的相对位置信息，只能说原始的位置编码只是包含了位置信息，因此针对这个问题，后续存在一系列相关改进。

那么 RoPE(Rotary Positional Embeddings) 又是何方神圣？RoPE 源自论文《ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING》，其思路就是设想找到一个函数f 满足：

函数f

这里xq（query）,m 表示第m个单词的向量xq，kn（query）同理

使得

qm， kn 的向量内积（注意力）

g 是一个假想的存在的一个这么样的函数，输入了n-m 之间的相对位置关系；论文经过在二维复平面上的一系列推到得到 f 的表达式如下：

复数内积的表达式

翻译说明一下：这里g 的表达式结果利用了数学上复数向量的内积和两个复数的乘积的关系；具体来说两个复数向量的内积的计算其实是对应实部和虚拟的乘积，然后求和；复数乘积是交叉相乘；

;

上面式子取一个* ；即虚数部分的共轭(上面的推到全部在二维复平面进行)

这里更进一步，利用二维平面复数的几何性质（复数的乘积，相当于左乘一个旋转矩阵），可以写成矩阵形式：

fq 表达式

上面式子第一个矩阵即我们说是的旋转矩阵，同时表达式以2维矩阵实数的形式进行了展开，完全变换成为了一个实数形式。

最终通过分块矩阵扩展到d 维度，得到RoPE 表达式为：

f 表达式

其中参数

以上就是RoPE 的核心思想，需要看数学细节的，请参阅原版论文，谢谢大家！

展开阅读全文

页面更新：2024-03-19

标签：内积式子位置乘积复数向量表达式矩阵线性两个

1 2 3 4 5

基于等离子体快门，对超强激光质子加速的数据模拟

文|一道Talk编辑|一道Talk相对于传统射频加速器，超强激光驱动离子加速器可在微米尺度构建 TV/m级加速场，大幅缩短加速距离，有望发展成为“桌面加速器”。由激光加速产生的离子源具有低发射度、短脉宽、高亮度等优点，可用

按摩成“折磨”，共享按摩椅该不该取消？

近期，共享按摩椅频频引发网民吐槽。本应成为公共服务有益补充的共享按摩椅为何引发质疑？公共场合按摩椅服务究竟有多大需求？共享按摩椅如何能带来真正的享受，而不是难受？图片来源：央广网今年上半年，笔者曾于北京某影院和家人

微信、支付宝“百万保障”要扣费？

“你好，是吗？我是微信（支付宝）工作人员。因你的‘百万保障’免费期已结束，现在需立即关闭，否则将每月自动扣费。”8月15日，山西晚报记者从太原市反诈中心获悉，广大市民在接到这样的电话或消息时一定要提高警惕。原来，近期有不

云畅科技参编《低代码开发平台创新发展路线图（2023）》

8月8日-9日，中国电子技术标准化研究院于北京顺利召开《低代码开发平台创新发展路线图（2023）》封闭编制会。云畅科技、浪潮、百度、广域铭岛等来自低代码开发平台解决方案供应商、用户方、科研院所等近30家相关单位的40余

雷军一句只要499，一个行业就遭受了重创，这才叫真霸总

小米创始人雷军开了第四次年度演讲，讲一下自己成长的故事，也顺便发布了小米的年度新品。在这些新发布的产品中，最重磅的产品不是新的折叠屏手机，也不是号称性价比之霸的红米手机，更不是手环和机器狗，而是那个机器狗的附带产

8位学者获2023未来科学大奖，涉及植物免疫、超导材料和 AI 领域｜钛媒体焦点

中国科学院院士赵忠贤因研发广受关注的高温超导技术而获2023未来科学大奖钛媒体获悉，8月16日，2023未来科学大奖获奖名单揭晓，共有八位学者获奖，单项奖金约725万元。西湖大学生命科学学院植物免疫学讲席教授柴继杰、中国科

「三国部落」“拼团女性车厢”-关注点不应是性别对立，而是需求差异

近日，携程上线了"火车卧铺女性拼团"功能，购票人可选择全女性车厢，若出票成功后，遇拼友退票则无法保障同房间全为女性。此功能一经推出就引发网友热议，迅速有人挑起"性别对立"的话题，发出凭什么给女性特权等种种质疑声，也有网

在实验室内，利用复合纳米短纤维，研究具有什么样的储锂性能？

随着工业的持续发展,人们对能源的需求变得越来越明显｡因此,发展绿色环保的新能源成为目前的热门课题｡目前,商业化锂电池电极材料主要是传统的无机材料,然而由于其低的理论容量(石墨,372mAhg-1)､差的循环寿命(Si,Sn等)以

17日首发：RW侠绝境求变，花云回归，AG轩染首发能否止住连败？

大家好我是指尖，KPL常规赛已经进入到了白热化阶段，第三轮的最后一周首日，XYG宣布淘汰，而DYG和KSG确认拿到了季后赛的资格，目前A组需要担心的三个队伍分别是TES、Hero以及RW侠，他们三个都是有可能面临淘汰的，因此每一场比赛的

「光与影的戏术」活动祈愿现已开启

亲爱的旅行者，「光与影的戏术」活动祈愿现已开启，「惑光幻戏·林尼(火)」概率UP！活动期间，旅行者可以在活动祈愿中获得更多角色与武器，组建强大的队伍！祈愿时间 4.0版本更新后 ~ 2023/09/05 17:59 祈愿介绍活动期间

游戏大年，神仙打架！2023年仅剩4个月，还有多少游戏值得期待？

18.《不朽者传奇》（Immortals of Aveum）发售日期：8.22EA出品的第一人称魔法战斗游戏，以魔法作为主要卖点的游戏，故事发生在一个充满魔法与冲突并且即将危在旦夕的奇幻宇宙中。玩家可操纵三种主要魔法力量，巧妙地发动连环攻

《荒原疗者》9月28号发售支持简繁体中文

近日，沙漠园艺生存游戏《荒原疗者》宣布将于2023年9月28日发售，在《荒原疗者》中，你将独自面对复兴自然环境的挑战。不论是孤身一人还是与好友结伴共同探索广阔沙漠，去打造全新的工具来拯救这奄奄一息的世界吧。也不要忘

bilibili游戏独代《重生细胞》手游销量超过500万份

由bilibili游戏独家代理，Motion Twin、Evil Empire、Playdigious 研发出品的横版动作游戏《重生细胞》移动版日前销量已超过500万份。该游戏为付费买断机制，发售至今已推出5个DLC内容，其中4个为付费版。《重生细胞》是一

游戏《命运2》迎来完整普通话配音，8月23日上线

IT之家 8 月 17 日消息，游戏开发商 Bungie 宣布将为多人射击游戏《命运 2》增加完整普通话配音，根据《命运 2》官网显示，自 2023 年 8 月 23 日开始，《命运 2》的 DLC 扩展（暗影要塞、凌光之刻、邪姬魅影、光陨之秋）中推出

《原神》正式进入下半场

《原神》新版本的榜单排名又冲了上来。今天上午，《原神》4.0版本更新，故事来到了水之国枫丹。新版本上线后进入到iOS畅销榜Top 2，并且在13个国家/地区进入畅销榜Top 10。在大版本更新、人气角色实装或是复刻的场合，《原神

上滑加载更多 ↓

Llama2 核心技术解析— 位置编码RoPE(Rotary Positional Embeddings)

基于等离子体快门，对超强激光质子加速的数据模拟

按摩成“折磨”，共享按摩椅该不该取消？

微信、支付宝“百万保障”要扣费？

云畅科技参编《低代码开发平台创新发展路线图（2023）》

雷军一句只要499，一个行业就遭受了重创，这才叫真霸总

8位学者获2023未来科学大奖，涉及植物免疫、超导材料和 AI 领域｜钛媒体焦点

「三国部落」“拼团女性车厢”-关注点不应是性别对立，而是需求差异

在实验室内，利用复合纳米短纤维，研究具有什么样的储锂性能？

17日首发：RW侠绝境求变，花云回归，AG轩染首发能否止住连败？

「光与影的戏术」活动祈愿现已开启

游戏大年，神仙打架！2023年仅剩4个月，还有多少游戏值得期待？

《荒原疗者》9月28号发售支持简繁体中文

bilibili游戏独代《重生细胞》手游销量超过500万份

游戏《命运2》迎来完整普通话配音，8月23日上线

《原神》正式进入下半场

是的，又出来两个新孩子！娱乐圈到底还有多少“隐秘娃”?

广东5将离队2位置重组，00后成为阵容主打，18人注册名单雏

魔兽世界85级怀旧服前瞻：两个难得的良心改动，别说大灾变

新闻发布-滨盛集团：构建以高端体育赛事和大型商演为龙

原神风光不再？年度大版本一更新，老二的位置都保不住了！

安徽出了两个汽车大佬，一个身家是195亿，另外一个身家是1

退休来云南建水旅居，都说这里物价低，两个人一个月能花多

两个中国首富，一个儿子35岁还没结婚，另一个女儿41岁也没

速看！这两个城市拟调整优化住房贷款政策

“马扎大战”，两个话题大师的“双人舞”