字节跳动：x264 RISC-V生态构建、挑战与优化

7月18日，在第五届RISC-V中国峰会的“软件与生态系统分论坛”上，字节跳动软件工程师钱佳炎带来《x264 RISC-V生态构建和优化》的主题分享，分享了团队在x264编码器适配RISC-V架构过程中的实践、指令集瓶颈及生态挑战，为RISC-V视频编解码生态发展提供了参考。

钱佳炎指出，当前RISC-V在视频编解码领域的支持仍处于起步阶段，主要集中在h264、dav1d等解码器，与成熟架构存在明显差距。以FFmpeg为例，RISC-V相关文件数量仅占8.5%，远低于ARM/NEON（40.7%）和x86/AVX/SSE（50.8%）。

作为字节跳动服务器团队的重点工作，x264生态构建旨在推动RISC-V在视频编码场景的落地，具体目标包括：适配RISC-V的CPU检测机制，通过RVV手写汇编实现x264底层算子，最终实现性能对标其他架构。x264的软件结构中，编码器核心流程采用C语言编写，底层算子则需针对不同架构进行特定优化，RISC-V优化的核心在于补充这部分手写汇编实现。

据钱佳炎介绍，x264的底层算子多涉及两帧图像中4x4至16x16像素块的相关运算，传统x86/ARM CPU更适配高并发的窄向量实现。针对这一特征，团队基于RVV实现了相关算子，例如通过stride load填满向量寄存器，利用SEW=32/64读取多行u8数据，并通过寄存器组配合拓宽计算减少前端指令数，同时采用VLA（向量长度自适应）设计支持vlen≥128的硬件。

由于缺乏高性能RISC-V CPU，团队采用相对向量加速比评估优化效果。在SpaceMIT K1平台（vlen=256，dlen=128）上的测试显示，RVV实现的加速比虽与ARM N2的NEON实现存在差距，但验证了优化方向的正确性。

针对RVV指令集瓶颈与优化推进，钱佳炎表示，在实践中，团队发现RVV在x264场景下存在几大瓶颈：

1. 寄存器内转置（in-register transpose）：NEON可通过trn1/trn2指令组合以nlogn复杂度完成，而RVV需依赖segment load/store、LMUL=n的vrgather等指令模拟，效率较低。

2. 绝对值差计算（absolute difference）：NEON有专用指令，RVV需通过vmaxu、vminu、vsub等多条指令组合实现，操作繁琐。

3. 有符号饱和窄化至无符号（Signed saturate and Narrow to Unsigned）：需通过vmax与vnclipu两条指令配合，并调整SEW，增加指令开销。

4. 标量到向量的零扩展移动（zero-extend move from scalar to vector）：vmv.x.s指令在SEW

针对这些问题，团队联合社区推动指令集优化，旨在简化绝对值差计算等操作。社区对新扩展的要求包括价值明确、有应用收益、功能最小化等。

从x264看RISC-V软件生态的挑战

钱佳炎认为，当前RISC-V软件生态面临多重挑战：

指令集功能虽在快速补齐，但仍存在差距；
向量长度（vlen）碎片化，硬件设计分化（顺序宽向量与乱序窄向量）； VLA的理想（一套代码适配任意vlen）与现实（特定vlen需独立最优实现）存在矛盾，尤其在手写汇编为主的视频编码领域；
缺乏高性能开发验证平台，软件优化多以移植为主，深度优化空间受限。

最后，他呼吁更多中国开发者参与RISC-V社区及指令集讨论，并期待厂商提供更高性能的CPU，共同推动软件生态成熟。

展开阅读全文

更新时间：2025-11-27

标签：科技字节生态向量指令算子团队寄存器软件架构速比底层

1 2 3 4 5

字节跳动：x264 RISC-V生态构建、挑战与优化

从x264看RISC-V软件生态的挑战

马云夜骑西湖被网友偶遇，同款自行车卖1.85万元，近期已多次在杭州露面

钟薛高公号时隔两年“复活”，员工称“身兼数职死扛”

中美最大交易真要来了？美媒称特朗普正颠覆传统，就等一个契机

2025年世界互联网大会数字丝路发展论坛日程

5000亿立方米！湖北发现大型页岩气田

成立仅9个月，沙特电商平台Zode关停，曾与京东、华为云等中企有深度合作｜独家

俄乌战争两国经济损失：乌克兰7749亿美元，俄罗斯让人意外

特朗普赢了！首个被关税战搞破产的国家出现！已进入“灾难状态”

创历史新高！陕西紧急预警！西安：这些人建议取消行程！

中石油、中石化、中化学重要人事调整！

时机已到，该收拾冯德莱恩了！中国一道禁令封锁，必须杀鸡儆猴

注意！乌鲁木齐住房公积金贷款计算倍数调整

杜建英同学发声：宗馥莉太狠，不给弟妹留活路，杜脸上一直没笑容

阅兵成谈判筹码？美方暗示不给稀土就不捧场，中方直接亮底线

特朗普想看九三阅兵？美媒发现端倪，为了和中方见面美已连退三步

突发重磅，宇树科技IPO！A股这11家公司参股宇树，建议收藏

我国专家团队在新疆塔里木盆地地下1820米发现全球最深

腾讯游戏被人忽悠了？这支上海团队想救一救

滹沱河艺术生态岛又上新！XR大空间与丛林穿越项目受欢迎

深圳团队研发！红米K90 Pro已在路上：堆料看齐大哥小米Pro

科技公司高管抱同事被拍，妻子火速改姓删账号，酷玩乐队紧

陈红星同四川新绿色药业科技发展有限公司副董事长赵健

西安电子科技大学广州研究院等取得基于U型网络多目标

宝鼎科技董事长张旭峰年薪90万元，曾任山东招远财政局局

《赛博朋克2077》开发团队回应新版本延期原因：一切为了