ollama v0.12.9 发布：修复 CPU Only 系统性能回退并优化 GPU 与 ROCm 支

2025年11月2日，ollama 发布了 v0.12.9 最新版本，本次更新主要针对 CPU-only 系统的性能回退问题进行了修复，同时在 GPU 设备检测、ROCm 错误处理以及 CUDA 内存分配优化方面进行了多项改进。以下是版本的详细变化说明。

一、主要更新内容

1. 修复 CPU-only 系统性能回退问题

本次版本重点修复了在仅使用 CPU 的环境下出现的性能回退（regression）问题，确保在缺乏 GPU 的系统上依旧能够高效运行模型。

2. GPU 设备检测路径优化

在 GPU 设备枚举的过程中，旧版本使用 LibOllamaPath 作为库路径，本次更新统一改为 ml.LibOllamaPath，保证路径引用一致性，提升跨平台与多设备环境下的稳定性。
改动包括：

• discover/runner.go 中多处将 LibOllamaPath 替换为 ml.LibOllamaPath

• 在 ROCm 目录查找、设备列表更新等逻辑中进行相同修改

• ml/device.go 中 LibraryPaths 函数初始化时确保 LibOllamaPath 包含于 GPU 库路径列表中

这些改动有助于在 GPU 初始化阶段正确加载相关库文件，尤其是在混合 GPU 环境中（CUDA 与 ROCm 并存）。

3. ROCm 错误捕获与日志改进

新增对 ROCm error 的日志监控，llm/status.go 的 errorPrefixes 列表中增加了 "ROCm error" 条目，使错误信息能够被及时捕获与输出，便于定位问题。

4. CUDA 内存操作优化

在 CUDA 后端实现中增加了对内存设置与拷贝操作的优化逻辑：

• 新增 cudaMemsetAsyncReserve 方法：在图预留（reserving_graph）阶段，避免执行不必要的 cudaMemsetAsync 操作，从而减少 GPU 内存分配压力

• 对 cudaMemcpyAsync、cudaMemcpy2DAsync、cudaMemsetAsync 进行了宏替换，使其在预留阶段直接返回成功，而不执行实际操作

• 这一改动在
ggml/src/ggml-cuda/common.cuh 和
ml/backend/ggml/ggml/src/ggml-cuda/common.cuh 中均有实现，使 CUDA 后端在图优化阶段更高效

效果：

• 避免无意义的 GPU 内存清零操作

• 在模型装载与推理时减少延迟

5. 测试用例调整

integration/api_test.go 中移除了冗余的 TestAPIEmbeddings 测试方法，此前该测试会调用嵌入 API（Embeddings），包括模型拉取与输出验证，此处删除主要是简化测试集，避免重复测试相同功能。

6. 文件结构调整与命名空间修改

discover/path.go 文件更名为 ml/path.go，并将包名从 discover 改为 ml，归类到机器学习核心逻辑下，使模块结构更加清晰。

二、总结

ollama v0.12.9 在保持功能稳定的同时，解决了 CPU-only 系统的性能问题，并且显著优化了 GPU 设备检测、ROCm 错误日志及 CUDA 内存分配机制。这些改进对在多种硬件环境中部署 Ollama 的用户尤为重要：

• CPU-only 用户 可获得更好的推理性能

• GPU 用户 能够享受更稳定的设备检测与库加载机制

• CUDA/ROCm 用户 可减少初始化延迟、提升整体运行效率

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。

欢迎关注“福大大架构师每日一题”，发消息可获得面试资料，让AI助力您的未来发展。

展开阅读全文

更新时间：2025-12-11

标签：数码性能系统设备内存测试路径初始化阶段操作环境用户

1 2 3 4 5

ollama v0.12.9 发布：修复 CPU Only 系统性能回退并优化 GPU 与 ROCm 支

一、主要更新内容

1. 修复 CPU-only 系统性能回退问题

2. GPU 设备检测路径优化

3. ROCm 错误捕获与日志改进

4. CUDA 内存操作优化

5. 测试用例调整

6. 文件结构调整与命名空间修改

二、总结

小米HyperOS 3全球Beta版就绪，十款抢先体验设备有你的手机吗？

传华为Mate 70 Air将在11月6日上架电池达6500mAh

699 元，飞傲翡声开放式平板头戴耳机 JT7 发布

多元业态、重磅签约、人才赋能！广州设计之都注入时尚新力量

这3个国货冲锋衣：几乎不打广告，却靠性价比碾压始祖鸟、凯乐石

丑鞋不香了，UGG拖HOKA后腿，Crocs利润跌三成

男生买羽绒服，别只盯着北面、骆驼！这4个国产品牌小众不烂大街

断舍离后，我戒掉了“这5个爱好”，钱攒下来了，生活越来越好！

硅胶假身材、抱不起女主、连弓都拉不开！这些男演员到底有多虚？

大批品牌被曝检出被禁染料苏丹红！专家：分子量小，“毒性”很容易被吸收，有致敏、致癌风险

金饰克价反弹，周大福、亚一、菜百一夜涨超60元/克

千万别再这样洗脸了！很伤皮肤

等你老了，务必远离这3种“毁气质”的发型，不仅油腻，还很显土

早安，赤峰！

向自己说句“好运连连”，霉运退散，办事顺顺当当！！！

小米HyperOS 3全球Beta版就绪，十款抢先体验设备有你的

贵州茅台进入高质量发展新阶段

京津冀协同探索人工智能赋能科学教育新路径

东风着陆场完成最后一次全系统综合演练静候神二十航

加拿大网络安全中心警告：多地基础设施工控系统安全防护

比亚迪公布国际专利申请：“充电器及充电系统”

中华文化天府论坛嘉宾走进峨眉山：看到了一个具有学术价

癌症风险降低61%！权威研究：每天5分钟，3个简单操作就可实

鹰角《明日方舟：终末地》将启动新一轮测试；卡普空《怪物

政银携手，文化赋能：呼和浩特探索“文旅+金融”融合发展