告别OCR！这个AI文档神器直接支持文档归类及多模态问答！

在解析处理 PDF 文档时，我们经常要借助 OCR 工具提取内容，用于搜索、问答或数据整理。

但大部分 OCR 工具存在许多痛点，比如：配置繁琐、模型庞大、图表识别差、精度低、识别结构乱、不能图文结合理解等等。

而且传统 OCR 工具非常依赖文本提取。

今天给小伙伴们推荐一款彻底摆脱传统 OCR 限制的 AI 文档处理神器：No-OCR。

它不再依赖 OCR，而是用多模态 AI + 向量索引来理解整本 PDF，支持图文混合搜索、视觉问答、内容归档查询，是文档智能搜索与问答的全新范式！

真正的无需 OCR 即可实现轻松处理复杂布局、图表和图像，极大提升文档分析效率。

主要功能

文档集合管理：支持创建和管理PDF/文档集合，以“案例”分类方便索引查找
自动构建数据集：可构建 Hugging Face 风格的数据结构，便于训练/微调
向量检索引擎：使用 LanceDB 为每页 PDF 构建图文向量，快速定位内容
多模态问答：基于 Qwen2-VL 模型，对图像、图表进行视觉理解与问答
混合查询：支持文本 + 图像混合搜索能力，问题更自由、语义更强

快速入手

No-OCR 提供有在线Demo可以直接体验所有功能，也可以在本地或服务器上进行项目部署。

在线体验：http://no-ocr.com

使用上主要分为两个流程：创建案例、搜索文档。

创建案例，需要在前端界面，点击“Create Case”，命名Case名并上传 PDF 文件。案例自动组织，支持批量导入。

搜索文档，需要先创建案例，上传PDF文档后，再点击“AI Search”，选择案例，然后输入文本查询。

本地安装部署

1、克隆项目

git clone https://github.com/kyryl-opens-ml/no-ocr

2、安装后端服务依赖项

cd no-ocr-api
pip install -r requirements.txt

3、运行后端服务器

fastapi dev api.py

4、安装前端服务依赖项

cd no-ocr-ui
npm install

5、运行前端服务

npm run dev

依赖服务--->获取 API 密钥
Modal：注册 http://modal.com 获取 API 密钥。
Superbase：创建项目（http://supabase.com）获取 URL 和密钥。
Qdrant：本地运行或使用云服务（http://qdrant.io）。

技术栈一览

文档存储与处理：PDF 文档结构化解析
向量存储：使用 LanceDB，轻量级、高速
多模态模型：采用 Qwen-VL 系列模型，支持视觉问答
部署方式：支持 Docker 快速运行 or 本地开发部署

写在最后

No-OCR 这款 AI 文档处理工具可以说是 PDF 分析的一股清流，它完全不依赖传统 OCR，省心又高效！

传统 OCR 工具在 PDF 文本提取中常面临配置复杂、精度不足等问题时，No-OCR 就显得尤为重要了，而且整个流程化处理也更加通俗易懂。

图 + 文 + 问答 + 索引一体化文档理解平台，随时让文档成为“可对话”的智能体。

如果你正在做知识库整理、企业档案智能搜索、图文资料问答分析等任务，No OCR 是极具潜力的开源解决方案之一。

GitHub 项目地址：
https://github.com/kyryl-opens-ml/no-ocr

展开阅读全文

更新时间：2025-11-28

标签：在线问答文档密钥向量神器模型文本传统案例工具科技

1 2 3 4 5

8岁的孩子突然建议我如何买股票

昨天下午回到家，儿子跟我说：爸爸你可以这样买股票呀，冬天很少人喝饮料，那饮料公司的股票肯定便宜，你可以冬天买一点；夏天好多人喝饮料，饮料公司的股票价格涨上来了，你就可以卖出去了

中粮信托财富中心总经理猥亵被拘，行业声誉蒙尘

近日，一则令人瞠目结舌的消息在金融圈乃至社会各界掀起轩然大波：中粮信托财富中心总经理任杰，因在公共场所猥亵女性，被北京市公安局朝阳分局依法处以行政拘留 10 日的处罚。这一

新洋丰13.15亿，史丹利8.26亿，磷复肥龙头是2024年度最强吸金王

4月底，A股化肥上市公司陆续披露2024年度业绩报告。从统计的23家化肥企业年报来看，以新洋丰、史丹利、芭田股份为代表的磷复肥龙头企业依旧是2024年的最强“吸金王”！23家肥料企

复旦获校友捐赠10亿，富豪们正排队“反哺”母校

善行复旦大学获校友一次性捐赠10亿元4月23日，在复旦大学建校120周年来临之际，复旦大学校友李平、廖梅夫妇决定为母校一次性捐赠10亿人民币，支持建设复旦大学学敏高等研究院。

武清首座储能电站项目开工！

美丽武清践行“双碳”战略赋能绿色发展“赣锋集团深圳易储能源天津武清200MW/400MWh独立共享储能电站”项目今日开工作为武清首座储能电站即将开启武清能源变革与可持续发

动静听新闻｜人博会贵州专场500多家企事业单位现场揽才｜国家卫生监督抽查计划首次明确打击网络“医托”｜金价破千以旧换新成主流｜赴港旅客请注意：带超过19支烟到香港，罚款5000港元

来源：【贵州广播电视台-动静新闻】今天是2025年4月27日，《动静听新闻》陪伴你的第2247天。各位早安，我是贵州广播电视台综合广播AI主播龙斌。动静热词：人博会人博会贵州专场招聘

宁青建功行暨六合智创汇活动成功举办

4月24日，宁青建功行暨六合智创汇活动在六合成功举办。在团市委的大力支持下，20余名青年企业家代表走进六合，实地走访考察六合区重点产业发展情况，共谋六合产业发展思路，助推项目

够经典的案例！惠伦晶体，实控人多次筹划套现没成功，却反遭立案

4月24日，惠伦晶体（300460.SZ）发布公告称，因涉嫌信息披露违法违规，公司及公司实际控制人赵积清被证监会立案。受此消息影响，公告发布次日，惠伦晶体开盘跌停，开盘后短暂打开了跌停，但很

上市不足一年，一脉阳光拟配股筹资1.95亿港元、加速影像中心扩张

瑞财经吴文婷4月25日，一脉阳光发布公告称，公司与配售代理订立配售协议。据此，配售代理已有条件及个别同意作为公司配售代理按尽力基准促使不少于六名承配人购买975万股配售股

国金证券：给予舍得酒业买入评级

国金证券股份有限公司刘宸倩,叶韬近期对舍得酒业进行研究并发布了研究报告《25Q1经营仍承压，关注内外聚焦成效》，给予舍得酒业买入评级。舍得酒业(600702)2025年4月25日，公司披

节前3天或无心激战，节后谨防回敲该颈线 0427

节前3天或无心激战，节后谨防回敲该颈线 0426⭕周末财讯●ZZJ重要会议：地产市场、货币政策、资本市场、人工智能●外交部再次回应：中美双方并没有就关税问题进行磋商或谈判●财

杨雷：天然气行业需积极开拓高效市场

24日，北京大学能源研究院副院长杨雷在“上海石油天然气交易中心天然气产业发展大会——2025年供需展望及高质量发展”上表示，当下新能源的发展为天然气产业带来诸多挑战，天然气

炸雷！一季报扣非净利润29家公司下降超过1000%，最大降幅39727%

扣非净利润是指扣除非经常性损益后的净利润，是衡量企业主营业务盈利能力的重要财务指标，也是最能反映企业的真实经营状况的指标。随着2024年年报披露快接近尾声，2025年一季报这

耗资10亿迪拜双塔将用惊险屋顶泳池相连

迪拜丽晶公寓六卧室、3.5万平方英尺的"超级顶层豪宅"将横跨两座591英尺高的塔楼。两座591英尺（约180米）高的新摩天大楼即将在迪拜Marasi Marina拔地而起，其顶部将通过一座令人

一季度大增21%，国补政策催化我国居民家庭饮水升级

当"喝好水"从生活愿景进阶为基本需求，中国家庭饮用水品质的升级之路正迎来历史性拐点。2025年，净水器被首次纳入国补，市场发展被按下加速键。围绕用户健康和多样化升级需求，企业

上滑加载更多 ↓