完全离线的OCR图片转文字识别工具Umi-OCR

《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目，包括技术、学习、实用与各种有趣的内容。本期推荐的是一个开源的OCR图片转文字识别软件——Umi-OCR。

特性

免费：本项目所有代码开源，完全免费。
方便：解压即用，离线运行，无需网络。
批量：可批量导入处理图片，结果保存到本地 txt、md、jsonl 多种格式文件。也可以即时截屏识别。
高效：采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够，通常比在线 OCR 服务更快。
精准：默认使用 PPOCR-v3 模型库。除了能准确辨认常规文字，对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落，得到规整的文本。

简单上手

截图识别

点击截图按钮或自定义快捷键，唤起截图识别。

粘贴图片到软件

在任何地方（如文件管理器，网页，微信）复制图片，软件上点击粘贴按钮，自动识别。

批量识别本地图片文件

将图片或文件夹拖进软件，批量转换文字。也可以点击按钮打开浏览窗口导入。

识别结果将保存到本地。可选生成纯文本 txt 文件、带链接 Markdown 文件、原始信息 json 文件等不同格式。可配置任务完成后执行关机/待机。

文本块后处理（排版优化）

OCR识别出的文本是按“块”划分的，通常一行文字分为一块，有时还会将一行误划分为多块，这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程，合并同一行或同一段落内的文字，按正确的顺序排序。

下图表示不同排版应该选用何种处理方案：

忽略区域功能

忽略区域是本软件特色功能，可用于排除图片中水印的干扰，让识别结果只留下所需的文本。

简单排除视频截图中的水印

排除游戏截图中的两种UI

下载 & 说明

下载

https://github.com/hiroi-sora/Umi-OCR/releases/tag/v1.3.0

使用说明

https://github.com/hiroi-sora/Umi-OCR#%E7%AE%80%E5%8D%95%E4%B8%8A%E6%89%8B

-END-

开源协议：MIT

开源地址：https://github.com/hiroi-sora/Umi-OCR

展开阅读全文

页面更新：2024-03-09

标签：离线文字图片水印截图批量按钮文本区域文件工具软件

1 2 3 4 5

率先在6城开启高速领航功能飞凡R7首批用户开启交付

北京日报客户端上汽集团刚刚发布了第三季度业绩报告，其中新能源汽车销售30.6万辆，同比增长66.7%。飞凡R7成为上汽集团产品向上的重要代表车型。近日，这款新车已正式开启交付，交付即可用的RISING PILOT高速领航功能率先在

proxmox ve去除订阅的提示

proxmox ve在每次登录的时候，默认会弹出来提示订阅的窗口，不取消弹窗是无法使用的。默认弹窗为了每次减少一个关闭弹窗的步骤，去除不必要的干扰，我们可以尝试去除这个订阅提示。下面我们看一下具体的方法：我们需要在proxm

三维亲钠异质界面构筑实现高度稳定的钠金属负极

哈工大王博/王殿龙&新加坡国立大学刘西蒙/John Wang，ACS Nano观点：三维亲钠异质界面构筑实现高度稳定的钠金属负极【文章信息】三维亲钠异质界面构筑实现高度稳定的钠金属负极第一作者：鲍长远，王俊辉通讯作者：王博*，王殿龙*

1024小鹏汽车科技日：看媒体如何证言

对于1024小鹏科技日，快来看看各位大咖是如何评价的吧！

可能超越亚马逊的“黑马”—TikTok Shop强势登场

当杰夫-贝索斯创办亚马逊时，他的座右铭是 "快速做大"，显然，字节跳动正在应用同样的精神，使其流星般流行的社交媒体平台TikTok紧跟亚马逊的步伐。毫无疑问，TikTok已经成长为全球多极巨头中的重要一极。手握庞大流量的TikTok

45个新星之城跨越大城市门槛：莞佛跃升特大城市，普通地级市仍需补公共服务短板

21世纪经济研究院研究员吴文汐实习生王小月根据第七次全国人口普查领导小组办公室编制的《2020中国人口普查分县资料》，目前全国共有106座大城市，包括7个超大城市、14个特大城市、14个Ⅰ型大城市以及71个Ⅱ型大城市。

「企业荣誉」鸿顺建工集团获全国工程建设企业信用星级15星

近日，中国施工企业管理协会信用评价工作委员会公布了2022年度第四批工程建设企业信用星级认定结果，山东鸿顺建工集团凭借良好的企业履约行为和信用表现，顺利通过中国施工企业管理协会考核，获得信用15星级认定。鸿顺建工集

富士康上演万里归途，到底发生了什么？

点击右上方“关注”，第一时间获取每天行情点评、炒股技巧、时事热点资讯等，有任何问题欢迎留言。大厂员工为何宁愿徒步数百里也要连夜逃离工厂？最近一条关于郑州富士康员工高速徒步返乡的新闻多次登上热搜榜首，对此很多人

技术鱼池，养出大生意

出品车谈会深度组文赵妙琳责编袁桂远凭着丰富的互联网冲浪经验，我一直认为“养鱼”是一个贬义词。殊不知，这个词放在比亚迪身上，就“变味”了。比亚迪“养鱼”，和躺在“海王”微信列表里的“鱼”也不同，也和传统意

华润有巢保障性租赁住房REIT获批

新京报讯（记者张建）11月1日，华润置地携手中信证券、华夏基金，以旗下有巢住房租赁（深圳）有限公司（简称“有巢住房租赁”）作为发行人的华润有巢保障性租赁住房REIT（简称“华润有巢REIT”）正式获批。据悉，此次获批的REIT底层资产是

宏创财税｜在东莞注册公司的流程

创业初期，很多客户都想注册一家公司，但总感觉手续繁琐，无从下手，完全没有头绪。下面宏创君就根据多年行业经验整理出了在东莞注册公司的流程，供各位创业者参考学习！一．名称核准众所周知，注册公司首先要申请公司名称。我们常用

极氪：10月极氪001交付10119台环比增长22.3%

金一丹中国证券报·中证网中证网讯（记者金一丹）11月1日，极氪公布10月交付数据，10月，纯电车型极氪001交付10119台，环比增长22.3%，累计交付55600台。中国证券报记者从极氪获悉，极氪001平均大定订单金额超过33.6万元，连续3个

第五届进博会将启：热度不减看点纷呈

(第五届进博会)第五届进博会将启：热度不减看点纷呈中新社北京11月1日电题：第五届进博会将启：热度不减看点纷呈中新社记者王恩博第五届中国国际进口博览会即将开幕。作为世界上首个以进口为主题的国家级展会，迎来五岁

麦当劳：餐饮“绿巨人”的减碳创新路径

中国经济周刊-经济网讯（记者侯隽） 9月20日，麦当劳宣布中国首家“零碳餐厅”在北京首钢园正式开业，首钢园餐厅按照国际权威绿色建筑认证LEED（能源与环境设计先锋评级）的零碳排放和零能耗标准设计和建造，预计将于12个月后获得

专家预计未来五年我国将加快扩大核电装机规模

新华社北京11月1日电（记者高敬）中国核学会理事长王寿君1日表示，预计未来五年，中国将进一步加快扩大核电装机规模。他是在当天开幕的第二十三届太平洋地区核能大会上介绍这一情况的。王寿君说，随着“双碳”目标的持续推进、

上滑加载更多 ↓

完全离线的OCR图片转文字识别工具Umi-OCR

特性

简单上手

文本块后处理（排版优化）

忽略区域功能

下载 & 说明

率先在6城开启高速领航功能飞凡R7首批用户开启交付

proxmox ve去除订阅的提示

三维亲钠异质界面构筑实现高度稳定的钠金属负极

1024小鹏汽车科技日：看媒体如何证言

可能超越亚马逊的“黑马”—TikTok Shop强势登场

45个新星之城跨越大城市门槛：莞佛跃升特大城市，普通地级市仍需补公共服务短板

「企业荣誉」鸿顺建工集团获全国工程建设企业信用星级15星

富士康上演万里归途，到底发生了什么？

技术鱼池，养出大生意

华润有巢保障性租赁住房REIT获批

宏创财税｜在东莞注册公司的流程

极氪：10月极氪001交付10119台环比增长22.3%

第五届进博会将启：热度不减看点纷呈

麦当劳：餐饮“绿巨人”的减碳创新路径

专家预计未来五年我国将加快扩大核电装机规模

十四五云南交通规划：一个国际枢纽，三个全国枢纽，四个区域

发射任务圆满成功！按下点火按钮的“金手指”原来是她

10月31早安心语正能量图片，再见十月配图文案说说

读首诗再睡觉｜沾着夜露的文字，还温存着与雪的相拥

10月30日周日早安祝福图片，过好每一天的生活，共享每一天

注意，这区域的痘痘千万别随便挤

php免杀合集（提高安全软件应变策略，严禁违法违规操作）

为什么工业软件国产化会很难？

“绽放杯”获奖项目展播 - 基于5G专网构建区域医学3D

平顶山10月新房房价排行均价上涨区域3个，均价下跌区域