Umi-OCR 2.1.5 离线OCR文字识别

描述

OCR图片转文字识别软件,完全离线。截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本。基于 PaddleOCR 。

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
  • 高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
  • 精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

截图

更新日志

    • 新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。指定级别以上(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
    • 新增:大部分标签页能手动切换左右/上下双栏模式。 (#789)
    • 新增:Esc键隐藏主窗口。 (#652)
    • 新增:调整二维码生成相关参数后,自动刷新二维码生成。 (#690)
    • 新增:命令行指令 --reload ,用于重新加载配置文件。
    • 修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。 (#785)
    • 修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
    • 修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
    • 修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
    • 修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
    • 修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。 (#778)
    • 修复:Linux版本截图后,主窗口的位置与操作前不一致。
    • 优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。 (#710)
    • Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
    • 新增UI语言:俄语 Русский ,译者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ,译者:தமிழ்நேரம்。

    使用说明

    不兼容奔腾、赛扬、凌动CPU

    直接安装

    文件属性

    版本:2.1.5 开发者:hiroi-sora
    大小:134.3MB 激活方式:免费版
    语言:中文简体 处理器:Intel
    兼容性:Win 7及以上

    软件下载

    百度网盘

    download
    来源:百度网盘 | 提取码:nngs

    夸克网盘

    download
    来源:夸克网盘 | 提取码:Ek1t

    123网盘

    此隐藏内容仅限VIP查看升级VIP

    THE END