1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/cyahua-cnocr

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
README.md 7.5 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 01.12.2024 17:26 40980c3

CnOCR

English | 中文

CnOCR

Tech should serve the people, not enslave them!
请勿将此项目用于文字审查!
---

[Update 2023.12.24]:发布 V2.3

主要变更:

  • 重新训练了所有的模型,比上一版精度更高。
  • 按使用场景把模型分为几大类场景(见识别模型列表):
    • scene:场景图片,适合识别一般拍照图片中的文字。此类模型以 scene- 开头,如模型 scene-densenet_lite_136-gru
    • doc:文档图片,适合识别规则文档的截图图片,如书籍扫描件等。此类模型以 doc- 开头,如模型 doc-densenet_lite_136-gru
    • number:仅识别纯数字(只能识别 0~9 十个数字)图片,适合银行卡号、身份证号等场景。此类模型以 number- 开头,如模型 number-densenet_lite_136-gru
    • general: 通用场景,适合图片无明显倾向的一般图片。此类模型无特定开头,与旧版模型名称保持一致,如模型 densenet_lite_136-gru

      注意 ⚠️:以上说明仅为参考,具体选择模型时建议以实际效果为准。

  • 加入了两个更大的系列模型:
    • *-densenet_lite_246-gru_base:优先供知识星球CnOCR/CnSTD私享群会员使用,一个月后会免费开源。
    • *-densenet_lite_666-gru_large:Pro 模型,购买后可使用。

更多细节请参考:CnOCR V2.3 新版发布:模型更好、更多、更大 | Breezedeus.com。

CnOCR 是 Python 3下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。欢迎扫码加小助手为好友,备注 ocr,小助手会定期统一邀请大家入群:

微信群二维码

作者也维护知识星球CnOCR/CnSTD私享群,这里面的提问会较快得到作者的回复,欢迎加入。知识星球会员可享受以下福利:

  • 可免费下载部分未开源的付费模型;
  • 购买其他所有的付费模型一律八折优化;
  • 作者快速回复使用过程中遇到的各种困难;
  • 作者每月提供两次免费特有数据的训练服务。
  • 星球会陆续发布一些CnOCR/CnSTD相关的私有资料;
  • 星球会持续发布OCR/STD/CV等相关的最新研究资料。

详细文档

见CnOCR在线文档。

使用说明

CnOCR从V2.2开始,内部自动调用文字检测引擎CnSTD进行文字检测和定位。所以CnOCRV2.2不仅能识别排版简单的印刷体文字图片,如截图图片、扫描件等,也能识别一般图片中的场景文字。

以下是一些不同场景的调用示例。

不同场景的调用示例

常见的图片识别

所有参数都使用默认值即可。如果发现效果不够好,多调整下各个参数看效果,最终往往能获得比较理想的精度。

from cnocr import CnOcr

img_fp = './docs/examples/huochepiao.jpeg'
ocr = CnOcr() # 所有参数都使用默认值
out = ocr.ocr(img_fp)
``` **Текст запроса**:

print(out)


**Перевод**: 

`print(out)`. **densenet_lite_136-gru** 🆕


cnocr
12 M
简体中文、英文、数字
X

**scene-densenet_lite_136-gru** 🆕


cnocr
12 M
简体中文、英文、数字
X

**doc-densenet_lite_136-gru** 🆕


cnocr
12 M
简体中文、英文、数字
X

**densenet_lite_246-gru_base** 🆕 <br /> ([星球会员](https://t.zsxq.com/FEYZRJQ)专享)


cnocr
25 M
简体中文、英文、数字
X

**scene-densenet_lite_246-gru_base** 🆕 <br /> ([星球会员](https://t.zsxq.com/FEYZRJQ)专享)


cnocr
25 M
简体中文、英文、数字
X

**doc-densenet_lite_246-gru_base** 🆕 <br /> ([星球会员](https://t.zsxq.com/FEYZRJQ)专享)


cnocr
25 M
简体中文、英文、数字
X

**densenet_lite_666-gru_large** 🆕 <br />(购买链接:[B站](https://gf.bilibili.com/item/detail/1104812055)、[Lemon Squeezy](https://ocr.lemonsqueezy.com/))


cnocr
82 M
简体中文、英文、数字
X

**scene-densenet_lite_666-gru_large** 🆕 <br />(购买链接:[B站](https://gf.bilibili.com/item/detail/1104815055)、[Lemon Squeezy](https://ocr.lemonsqueezy.com/))


cnocr
82 M
简体中文、英文、数字
X

**doc-densenet_lite_666-gru_large** 🆕 <br />(购买链接:[B站](https://gf.bilibili.com/item/detail/1104820055)、[Lemon Squeezy](https://ocr.lemonsqueezy.com/))


cnocr
82 M
简体中文、英文、数字
X

**number-densenet_lite_136-fc** 🆕


cnocr
2.7 M
纯数字(仅包含 `0~9` 十个数字)
X

**number-densenet_lite_136-gru**  🆕 <br /> ([星球会员](https://t.zsxq.com/FEYZRJQ)专享)


cnocr
5.5 M
纯数字(仍包含 `0~9` 十个数字)
X

**number-densenet_lite_666-gru_large** 🆕 <br />(购买链接:[B站](https://gf.bilibili.com/item/detail/1104055055)、[Lemon Squeezy](https://ocr.lemonsqueezy.com/))


cnocr
55 M
纯数字(仍包含 `0~9` 十个数字)
X

ch_PP-OCRv3
X

ppocr
10 M
简体中文、英文、数字


ch_ppocr_mobile_v2.0
X

ppocr
4.2 M
简体中文、英文、数字


en_PP-OCRv3
X

ppocr
8.5 M
英文、数字


en_number_mobile_v2.0
X

ppocr
1.8 M
英文、数字


chinese_cht_PP-OCRv3
X

ppocr
11 M
繁体中文、英文、数字
X

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/cyahua-cnocr.git
git@api.gitlife.ru:oschina-mirror/cyahua-cnocr.git
oschina-mirror
cyahua-cnocr
cyahua-cnocr
master