CnOCR
English | 中文
主要变更:
scene
:场景图片,适合识别一般拍照图片中的文字。此类模型以 scene-
开头,如模型 scene-densenet_lite_136-gru
。doc
:文档图片,适合识别规则文档的截图图片,如书籍扫描件等。此类模型以 doc-
开头,如模型 doc-densenet_lite_136-gru
。number
:仅识别纯数字(只能识别 0~9
十个数字)图片,适合银行卡号、身份证号等场景。此类模型以 number-
开头,如模型 number-densenet_lite_136-gru
。general
: 通用场景,适合图片无明显倾向的一般图片。此类模型无特定开头,与旧版模型名称保持一致,如模型 densenet_lite_136-gru
。
注意 ⚠️:以上说明仅为参考,具体选择模型时建议以实际效果为准。
*-densenet_lite_246-gru_base
:优先供知识星球CnOCR/CnSTD私享群会员使用,一个月后会免费开源。*-densenet_lite_666-gru_large
:Pro 模型,购买后可使用。更多细节请参考:CnOCR V2.3 新版发布:模型更好、更多、更大 | Breezedeus.com。
CnOCR 是 Python 3下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。欢迎扫码加小助手为好友,备注 ocr
,小助手会定期统一邀请大家入群:
作者也维护知识星球CnOCR/CnSTD私享群,这里面的提问会较快得到作者的回复,欢迎加入。知识星球会员可享受以下福利:
见CnOCR在线文档。
CnOCR从V2.2开始,内部自动调用文字检测引擎CnSTD进行文字检测和定位。所以CnOCRV2.2不仅能识别排版简单的印刷体文字图片,如截图图片、扫描件等,也能识别一般图片中的场景文字。
以下是一些不同场景的调用示例。
所有参数都使用默认值即可。如果发现效果不够好,多调整下各个参数看效果,最终往往能获得比较理想的精度。
from cnocr import CnOcr
img_fp = './docs/examples/huochepiao.jpeg'
ocr = CnOcr() # 所有参数都使用默认值
out = ocr.ocr(img_fp)
``` **Текст запроса**:
print(out)
**Перевод**:
`print(out)`. **densenet_lite_136-gru** 🆕
√
√
cnocr
12 M
简体中文、英文、数字
X
**scene-densenet_lite_136-gru** 🆕
√
√
cnocr
12 M
简体中文、英文、数字
X
**doc-densenet_lite_136-gru** 🆕
√
√
cnocr
12 M
简体中文、英文、数字
X
**densenet_lite_246-gru_base** 🆕 <br /> ([星球会员](https://t.zsxq.com/FEYZRJQ)专享)
√
√
cnocr
25 M
简体中文、英文、数字
X
**scene-densenet_lite_246-gru_base** 🆕 <br /> ([星球会员](https://t.zsxq.com/FEYZRJQ)专享)
√
√
cnocr
25 M
简体中文、英文、数字
X
**doc-densenet_lite_246-gru_base** 🆕 <br /> ([星球会员](https://t.zsxq.com/FEYZRJQ)专享)
√
√
cnocr
25 M
简体中文、英文、数字
X
**densenet_lite_666-gru_large** 🆕 <br />(购买链接:[B站](https://gf.bilibili.com/item/detail/1104812055)、[Lemon Squeezy](https://ocr.lemonsqueezy.com/))
√
√
cnocr
82 M
简体中文、英文、数字
X
**scene-densenet_lite_666-gru_large** 🆕 <br />(购买链接:[B站](https://gf.bilibili.com/item/detail/1104815055)、[Lemon Squeezy](https://ocr.lemonsqueezy.com/))
√
√
cnocr
82 M
简体中文、英文、数字
X
**doc-densenet_lite_666-gru_large** 🆕 <br />(购买链接:[B站](https://gf.bilibili.com/item/detail/1104820055)、[Lemon Squeezy](https://ocr.lemonsqueezy.com/))
√
√
cnocr
82 M
简体中文、英文、数字
X
**number-densenet_lite_136-fc** 🆕
√
√
cnocr
2.7 M
纯数字(仅包含 `0~9` 十个数字)
X
**number-densenet_lite_136-gru** 🆕 <br /> ([星球会员](https://t.zsxq.com/FEYZRJQ)专享)
√
√
cnocr
5.5 M
纯数字(仍包含 `0~9` 十个数字)
X
**number-densenet_lite_666-gru_large** 🆕 <br />(购买链接:[B站](https://gf.bilibili.com/item/detail/1104055055)、[Lemon Squeezy](https://ocr.lemonsqueezy.com/))
√
√
cnocr
55 M
纯数字(仍包含 `0~9` 十个数字)
X
ch_PP-OCRv3
X
√
ppocr
10 M
简体中文、英文、数字
√
ch_ppocr_mobile_v2.0
X
√
ppocr
4.2 M
简体中文、英文、数字
√
en_PP-OCRv3
X
√
ppocr
8.5 M
英文、数字
√
en_number_mobile_v2.0
X
√
ppocr
1.8 M
英文、数字
√
chinese_cht_PP-OCRv3
X
√
ppocr
11 M
繁体中文、英文、数字
X
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )