1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/alisen39-TrWebOCR

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

TrWebOCR-открытая система для офлайн-распознавания текста (OCR)

Описание

TrWebOCR построен на основе открытого проекта Tr.
Предоставляет интерфейс HTTP-запросов, что облегчает его использование в других проектах.
Также включает удобный для использования веб-интерфейс, который позволяет легко отладить или использовать систему в повседневной работе.

веб-страница

Основные характеристики

  • Распознавание китайского текста
    Быстрое и высокое качество распознавания

  • Распознавание текста
    Поддерживает текст, повёрнутый под определённым углом

  • Параллельные запросы
    Хотя модель сама по себе не поддерживает параллельные запросы, но благодаря использованию многопоточного режима Tornado, она может поддерживать определённое количество параллельных запросов. Конкретное количество зависит от конфигурации машины.

Требования к установке

Операционная система

  • ✔ Python 3.6+
  • ✔ Ubuntu 16.04
  • ✔ Ubuntu 18.04
  • ✔ CentOS 7
  • ✔ Docker

Для Windows и MacOS можно использовать Docker-образ, прямое развертывание не поддерживается
Другие Linux-платформы не тестировались, можно самостоятельно установить и протестировать

Минимальные требования к оборудованию

  • Процессор: 1 ядро
  • Оперативная память: 2 ГБ
  • Память SWAP: 2 ГБ## Инструкции по установке

Развертывание на сервере

  1. Установите Python 3.7
    Рекомендуется использовать miniconda

  2. Установите зависимости

pip install -r requirements.txt
  1. Запустите
    Проект по умолчанию запускается на порту OnClickListener 8089, GPU по умолчанию не включена:
python backend/main.py [--port=8089][--open_gpu=0]
# --port устанавливает порт запуска по умолчанию 8089  
# --open_gpu включает или выключает GPU по умолчанию 0 (выключена), можно установить 1 (включена)

Если вы видите следующий вывод, значит установка прошла успешно:

tr 2.3.0 https://github.com/myhub/tr
Сервер запущен: http://192.168.31.95:8089
Текущая версия: cpu

Развертывание с помощью Docker

Используйте Dockerfile для сборки или просто вытяните образ

# сборка Dockerfile
docker build -t trwebocr:latest .

# запуск образа
docker run -itd --rm -p 8089:8089 --name trwebocr trwebocr:latest 
# вытягивание из dockerhub
docker pull mmmz/trwebocr:latest

# запуск образа
docker run -itd --rm -p 8089:8089 --name trwebocr mmmz/trwebocr:latest 

Здесь порт 8089 контейнера отображается на порт 8089 физической машины, но если вам не нравится это отображение, вы можете убрать -p 8089:8089 из команды запуска и использовать IP Docker-контейнера с добавлением 8089 для доступа## Документация по API
Документация по API находится в wiki этого проекта:
Документация по API## Примеры вызова API

  • Использование Python для загрузки файла с помощью File
import requests
url = 'http://192.168.31.108:8089/api/tr-run/'
img1_file = {
    'file': open('img1.png', 'rb')
}
res = requests.post(url=url, data={'compress': 0}, files=img1_file)
```* Использование Python для загрузки файла с помощью Base64
```python
import requests
import base64
def img_to_base64(img_path):
    with open(img_path, 'rb') as read:
        b64 = base64.b64encode(read.read())
    return b64
    
url = 'http://192.168.31.108:8089/api/tr-run/'
img_b64 = img_to_base64('./img1.png')
res = requests.post(url=url, data={'img': img_b64})

Примеры результатов

Распознавание документов

Распознавание CAPTCHA

История обновлений

  • 23 января 2022 года
    Обновление модели tr2.3.1

    Модель поддерживает многопоточность. Теперь можно загрузить весь процессор! Все ядра!

  • 16 января 2022 года
    Обновление API, добавление параметра без возврата изображения

  • 17 августа 2020 года
    Обновление Dockerfile, docker-образ поддерживает tr2.3

  • 30 июля 2020 года
    Поддержка выбора запуска команды GPU/CPU

Больше записей >>>

Лицензия

Apache 2.0

Благодарности

  • Спасибо myhub и его открытому проекту Tr

Последнее

Проект обновляется синхронно на GitHub и Gitee, друзьям из Китая доступен клон проекта через Gitee. Если вам понравился этот проект, не забудьте поставить звезду (^.^)✨

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Открытый и простой в использовании китайский офлайн-OCR, который не уступает по точности распознавания крупным компаниям, а также предоставляет удобную веб-страницу и веб-интерфейс. Это удобно для повседневного использования людьми или для вызова другими программами. Развернуть Свернуть
Python и 5 других языков
Apache-2.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/alisen39-TrWebOCR.git
git@api.gitlife.ru:oschina-mirror/alisen39-TrWebOCR.git
oschina-mirror
alisen39-TrWebOCR
alisen39-TrWebOCR
master