1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/BaoJianQiang-FastOCRLabel

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

PaddleOCRLabel

Введение

PaddleOCRLabel — это полуавтоматическая платформа для маркировки, разработанная на основе PaddleOCR от Baidu.

Быстрый опыт

Этот проект предоставляет метод запуска без необходимости компиляции. Чтобы использовать его, распакуйте содержимое архива PaddleOCRLabel-Release-1.0.zip в корневую папку и запустите файл exe. В этом случае сервис PaddleOCR, используемый в программе, будет работать на облачном сервере с адресом http://1.117.249.116:5000.

Необходимые условия для разработки

  1. Windows 10.
  2. Visual Studio 2017.
  3. Python 3.7.

Необходимые условия для отдельного запуска (без разработки)

  1. Windows 10.
  2. .NET 4.x.
  3. Python 3.7.

Инструкция по установке

1.  Запустите python_rest.

python_rest — это Rest-сервис, написанный на Python Flask, который использует библиотеку paddleocr для получения распознанного текста после сканирования.

Для запуска выполните команду: cd python_rest python rest.py

Сервис python_rest может работать локально, по умолчанию он запустит службу на http://127.0.0.1:5000.

Также можно запустить python_rest на другом Linux-сервере. Для этого перейдите в меню «Настройки» программы COR автоматического маркирования и настройте прокси-сервер, указав IP-адрес и порт сервера Linux.

2.  Запустите проект paddle_ocrlabel.

Откройте каталог paddle_ocrlabel с помощью Visual Studio 2017, выбрав файл paddle_ocrlabel.sln.

3.  Если вы не используете Visual Studio 2017, просто запустите paddle_ocrlabel, распаковав PaddleOCRLabel-Release-1.0.zip и запустив файл paddle_ocrlabel.exe.

Список сервисов python_rest

В настоящее время python_rest поддерживает три сервиса:

  1. http://127.0.0.1:5000/detect

    [POST] принимает путь к изображению на локальном диске и возвращает только область обнаружения.

  2. http://127.0.0.1:5000/recognition

    [POST] принимает путь к изображению на локальном диске и возвращает область обнаружения и распознанный текст.

  3. http://127.0.0.1:5000/regregion

    [POST] принимает путь к изображению на локальном диске и координаты локальной области, возвращает распознанный текст этой локальной области.

Использование

  1. Откройте каталог с изображениями, которые нужно пометить, нажав кнопку «Открыть каталог» в левом верхнем углу программы.

  2. Выберите изображение, щёлкнув по нему в левом нижнем углу, затем нажмите кнопку «Пометить одно изображение», чтобы начать процесс маркировки.

  3. Чтобы пометить все изображения в каталоге, нажмите кнопку «Отметить все изображения» в левом верхнем углу.

  4. Области обнаружения, полученные после маркировки, будут автоматически сохранены на вашем компьютере и отображены в виде синих прямоугольников на изображениях.

  5. Разделительная линия в середине области маркировки представляет собой границу безопасной зоны, где можно выполнять ручную маркировку.

  6. Если результаты автоматической маркировки вас не устраивают, вы можете выполнить ручную маркировку, следуя этим шагам:

6.1) Нажмите кнопку «Начать прямоугольную маркировку» в правом верхнем углу, чтобы выбрать область на экране. Выбранная область будет отображаться оранжевым цветом. Одновременно в списке областей маркировки в левом нижнем углу появится новая запись с координатами выбранной области.

6.2) Нажмите кнопку «Повторно распознать выбранную область», чтобы вызвать сервис python_rest и получить текст из выбранной области. Результат будет показан в списке областей маркировки.

6.3) Программа также поддерживает четырёхточечную маркировку. Нажмите «Начать четырёхточечную маркировку», чтобы последовательно выбрать четыре точки на изображении. Затем нажмите «Повторно распознать выбранную область» для распознавания текста в выбранной области.

<img src="./images/a4.png" width="300">   
  1. Координаты и текст распознанных областей отображаются в списке областей маркировки слева внизу. Можно выбрать один из двух способов сортировки: горизонтальный, как в книгах, или вертикальный, как в древних рукописях.

  2. Результаты ручной маркировки и повторного распознавания можно сохранить локально, нажав кнопку «Сохранить маркировку» или используя сочетание клавиш Ctrl+S.

  3. Во время ручной маркировки можно отменить изменения, нажав кнопку «Отменить маркировку» или используя комбинацию клавиш Ctrl+Z. Отмена доступна для следующих действий:

    9.1) Добавление прямоугольной маркировки.

    9.2) Добавление четырёхточечной маркировки.

    9.3) Удаление маркировки.

    9.4) Перемещение маркировки.

    9.5) Изменение текста после повторного распознавания.

    9.6) Ручное редактирование текста.

  4. Флажок в левом верхнем углу позволяет выбрать режим работы: «Только обнаружение текстовых областей» или «Обнаружение областей и распознавание текста». Первый вариант быстрее, но второй предоставляет больше информации.

  5. Можно выбирать и перемещать отдельные области маркировки с помощью мыши.

  6. При щелчке по области маркировки её границы становятся красными. Это позволяет перемещать область.

  7. Четыре угла каждой области маркировки имеют маленькие прямоугольники. Их можно перетаскивать, чтобы изменить форму области.

  8. Щёлкнув правой кнопкой мыши по любой записи в списке областей, можно открыть диалоговое окно для редактирования текста.

  9. Кнопка «Экспортировать все данные маркировки» в левой части экрана позволяет экспортировать информацию о маркировке всех изображений в данном каталоге в формате log-файла. Этот файл можно использовать для обучения PaddleOCR.

Что ещё предстоит сделать

  1. Добавить возможность масштабирования изображений.
  2. Реализовать многопоточность в сервисе python_rest.
  3. Предотвратить перемещение областей маркировки за пределы безопасной зоны.

Участие в проекте

  1. Приглашаем присоединиться к разработке и улучшению платформы PaddleOCRLabel.

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Платформа для полуавтоматического создания меток, разработанная на основе PaddleOCR, может работать в системе Windows. Развернуть Свернуть
MulanPSL-2.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/BaoJianQiang-FastOCRLabel.git
git@api.gitlife.ru:oschina-mirror/BaoJianQiang-FastOCRLabel.git
oschina-mirror
BaoJianQiang-FastOCRLabel
BaoJianQiang-FastOCRLabel
master