PaddleOCRLabel — это полуавтоматическая платформа для маркировки, разработанная на основе PaddleOCR от Baidu.
Этот проект предоставляет метод запуска без необходимости компиляции. Чтобы использовать его, распакуйте содержимое архива PaddleOCRLabel-Release-1.0.zip в корневую папку и запустите файл exe. В этом случае сервис PaddleOCR, используемый в программе, будет работать на облачном сервере с адресом http://1.117.249.116:5000.
1. Запустите python_rest.
python_rest — это Rest-сервис, написанный на Python Flask, который использует библиотеку paddleocr для получения распознанного текста после сканирования.
Для запуска выполните команду: cd python_rest python rest.py
Сервис python_rest может работать локально, по умолчанию он запустит службу на http://127.0.0.1:5000.
Также можно запустить python_rest на другом Linux-сервере. Для этого перейдите в меню «Настройки» программы COR автоматического маркирования и настройте прокси-сервер, указав IP-адрес и порт сервера Linux.
2. Запустите проект paddle_ocrlabel.
Откройте каталог paddle_ocrlabel с помощью Visual Studio 2017, выбрав файл paddle_ocrlabel.sln.
3. Если вы не используете Visual Studio 2017, просто запустите paddle_ocrlabel, распаковав PaddleOCRLabel-Release-1.0.zip и запустив файл paddle_ocrlabel.exe.
В настоящее время python_rest поддерживает три сервиса:
[POST] принимает путь к изображению на локальном диске и возвращает только область обнаружения.
http://127.0.0.1:5000/recognition
[POST] принимает путь к изображению на локальном диске и возвращает область обнаружения и распознанный текст.
http://127.0.0.1:5000/regregion
[POST] принимает путь к изображению на локальном диске и координаты локальной области, возвращает распознанный текст этой локальной области.
Откройте каталог с изображениями, которые нужно пометить, нажав кнопку «Открыть каталог» в левом верхнем углу программы.
Выберите изображение, щёлкнув по нему в левом нижнем углу, затем нажмите кнопку «Пометить одно изображение», чтобы начать процесс маркировки.
Чтобы пометить все изображения в каталоге, нажмите кнопку «Отметить все изображения» в левом верхнем углу.
Области обнаружения, полученные после маркировки, будут автоматически сохранены на вашем компьютере и отображены в виде синих прямоугольников на изображениях.
Разделительная линия в середине области маркировки представляет собой границу безопасной зоны, где можно выполнять ручную маркировку.
Если результаты автоматической маркировки вас не устраивают, вы можете выполнить ручную маркировку, следуя этим шагам:
6.1) Нажмите кнопку «Начать прямоугольную маркировку» в правом верхнем углу, чтобы выбрать область на экране. Выбранная область будет отображаться оранжевым цветом. Одновременно в списке областей маркировки в левом нижнем углу появится новая запись с координатами выбранной области.
6.2) Нажмите кнопку «Повторно распознать выбранную область», чтобы вызвать сервис python_rest и получить текст из выбранной области. Результат будет показан в списке областей маркировки.
6.3) Программа также поддерживает четырёхточечную маркировку. Нажмите «Начать четырёхточечную маркировку», чтобы последовательно выбрать четыре точки на изображении. Затем нажмите «Повторно распознать выбранную область» для распознавания текста в выбранной области.
<img src="./images/a4.png" width="300">
Координаты и текст распознанных областей отображаются в списке областей маркировки слева внизу. Можно выбрать один из двух способов сортировки: горизонтальный, как в книгах, или вертикальный, как в древних рукописях.
Результаты ручной маркировки и повторного распознавания можно сохранить локально, нажав кнопку «Сохранить маркировку» или используя сочетание клавиш Ctrl+S.
Во время ручной маркировки можно отменить изменения, нажав кнопку «Отменить маркировку» или используя комбинацию клавиш Ctrl+Z. Отмена доступна для следующих действий:
9.1) Добавление прямоугольной маркировки.
9.2) Добавление четырёхточечной маркировки.
9.3) Удаление маркировки.
9.4) Перемещение маркировки.
9.5) Изменение текста после повторного распознавания.
9.6) Ручное редактирование текста.
Флажок в левом верхнем углу позволяет выбрать режим работы: «Только обнаружение текстовых областей» или «Обнаружение областей и распознавание текста». Первый вариант быстрее, но второй предоставляет больше информации.
Можно выбирать и перемещать отдельные области маркировки с помощью мыши.
При щелчке по области маркировки её границы становятся красными. Это позволяет перемещать область.
Четыре угла каждой области маркировки имеют маленькие прямоугольники. Их можно перетаскивать, чтобы изменить форму области.
Щёлкнув правой кнопкой мыши по любой записи в списке областей, можно открыть диалоговое окно для редактирования текста.
Кнопка «Экспортировать все данные маркировки» в левой части экрана позволяет экспортировать информацию о маркировке всех изображений в данном каталоге в формате log-файла. Этот файл можно использовать для обучения PaddleOCR.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )