1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/lazytech_group-scr2txt

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
README.md 4.6 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 27.11.2024 20:11 19569a7

Введение

Быстрое преобразование изображений в текст и таблицы с помощью инструмента scr2txt, основанного на платформе PaddleOCR от Baidu.

Архитектура программного обеспечения

Реализация на Python 3.7, основанная на платформе Baidu PaddleOCR. Используются следующие библиотеки:

  • PyQt;
  • Pillow.

Прямая загрузка

  1. Версия 1.0 src2txt.zip, код доступа: ui9f. Поддерживает распознавание текста.
  2. Версия 1.1 src2txt_v1.1.zip, код доступа: yrmn. Поддерживает распознавание как текста, так и таблиц.

Тестирование проводилось на Windows 10, другие системы не тестировались.

Использование

После распаковки запустите src2txt.exe. Для работы используйте сочетания клавиш:

  1. alt+c — выбрать изображение для распознавания текста, результат будет сохранён в буфере обмена;
  2. alt+t — выбрать изображение таблицы для распознавания, результаты будут сохранены в формате Excel в папке table;
  3. alt+q — выйти из программы.

Обратите внимание: при первом запуске программа загрузит модель распознавания, это может занять некоторое время.

Установка

Для установки выполните следующие шаги:

  1. Установите необходимые зависимости:
pip install -r requirements.txt
pip install -e packages/Shapely-1.7.1-cp37-cp37m-win_amd64.whl
pip install -e packages/layoutparser-0.0.0-py3-none-any.whl
  1. Соберите программу:
    1. Отладочная сборка:
SET PADDLEOCR_PATH=C:\Users\leo\anaconda3\envs\paddleocr\Lib\site-packages
SET CODE_PATH=C:\workspaces\tools\scr2txt

pyinstaller --clean -y -D --clean --exclude matplotlib -p %PADDLEOCR_PATH%\paddle\libs;%PADDLEOCR_PATH%\paddleocr;%PADDLEOCR_PATH%\paddleocr\ppocr\utils\e2e_utils;%PADDLEOCR_PATH%\paddleocr\ppstructure\table scr2txt.py -i scr2txt.ico --add-binary %PADDLEOCR_PATH%\paddle\libs;. --add-data %CODE_PATH%\scr2txt.ico;. --add-data %PADDLEOCR_PATH%\paddleocr\ppocr\utils\ppocr_keys_v1.txt;.\ppocr\utils --add-data %PADDLEOCR_PATH%\paddleocr\ppocr\utils\dict\table_structure_dict.txt;.\ppocr\utils\dict --add-data %PADDLEOCR_PATH%\layoutparser\misc\NotoSerifCJKjp-Regular.otf;.\layoutparser\misc --additional-hooks-dir=. --hidden-import extract_textpoint_slow --hidden-import tablepyxl --hidden-import tablepyxl.style
2. Официальная сборка:
SET PADDLEOCR_PATH=C:\Users\leo\anaconda3\envs\paddleocr\Lib\site-packages
SET CODE_PATH=C:\workspaces\tools\scr2txt

pyinstaller --clean -y -w -F --clean --exclude matplotlib -p %PADDLEOCR_PATH%\paddle\libs;%PADDLEOCR_PATH%\paddleocr;%PADDLEOCR_PATH%\paddleocr\ppocr\utils\e2e_utils;%PADDLEOCR_PATH%\paddleocr\ppstructure\table scr2txt.py -i scr2txt.ico --add-binary %PADDLEOCR_PATH%\paddle\libs;. --add-data %CODE_PATH%\scr2txt.ico;. --add-data %PADDLEOCR_PATH%\paddleocr\ppocr\utils\ppocr_keys_v1.txt;.\ppocr\utils --add-data %PADDLEOCR_PATH%\paddleocr\ppocr\utils\dict\table_structure_dict.txt;.\ppocr\utils\dict --add-data %PADDLEOCR_PATH%\layoutparser\misc\NotoSerifCJKjp-Regular.otf;.\layoutparser\misc --additional-hooks-dir=. --version-file=version.txt

Проблемы с pyinstaller

  • Проблема с поиском ресурсов и ошибка matplotlib: ошибку matplotlib можно исключить с помощью параметра --exclude. Проблемы с поиском ресурсов решаются добавлением параметров --add-binary и --add-data.
  • Бесконечный запуск процесса: проблема возникает при использовании команды «from paddleocr import PaddleOCR». Решение проблемы требует анализа кода и может включать изменение структуры программы или использование других библиотек.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/lazytech_group-scr2txt.git
git@api.gitlife.ru:oschina-mirror/lazytech_group-scr2txt.git
oschina-mirror
lazytech_group-scr2txt
lazytech_group-scr2txt
master