Основываясь на Tesseract, система перевода OCR
Основываясь на Tesseract, система перевода OCR
На основе Tesseract разработана система перевода оптического распознавания символов (OCR).
Автор
Цзэн Ифу, занимается исследованиями и разработкой в области искусственного интеллекта; основная область исследований: компьютерное зрение; участник официального проекта с открытым исходным кодом YOLOv5; участник проекта YOLOv5 v6.1; участник официального открытого проекта Gradio.
GitHub: https://github.com/Zengyf-CVer
YOLOv5 официальный проект с открытым исходным кодом PR ID:
— сохранение * .npy функций в detect.py --visualize
: https://github.com/ultralytics/yolov5/pull/5701
— исправление detect.py --view-img
для путей, отличных от ASCII: https://github.com/ultralytics/yolov5/pull/7093
— исправление Flask REST API: https://github.com/ultralytics/yolov5/pull/7210
— добавление yesqa к предварительным проверкам: https://github.com/ultralytics/yolov5/pull/7511
— добавить mdformat к предварительным проверкам и обновить другие версии: https://github.com/ultralytic s/yolov5/pull/7529
— добавьте зависимости TensorRT: https://github.com/ultralytics/yolov5/pull/8553
Ссылка на код вклада YOLOv5 версии 6.1:
https://github.com/ultralytics/yolov5/releases/tag/v6.1
Gradio официальный проект с открытым исходным кодом PR ID:
— создать демо генератора цветов: https://github.com/gradio-app/gradio/pull/1872
Обновление статуса
2022-07-19 ⚡ [OCR Translate v0.2] официально выпущен
2022-06-19 ⚡ [OCR Translate v0.1] официально выпущен
Онлайн-демонстрация
Быстрая демонстрация
Этот проект предоставляет онлайн-демо, нажмите на логотип ниже, чтобы войти в Hugging Face Spaces и быстро испытать его:
Список демонстраций
Нажмите на ссылку в списке, чтобы перейти на страницу Hugging Face Spaces соответствующей версии и быстро протестировать её:
Название демонстрации | Тип ввода | Тип вывода | Статус |
---|---|---|---|
🚀 OCR Translate v0.2 | изображение | текст | [
💎 Проектный процесс и применение
💡 Структура проекта
.
├── ocr-translate # Название проекта
│ ├── opus-mt-en-zh # Пакет перевода Opus-MT
│ │ ├── config.json # Файл конфигурации
│ │ ├── flax_model.msgpack # Модель Flax
│ │ ├── metadata.bin # Модель PyTorch
│ │ ├── rust_model.ot # Модель Rust
│ │ ├── tf_model.h5 # Модель TensorFlow
│ │ ├── tokenizer_config.json # Конфигурация токенизатора
│ │ └── ...... # Прочее
│ ├── data # Образцы изображений
│ ├── __init__.py # Инициализирующий файл
│ ├── ocr_translate.py # Основной файл выполнения
│ ├── LICENSE # Лицензия проекта
│ ├── CodeCheck.md # Проверка кода
│ ├── .gitignore # Файл игнорирования git
│ ├── README.md # Описание проекта
│ ├── setup.cfg # Предварительная проверка CI
│ ├── .pre-commit-config.yaml # Конфигурация pre-commit
│ └── requirements.txt # Зависимости скриптов
🔥 Инструкция по установке
# Добавление репозитория Tesseract OCR apt
sudo add-apt-repository ppa:alex-p/tesseract-ocr-devel
# Обновление apt
sudo apt update
# Установка
sudo apt install tesseract-ocr
git clone https://github.com/tesseract-ocr/tessdata
# Добавление переменной окружения
sudo vim ~/.bashrc
export TESSDATA_PREFIX=/home/zyf/tessdata
# Активация переменной окружения
source ~/.bashrc
# Примечание: перемещение файлов из каталога script в корневой каталог tessdata
conda create -n ocr python==3.8
conda activate ocr # Активировать среду
git clone https://gitee.com/CV_Lab/ocr-translate.git
cd ocr-translate
pip install -r ./requirements.txt -U
cd ocr-translate
# Китайско-английский
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-zh-en
# Англо-китайский
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-en-zh
⚡ Инструкция по использованию
python ocr_translate_v2.py # Рекомендуется v0.2
python ocr_translate_v1.py # v0.1
💬 Техническое общение
— Если вы обнаружите какие-либо проблемы или предложения по OCR Translate, пожалуйста, не стесняйтесь создавать issues через Gitee Issues.
— Приглашаем присоединиться к группе технического общения CV Lab.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )