1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/CV_Lab-ocr-translate

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
README.md 8.6 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 30.11.2024 06:41 a3c349c

Основываясь на Tesseract, система перевода OCR

Основываясь на Tesseract, система перевода OCR

На основе Tesseract разработана система перевода оптического распознавания символов (OCR).

Автор

Цзэн Ифу, занимается исследованиями и разработкой в области искусственного интеллекта; основная область исследований: компьютерное зрение; участник официального проекта с открытым исходным кодом YOLOv5; участник проекта YOLOv5 v6.1; участник официального открытого проекта Gradio.

GitHub: https://github.com/Zengyf-CVer

YOLOv5 официальный проект с открытым исходным кодом PR ID:

— сохранение * .npy функций в detect.py --visualize: https://github.com/ultralytics/yolov5/pull/5701

— исправление detect.py --view-img для путей, отличных от ASCII: https://github.com/ultralytics/yolov5/pull/7093

— исправление Flask REST API: https://github.com/ultralytics/yolov5/pull/7210

— добавление yesqa к предварительным проверкам: https://github.com/ultralytics/yolov5/pull/7511

— добавить mdformat к предварительным проверкам и обновить другие версии: https://github.com/ultralytic s/yolov5/pull/7529

— добавьте зависимости TensorRT: https://github.com/ultralytics/yolov5/pull/8553

Ссылка на код вклада YOLOv5 версии 6.1:

https://github.com/ultralytics/yolov5/releases/tag/v6.1

Gradio официальный проект с открытым исходным кодом PR ID:

— создать демо генератора цветов: https://github.com/gradio-app/gradio/pull/1872

Обновление статуса

2022-07-19 ⚡ [OCR Translate v0.2] официально выпущен

2022-06-19 ⚡ [OCR Translate v0.1] официально выпущен

Онлайн-демонстрация

Быстрая демонстрация

Этот проект предоставляет онлайн-демо, нажмите на логотип ниже, чтобы войти в Hugging Face Spaces и быстро испытать его:

Список демонстраций

Нажмите на ссылку в списке, чтобы перейти на страницу Hugging Face Spaces соответствующей версии и быстро протестировать её:

Название демонстрации Тип ввода Тип вывода Статус
🚀 OCR Translate v0.2 изображение текст [![demo](]]

В запросе не было обнаружено специальных символов или непечатаемых символов. Статус

status](https://huggingface.co/spaces/Zengyf-CVer/ocr_translate)

💎 Проектный процесс и применение

📌 Общий проектный процесс

📌 Пример проекта

💡 Извлечение текста OCR (китайский / английский)

💡 Перевод (китайско-английский / англо-китайский)

💡 Структура проекта

.
├── ocr-translate                           # Название проекта
│   ├── opus-mt-en-zh                       # Пакет перевода Opus-MT
│   │   ├── config.json                     # Файл конфигурации
│   │   ├── flax_model.msgpack              # Модель Flax
│   │   ├── metadata.bin                    # Модель PyTorch
│   │   ├── rust_model.ot                   # Модель Rust
│   │   ├── tf_model.h5                     # Модель TensorFlow
│   │   ├── tokenizer_config.json           # Конфигурация токенизатора
│   │   └── ......                          # Прочее
│   ├── data                                # Образцы изображений
│   ├── __init__.py                         # Инициализирующий файл
│   ├── ocr_translate.py                    # Основной файл выполнения
│   ├── LICENSE                             # Лицензия проекта
│   ├── CodeCheck.md                        # Проверка кода
│   ├── .gitignore                          # Файл игнорирования git
│   ├── README.md                           # Описание проекта
│   ├── setup.cfg                           # Предварительная проверка CI
│   ├── .pre-commit-config.yaml             # Конфигурация pre-commit
│   └── requirements.txt                    # Зависимости скриптов

🔥 Инструкция по установке

✅ Шаг 1: Установка Tesseract OCR и языковых пакетов (версия Ubuntu)

📌 Установка Tesseract OCR

# Добавление репозитория Tesseract OCR apt
sudo add-apt-repository ppa:alex-p/tesseract-ocr-devel
# Обновление apt
sudo apt update
# Установка
sudo apt install tesseract-ocr

📌 Установка языковых пакетов Tesseract OCR

git clone https://github.com/tesseract-ocr/tessdata

# Добавление переменной окружения
sudo vim ~/.bashrc
export TESSDATA_PREFIX=/home/zyf/tessdata

# Активация переменной окружения
source ~/.bashrc

# Примечание: перемещение файлов из каталога script в корневой каталог tessdata

✅ Второй шаг: создание среды conda

conda create -n ocr python==3.8
conda activate ocr # Активировать среду

✅ Третий шаг: клонирование

git clone https://gitee.com/CV_Lab/ocr-translate.git

✅ Четвёртый шаг: установка зависимостей OCR Translate

cd ocr-translate
pip install -r ./requirements.txt -U

✅ Пятый шаг: установка пакета перевода Opus-MT (офлайн версия)

cd ocr-translate

# Китайско-английский
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-zh-en

# Англо-китайский
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-en-zh

⚡ Инструкция по использованию

python ocr_translate_v2.py # Рекомендуется v0.2
python ocr_translate_v1.py # v0.1

💬 Техническое общение

— Если вы обнаружите какие-либо проблемы или предложения по OCR Translate, пожалуйста, не стесняйтесь создавать issues через Gitee Issues.

— Приглашаем присоединиться к группе технического общения CV Lab.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/CV_Lab-ocr-translate.git
git@api.gitlife.ru:oschina-mirror/CV_Lab-ocr-translate.git
oschina-mirror
CV_Lab-ocr-translate
CV_Lab-ocr-translate
master