1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/CV_Lab-ocr-translate

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

Основываясь на Tesseract, система перевода OCR

Основываясь на Tesseract, система перевода OCR

На основе Tesseract разработана система перевода оптического распознавания символов (OCR).

Автор

Цзэн Ифу, занимается исследованиями и разработкой в области искусственного интеллекта; основная область исследований: компьютерное зрение; участник официального проекта с открытым исходным кодом YOLOv5; участник проекта YOLOv5 v6.1; участник официального открытого проекта Gradio.

GitHub: https://github.com/Zengyf-CVer

YOLOv5 официальный проект с открытым исходным кодом PR ID:

— сохранение * .npy функций в detect.py --visualize: https://github.com/ultralytics/yolov5/pull/5701

— исправление detect.py --view-img для путей, отличных от ASCII: https://github.com/ultralytics/yolov5/pull/7093

— исправление Flask REST API: https://github.com/ultralytics/yolov5/pull/7210

— добавление yesqa к предварительным проверкам: https://github.com/ultralytics/yolov5/pull/7511

— добавить mdformat к предварительным проверкам и обновить другие версии: https://github.com/ultralytic s/yolov5/pull/7529

— добавьте зависимости TensorRT: https://github.com/ultralytics/yolov5/pull/8553

Ссылка на код вклада YOLOv5 версии 6.1:

https://github.com/ultralytics/yolov5/releases/tag/v6.1

Gradio официальный проект с открытым исходным кодом PR ID:

— создать демо генератора цветов: https://github.com/gradio-app/gradio/pull/1872

Обновление статуса

2022-07-19 ⚡ [OCR Translate v0.2] официально выпущен

2022-06-19 ⚡ [OCR Translate v0.1] официально выпущен

Онлайн-демонстрация

Быстрая демонстрация

Этот проект предоставляет онлайн-демо, нажмите на логотип ниже, чтобы войти в Hugging Face Spaces и быстро испытать его:

Список демонстраций

Нажмите на ссылку в списке, чтобы перейти на страницу Hugging Face Spaces соответствующей версии и быстро протестировать её:

Название демонстрации Тип ввода Тип вывода Статус
🚀 OCR Translate v0.2 изображение текст [![demo](]]

В запросе не было обнаружено специальных символов или непечатаемых символов. Статус

status](https://huggingface.co/spaces/Zengyf-CVer/ocr_translate)

💎 Проектный процесс и применение

📌 Общий проектный процесс

📌 Пример проекта

💡 Извлечение текста OCR (китайский / английский)

💡 Перевод (китайско-английский / англо-китайский)

💡 Структура проекта

.
├── ocr-translate                           # Название проекта
│   ├── opus-mt-en-zh                       # Пакет перевода Opus-MT
│   │   ├── config.json                     # Файл конфигурации
│   │   ├── flax_model.msgpack              # Модель Flax
│   │   ├── metadata.bin                    # Модель PyTorch
│   │   ├── rust_model.ot                   # Модель Rust
│   │   ├── tf_model.h5                     # Модель TensorFlow
│   │   ├── tokenizer_config.json           # Конфигурация токенизатора
│   │   └── ......                          # Прочее
│   ├── data                                # Образцы изображений
│   ├── __init__.py                         # Инициализирующий файл
│   ├── ocr_translate.py                    # Основной файл выполнения
│   ├── LICENSE                             # Лицензия проекта
│   ├── CodeCheck.md                        # Проверка кода
│   ├── .gitignore                          # Файл игнорирования git
│   ├── README.md                           # Описание проекта
│   ├── setup.cfg                           # Предварительная проверка CI
│   ├── .pre-commit-config.yaml             # Конфигурация pre-commit
│   └── requirements.txt                    # Зависимости скриптов

🔥 Инструкция по установке

✅ Шаг 1: Установка Tesseract OCR и языковых пакетов (версия Ubuntu)

📌 Установка Tesseract OCR

# Добавление репозитория Tesseract OCR apt
sudo add-apt-repository ppa:alex-p/tesseract-ocr-devel
# Обновление apt
sudo apt update
# Установка
sudo apt install tesseract-ocr

📌 Установка языковых пакетов Tesseract OCR

git clone https://github.com/tesseract-ocr/tessdata

# Добавление переменной окружения
sudo vim ~/.bashrc
export TESSDATA_PREFIX=/home/zyf/tessdata

# Активация переменной окружения
source ~/.bashrc

# Примечание: перемещение файлов из каталога script в корневой каталог tessdata

✅ Второй шаг: создание среды conda

conda create -n ocr python==3.8
conda activate ocr # Активировать среду

✅ Третий шаг: клонирование

git clone https://gitee.com/CV_Lab/ocr-translate.git

✅ Четвёртый шаг: установка зависимостей OCR Translate

cd ocr-translate
pip install -r ./requirements.txt -U

✅ Пятый шаг: установка пакета перевода Opus-MT (офлайн версия)

cd ocr-translate

# Китайско-английский
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-zh-en

# Англо-китайский
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-en-zh

⚡ Инструкция по использованию

python ocr_translate_v2.py # Рекомендуется v0.2
python ocr_translate_v1.py # v0.1

💬 Техническое общение

— Если вы обнаружите какие-либо проблемы или предложения по OCR Translate, пожалуйста, не стесняйтесь создавать issues через Gitee Issues.

— Приглашаем присоединиться к группе технического общения CV Lab.

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Описание недоступно Развернуть Свернуть
GPL-3.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/CV_Lab-ocr-translate.git
git@api.gitlife.ru:oschina-mirror/CV_Lab-ocr-translate.git
oschina-mirror
CV_Lab-ocr-translate
CV_Lab-ocr-translate
master