1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/rockyzheng-document-ocr

Клонировать/Скачать
README.md 2.8 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 28.11.2024 03:15 4096853

Распознавание текста

Реализация с использованием CRNN + RNN + CTC.

Использование

  1. Подготовка размеченных данных. Путь к файлу лучше использовать абсолютный. Между путём и текстом следует использовать пробел для разделения.

    /data/9b9723f0-f7e4-49b4-bc95-28cd1cdd28e0.png 游的片曲「Come Home! Princess」是
    /data/4ed93c5d-b0f6-4232-a16a-78bdd5296a08.png 有8个公交港湾,留5个大的出入口潘多脂
    /data/1d588889-e28e-4b33-8705-b10865785efe.png 摩哥大
    /data/334c4175-d25e-4d61-b5eb-576f8983a0fd.png 甸,中国古代官名,于周礼》中,主管
    

   Словарь данных хранится в формате JSON. Если есть символы, которых нет в словаре, их следует заменить на `<UNK>`.

   ```json
   {
      "<UNK>": 0,
      "天":1,
      "文":2,
   }
  1. Создание файла TFRecord.

    • image_list — подготовленные данные.
    • data_dir — путь к файлам TFRecord.
    • vocab_file — словарь данных.
    python ./create_tfrecord.py --image_list ${LABELS_FILE} --vocab_file {vocab.json} --data_dir ${TF_RECRD_DIRS} --max_seq_length ${MAX_SEQ_LENGTH} --channel_size ${CHANNEL_SIZE}

    Код будет использовать многопоточность для создания нескольких файлов train_tfrecord. Другие параметры можно изменить в коде.

    start_create_process(train_anno_lines, 100, 10, 'train')
    start_create_process(validation_anno_lines, 10, 10,  'validation')
    start_create_process(test_anno_lines, 10, 10,  'test')
    
3. **Обучение.**

   ```python
   python  train.py --data_dir ${TF_RECRD_DIRS} --model_dir ${MODEL_DIR} --max_seq_length ${MAX_SEQ_LENGTH} --channel_size ${CHANNEL_SIZE}
  1. Тестирование.

    python ./eval.py --max_seq_length ${MAX_SEQ_LENGTH} --channel_size ${CHANNEL_SIZE} --model_dir ${MODEL_DIR} --image_list ${LABELS_FILE} --image_dir ${IMAGE_DIR}
    

   Данные в формате image_list можно использовать для ввода. Для просмотра неудачных случаев и пакетного тестирования необходимо реализовать соответствующий код.

   Параметр ```export``` позволяет экспортировать модель. Пример кода для чтения сохранённой модели находится в файле ```load_saved_model.py```.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/rockyzheng-document-ocr.git
git@api.gitlife.ru:oschina-mirror/rockyzheng-document-ocr.git
oschina-mirror
rockyzheng-document-ocr
rockyzheng-document-ocr
master