Реализация с использованием CRNN + RNN + CTC.
Подготовка размеченных данных. Путь к файлу лучше использовать абсолютный. Между путём и текстом следует использовать пробел для разделения.
/data/9b9723f0-f7e4-49b4-bc95-28cd1cdd28e0.png 游的片曲「Come Home! Princess」是
/data/4ed93c5d-b0f6-4232-a16a-78bdd5296a08.png 有8个公交港湾,留5个大的出入口潘多脂
/data/1d588889-e28e-4b33-8705-b10865785efe.png 摩哥大
/data/334c4175-d25e-4d61-b5eb-576f8983a0fd.png 甸,中国古代官名,于周礼》中,主管
Словарь данных хранится в формате JSON. Если есть символы, которых нет в словаре, их следует заменить на `<UNK>`.
```json
{
"<UNK>": 0,
"天":1,
"文":2,
}
Создание файла TFRecord.
python ./create_tfrecord.py --image_list ${LABELS_FILE} --vocab_file {vocab.json} --data_dir ${TF_RECRD_DIRS} --max_seq_length ${MAX_SEQ_LENGTH} --channel_size ${CHANNEL_SIZE}
Код будет использовать многопоточность для создания нескольких файлов train_tfrecord. Другие параметры можно изменить в коде.
start_create_process(train_anno_lines, 100, 10, 'train')
start_create_process(validation_anno_lines, 10, 10, 'validation')
start_create_process(test_anno_lines, 10, 10, 'test')
3. **Обучение.**
```python
python train.py --data_dir ${TF_RECRD_DIRS} --model_dir ${MODEL_DIR} --max_seq_length ${MAX_SEQ_LENGTH} --channel_size ${CHANNEL_SIZE}
Тестирование.
python ./eval.py --max_seq_length ${MAX_SEQ_LENGTH} --channel_size ${CHANNEL_SIZE} --model_dir ${MODEL_DIR} --image_list ${LABELS_FILE} --image_dir ${IMAGE_DIR}
Данные в формате image_list можно использовать для ввода. Для просмотра неудачных случаев и пакетного тестирования необходимо реализовать соответствующий код.
Параметр ```export``` позволяет экспортировать модель. Пример кода для чтения сохранённой модели находится в файле ```load_saved_model.py```.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )