Документ-OCR

Относительно полный проект анализа и распознавания документов, который включает в себя следующие пять частей:

Анализ данных документа;
Инструмент синтеза данных распознавания;
Модель анализа макета документа;
Модель распознавания текстовых строк;
Модель распознавания отдельных слов.

Данные

Данные генерируются путём анализа открытых годовых отчётов публичных компаний, доступных в сети в формате PDF. Данные содержат информацию о местоположении изображений и текста.

Пример образца

Скачать с диска, код извлечения: nn1g

Текстовые данные помечены для текстовых строк. Некоторые данные могут содержать некоторые дефекты. Всего имеется 34 000 образцов.

Можно создать данные для распознавания текстовых строк на основе помеченных данных.

Синтез данных распознавания

Инструмент синтеза данных для отдельных слов и текстовых строк может эффективно фильтровать символы, которые не поддерживаются шрифтом.

Реализация соответствующих алгоритмов

Весь код зависит от Tensorflow 1.14 и opencv 3.x.

Примечание

В коде есть много мест, требующих доработки, они здесь не перечислены. Приглашаем к обсуждению различных проблем.
Во многих параметрах кода не указано использование командной строки, например, learning_rate и т. д. Рекомендуется внимательно прочитать код при использовании.

OSCHINA-MIRROR/rockyzheng-document-ocr

Документ-OCR

Данные

Синтез данных распознавания

Реализация соответствующих алгоритмов

Примечание

Опубликовать ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/rockyzheng-document-ocr .gitee-modal { min-width: 500px !important; } .gitee-modal .close { right: 0.6rem !important; }

Документ-OCR

Данные

Синтез данных распознавания

Реализация соответствующих алгоритмов

Примечание

Опубликовать ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/rockyzheng-document-ocr