Относительно полный проект анализа и распознавания документов, который включает в себя следующие пять частей:
Данные генерируются путём анализа открытых годовых отчётов публичных компаний, доступных в сети в формате PDF. Данные содержат информацию о местоположении изображений и текста.
Скачать с диска, код извлечения: nn1g
Текстовые данные помечены для текстовых строк. Некоторые данные могут содержать некоторые дефекты. Всего имеется 34 000 образцов.
Можно создать данные для распознавания текстовых строк на основе помеченных данных.
Инструмент синтеза данных для отдельных слов и текстовых строк может эффективно фильтровать символы, которые не поддерживаются шрифтом.
Весь код зависит от Tensorflow 1.14 и opencv 3.x.
В коде есть много мест, требующих доработки, они здесь не перечислены. Приглашаем к обсуждению различных проблем.
Во многих параметрах кода не указано использование командной строки, например, learning_rate и т. д. Рекомендуется внимательно прочитать код при использовании.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )