Обновление версии EasyPR
======
В данной версии 1.6alpha были внесены следующие улучшения:
Использование обучения на основе серых тонов и новых признаков повысило точность распознавания китайских символов до 86%, что на 14% выше по сравнению с предыдущей версией.
Улучшение алгоритмов разделения и распознавания символов привело к повышению полной точности распознавания (0-error) на general_test с 59% до 70%, а точность с 1-error увеличилась до 82%.
В модуле распознавания номерных знаков были использованы новые признаки SVM (цвет + проекция), что позволило повысить точность распознавания, сохранив при этом устойчивость. Индикатор FScore увеличился с 76% до 82%.
Введена новая методика разделения символов — groundMSER.
Предоставлено около 10 000 изображений серых тонов китайских символов для обучения, а также добавлен метод извлечения китайских и английских символов из набора номерных знаков от free-мастера в главном интерфейсе.
Предоставлено 22 000 изображений серых тонов для обучения модели распознавания символов серых тонов.
Улучшение и оптимизация кода, исправление многих ошибок.
Поддержка OpenCV 3.2, для компиляции достаточно изменить #define CV_VERSION_THREE_ZERO на #define CV_VERSION_THREE_TWO в config.h.
Улучшенная поддержка версий для Linux и Mac, использование CMake для успешной компиляции, отдельные utf-8 и gbk файлы для соответствующих систем.======
В данной версии EasyPR 1.5 были внесены следующие улучшения по сравнению с бета-версией:
Исправлена ошибка обучения SVM, теперь версия 1.5 позволяет свободно использовать SVM для обучения. Это действительно ошибка OpenCV, подробнее см. обсуждение, спасибо @tka за информацию. Замечание: OpenCV 3.2 также исправил эту ошибку, поэтому если вы используете 3.2 версию, то тоже можете использовать SVM для обучения. Однако неизвестно, не введет ли 3.2 версия других проблем, поэтому в текущей версии EasyPR использование 3.0 или 3.1 версий также позволяет избежать ошибок обучения.
Поддержка компиляции для Linux и Mac, если возникнут проблемы, пожалуйста, задайте вопрос в issue.
Введена версия для ленивых, не требующая настройки OpenCV. Поддерживает только VS2013 и работает только в режиме отладки и x86, для других случаев все же потребуется настройка OpenCV. Спасибо Фану Ваньцзяю за помощь. Необходимо скачать оба файла со страницы, после чего распаковать их с помощью 7zip.
Другие основные улучшения:
* Изображение с очень низким контрастом
При практической реализации использовались методы локализации текста и цвета. Результаты тестирования на 256 тестовых изображениях представлены ниже:
Использование алгоритма непрерывного максимума для удаления соседних номерных знаков, что делает конечный вывод более рациональным. Независимо от использования нескольких методов локализации, конечный вывод будет содержать только один номерной знак, и это будет наиболее вероятный номерной знак.
Использование метода бинаризации с использованием порогового значения Оцу на основе локального пространства и адаптивного порогового значения улучшило точность сегментации текста и распознавания символов.* Изображение номерного знака
Новый SVM-модель и признаки (LBP) улучшили устойчивость распознавания номерных знаков, а новый китайский ANN-модель распознавания текста улучшил общую точность распознавания китайского текста на 15 процентных пунктов.
Добавлен метод Grid Search для автоматической настройки параметров.
Впервые добавлена поддержка многопоточности, используя OpenMP для методов локализации текста, что улучшило конечную скорость распознавания примерно вдвое по сравнению с однопоточными методами.
Заменены некоторые китайские комментарии, что позволяет Visual Studio на Windows корректно компилировать файлы, завершающиеся символом LF. В настоящее время программа, правильно настроенная с использованием OpenCV, может быть скомпилирована и запущена непосредственно из ZIP-архива с gitosc.
Для получения более подробной информации о данных изменениях можно посмотреть введение.
======
В этом обновлении версии 1.4 основные улучшения касаются нескольких аспектов:1. Код унифицирован в UTF-8 формате, что позволяет избежать появления нечитаемых символов в многоплатформенных оболочках. Поддержка OpenCV 3.0 и 3.1, обратите внимание, что это несовместимо с OpenCV 2.x. Если вы хотите поддерживать это, пожалуйста, скачайте версию 1.3.
Обучение ANН открыто.
Исправлена проблема с аномальным поведением при обучении SVM.
Оптимизация кода.
Если вы не знаете, как скачать предыдущие версии, вы можете выбрать "tags" в разделе "branch" на GitHub или GitOSC, затем нажать на "v1.3" и затем на "download zip". Конечно, если вы используете git clone, вы сможете легко переключаться между версиями.
В последующих версиях планируется сделать следующие улучшения:
Новый оценочный фреймворк, более рациональная оценка данных.
Новый алгоритм локализации номерного знака.
======
Это обновление версии 1.3beta, основные улучшения заключаются в повышении точности модуля распознавания символов:
Средняя дистанция символов уменьшилась с 0.7 до 0.4, полное совпадение увеличилось с 68% до 81%, среднее время выполнения уменьшилось с 2 секунды до 1.5 секунды. См. Следующий рисунок:
Основные изменения:
Текущая версия имеет проблему с высоким временем обработки, в версии 1.3 будет исправлена эта проблема.
======
Это обновление версии 1.3alpha, основные улучшения заключаются в повышении точности модуля распознавания символов:
Средняя дистанция символов уменьшилась с 2.0 до 0.7, полное совпадение увеличилось с 25% до 68%.
При этом точность модуля локализации номерного знака также повысилась с 94% в предыдущей версии до 99% в текущей версии. См. Следующий рисунок:
Основные изменения:
Улучшен алгоритм распознавания символов, заново обучен ANN, что значительно повысило точность распознавания символов.
Использован более робастный метод для повышения точности модуля локализации номерного знака.
Текущая версия имеет проблему с высоким временем обработки, в версии 1.3 будет исправлена эта проблема.
======
Это обновление версии 1.2, основные улучшения заключаются в повышении точности модуля локализации номерного знака, с 70% до 94%, см. Следующий рисунок:
Основные изменения:* Локализация номерного знака использует комбинированный метод поиска, который включает "цветовую информацию" и "вторичный Sobel". В окне ниже красный прямоугольник представляет результат локализации Sobel, а желтый прямоугольник представляет результат локализации по цвету.* "Пакетное тестирование" добавлено окно просмотра результатов, которое можно открыть или закрыть с помощью метода SetDebug() (true для открытия, false для закрытия).
В GDTS добавлены новые тестовые изображения, включая несколько изображений с большим углом.
Результаты "пакетного тестирования" теперь сохраняются в файле "run_accuracy", что позволяет просматривать исторические данные.
Интеграция с версией для Linux позволяет осуществлять кросс-платформенную компиляцию.
======
Текущая версия EasyPR - OnClickListener. В сравнении с предыдущей версией 1.0, были внесены следующие изменения (из-за большого объёма обновлений, чтобы избежать конфликтов с вашими текущими проектами и кодом, рекомендуется осторожно выбирать полное обновление, лучше всего создать новый каталог для тестирования новых функций и контента):
Добавлены два новых метода извлечения признаков. Также предоставлены соответствующие интерфейсы обратного вызова для вторичной разработки.
Добавлен режим отладки. В папке image/tmp можно увидеть все промежуточные изображения.
* Добавлены общие индикаторы. Введено расстояние Левенштейна как критерий для оценки точности распознавания и как основа для улучшения.
Пожалуйста, распакуйте архив train/data/plate_detect_svm/learn для просмотра дополнительной информации.
Примечание: Если кто-то из студентов скачал файл test.jpg из папки image в предыдущей версии, пожалуйста, удалите его. Формат этого файла не соответствует новому соглашению GDSL. Если вы хотите использовать тестовые изображения, вы можете использовать новый файл test.jpg из версии 1.1.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )