Однако у такой каскадной сети есть недостаток: её скорость обратно пропорциональна количеству лиц. Поэтому она не подходит для сценариев с большим количеством снимков. Кроме того, такую сеть сложно обновить.
Позже в научном сообществе появились отличные одноэтапные методы распознавания лиц, такие как SSH, SFD, DSFD, RetinaFace и другие. Эти сети постоянно обновляют список лидеров WiderFace.
Однако хороших лёгких сетей не так много. Среди них можно выделить FaceBoxes, LibFaceDetection, Retinaface-Mnet, LFFD и Ultra-Light-Fast-Generic-Face-Detector.
Исследователи потратили немало усилий на разработку методов тестирования для обновления списка лидеров. Рассмотрим их подробнее:
Многомасштабное тестирование: это основной метод тестирования. Почти все документы используют многомасштабный подход, потому что масштаб входных изображений при обучении сетей различается. С научной точки зрения многомасштабное тестирование считается более справедливым. Проще говоря, каждый участник использует свои лучшие результаты для сравнения.
Тестирование с исходным изображением одного масштаба: этот метод был предложен LFFD. Он также является строгим методом тестирования и более значимым для промышленного сектора.
Тестирование после масштабирования изображения до одного масштаба: FaceBoxes масштабирует изображение в три раза для тестирования. А Ultra-Light-Fast-Generic-Face-Detector изменяет размер изображения до 320x240 и 640x480 для тестирования.
Почти все сравнительные эксперименты строги, но некоторые из них занижают показатели других алгоритмов. Есть несколько возможных причин:
Использование данных из статьи для сравнения: хотя методы тестирования могут быть разными (с использованием различных трюков и различий), сравнение проводится на основе данных из статей. Если невозможно унифицировать методы тестирования, можно сравнить лучшие результаты каждого алгоритма. Это тоже справедливо.
Сравнение результатов тестирования с исходными изображениями одного масштаба: такой подход может быть несправедливым, поскольку разрешение обучающих и тестовых изображений разное. Например, разрешение обучающего изображения SFD составляет 640x640x3, а тестового — 1280x720x3.
Сравнение после масштабирования: FaceBoxes увеличивает изображения FDDB в три раза для теста. После увеличения изображения лица становятся больше, и их легче обнаружить, поэтому производительность немного улучшается.
А Ultra-Light-Fast-Generic-Face-Detector разработан с учётом якорей для разрешения 640x480 или 320x240. Таким образом, точность выше при таком разрешении. Однако такой дизайн ориентирован на промышленные сценарии, и большинство игнорирует эту деталь.
Автор делает следующие выводы относительно лучшего способа оценки распознавания лиц:
Многомасштабное тестирование: использовать лучшие результаты алгоритма в разных масштабах и сравнивать их с лучшими результатами других алгоритмов (обычно это данные из статей).
Одномасштабное тестирование: сравнивать лучшие результаты алгоритмов в одном масштабе.
Для реальных сценариев можно использовать метод тестирования Ultra-Light-Fast-Generic-Face-Detector, чтобы оценить точность в реальных условиях.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )