1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/huiwei13-centerface

Клонировать/Скачать
evaluation.md 6.2 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 29.11.2024 07:04 4de79ef

Распознавание лиц в районе Сяоцзянху

Ход исследования

  • Если говорить о распознавании лиц, то в промышленной сфере, вероятно, все знают MTCNN, поскольку модель имеет небольшой размер, высокую скорость работы, определяет ключевые точки и удобна для развёртывания. Она до сих пор используется в бизнес-процессах крупных компаний.

Однако у такой каскадной сети есть недостаток: её скорость обратно пропорциональна количеству лиц. Поэтому она не подходит для сценариев с большим количеством снимков. Кроме того, такую сеть сложно обновить.

  • Позже в научном сообществе появились отличные одноэтапные методы распознавания лиц, такие как SSH, SFD, DSFD, RetinaFace и другие. Эти сети постоянно обновляют список лидеров WiderFace.

  • Однако хороших лёгких сетей не так много. Среди них можно выделить FaceBoxes, LibFaceDetection, Retinaface-Mnet, LFFD и Ultra-Light-Fast-Generic-Face-Detector.

Методы тестирования

Исследователи потратили немало усилий на разработку методов тестирования для обновления списка лидеров. Рассмотрим их подробнее:

  1. Многомасштабное тестирование: это основной метод тестирования. Почти все документы используют многомасштабный подход, потому что масштаб входных изображений при обучении сетей различается. С научной точки зрения многомасштабное тестирование считается более справедливым. Проще говоря, каждый участник использует свои лучшие результаты для сравнения.

  2. Тестирование с исходным изображением одного масштаба: этот метод был предложен LFFD. Он также является строгим методом тестирования и более значимым для промышленного сектора.

  3. Тестирование после масштабирования изображения до одного масштаба: FaceBoxes масштабирует изображение в три раза для тестирования. А Ultra-Light-Fast-Generic-Face-Detector изменяет размер изображения до 320x240 и 640x480 для тестирования.

Сравнение экспериментов

Почти все сравнительные эксперименты строги, но некоторые из них занижают показатели других алгоритмов. Есть несколько возможных причин:

  1. Использование данных из статьи для сравнения: хотя методы тестирования могут быть разными (с использованием различных трюков и различий), сравнение проводится на основе данных из статей. Если невозможно унифицировать методы тестирования, можно сравнить лучшие результаты каждого алгоритма. Это тоже справедливо.

  2. Сравнение результатов тестирования с исходными изображениями одного масштаба: такой подход может быть несправедливым, поскольку разрешение обучающих и тестовых изображений разное. Например, разрешение обучающего изображения SFD составляет 640x640x3, а тестового — 1280x720x3.

  3. Сравнение после масштабирования: FaceBoxes увеличивает изображения FDDB в три раза для теста. После увеличения изображения лица становятся больше, и их легче обнаружить, поэтому производительность немного улучшается.

А Ultra-Light-Fast-Generic-Face-Detector разработан с учётом якорей для разрешения 640x480 или 320x240. Таким образом, точность выше при таком разрешении. Однако такой дизайн ориентирован на промышленные сценарии, и большинство игнорирует эту деталь.

Заключение

Автор делает следующие выводы относительно лучшего способа оценки распознавания лиц:

  • Многомасштабное тестирование: использовать лучшие результаты алгоритма в разных масштабах и сравнивать их с лучшими результатами других алгоритмов (обычно это данные из статей).

  • Одномасштабное тестирование: сравнивать лучшие результаты алгоритмов в одном масштабе.

Для реальных сценариев можно использовать метод тестирования Ultra-Light-Fast-Generic-Face-Detector, чтобы оценить точность в реальных условиях.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/huiwei13-centerface.git
git@api.gitlife.ru:oschina-mirror/huiwei13-centerface.git
oschina-mirror
huiwei13-centerface
huiwei13-centerface
master