OSCHINA-MIRROR/huiwei13-Ultra-Light-Fast-Generic-Face-Detector-1MB

RetinaFace-mnet optimal 1600 single-scale val set составил 0,887 (Easy) / 0,87 (Medium) / 0,791 (Hard).

Скорость логического вывода на терминальном устройстве

Модель	1 ядро	2 ядра	3 ядра	4 ядра
libfacedetection v1	28	16	12	9,7
Official Retinaface-Mobilenet-0.25 (Mxnet) version-slim	29	16	12	9,5
Official Retinaface-Mobilenet-0.25 (Mxnet), версия-RFB	35	19,6	14,8	11

— Raspberry Pi 4B MNN Inference Latency (единица измерения: мс) (ARM/A72x4/1,5 ГГц/разрешение ввода: 320x240 / квантование int8).

Модель	Время логического вывода (мс)
iPhone 6s Plus MNN (тег версии: 0.2.1.5)	—
slim-320	6,33
RFB-320	7,8

— Kendryte K210 NNCase Inference Latency (RISC-V/400 МГц/разрешение ввода: 320x240 / квантование int8) — данные предоставлены NNCase.

Модель	Время логического вывода (мс)
slim-320	65,6
RFB-320	164,8

Сравнение размеров моделей

Модель	Размер файла модели (МБ)
Libfacedetection v1 (caffe)	2,58
Libfacedetection v2 (caffe)	3,34
Official Retinaface-Mobilenet-0,25 (Mxnet)	1,68
Version-slim	1,04
Version-RFB	1,11

Генерация обучающего набора данных формата VOC и процесс обучения

Загрузите официальный веб-сайт набора данных wideface или загрузите предоставленный мной обучающий набор и распакуйте его в папку ./data: (1) Чистый пакет данных wideface после фильтрации лиц размером 10 пикселей * 10 пикселей: Baidu cloud disk (код извлечения: cbiu), Google Drive; (2) Полный пакет данных сжатия wideface без фильтрации маленьких лиц: Baidu cloud disk (код извлечения: ievk), Google Drive.
(PS: Если вы загрузили отфильтрованные пакеты в (1), вам не нужно выполнять этот шаг) Поскольку в wideface много маленьких и неясных лиц, что не способствует сходимости эффективных моделей, для обучения необходимо выполнить фильтрацию. По умолчанию будут отфильтрованы лица размером менее 10 пикселей на 10 пикселей. Запустите ./data/wider_face_2_voc_add_landmark.py:

python3 ./data/wider_face_2_voc_add_landmark.py

После запуска программы и её завершения в каталоге ./data будет создана папка wider_face_add_lm_10_10. Папка data и пакет данных (1) после распаковки совпадают. Полная структура каталогов выглядит следующим образом:

data/
retinaface_labels/
test/
train/
val/
wider_face/
WIDER_test/
WIDER_train/
WIDER_val/
wider_face_add_lm_10_10/
Annotations/
ImageSets/
JPEGImages/
wider_face_2_voc_add_landmark.py

На данный момент обучающий набор VOC готов. В корневом каталоге проекта есть два скрипта: train-version-slim.sh и train-version-RFB.sh. Первый используется для обучения модели slim версии, а второй — для обучения модели RFB версии. Параметры по умолчанию уже установлены, если параметры необходимо изменить, обратитесь к описанию каждого параметра обучения в ./train.py.
Запустите train-version-slim.sh или train-version-RFB.sh:

sh train-version-slim.sh or sh train-version-RFB.sh