RetinaFace-mnet optimal 1600 single-scale val set составил 0,887 (Easy) / 0,87 (Medium) / 0,791 (Hard).
Модель | 1 ядро | 2 ядра | 3 ядра | 4 ядра |
---|---|---|---|---|
libfacedetection v1 | 28 | 16 | 12 | 9,7 |
Official Retinaface-Mobilenet-0.25 (Mxnet) version-slim | 29 | 16 | 12 | 9,5 |
Official Retinaface-Mobilenet-0.25 (Mxnet), версия-RFB | 35 | 19,6 | 14,8 | 11 |
— Raspberry Pi 4B MNN Inference Latency (единица измерения: мс) (ARM/A72x4/1,5 ГГц/разрешение ввода: 320x240 / квантование int8).
Модель | Время логического вывода (мс) |
---|---|
iPhone 6s Plus MNN (тег версии: 0.2.1.5) | — |
slim-320 | 6,33 |
RFB-320 | 7,8 |
— Kendryte K210 NNCase Inference Latency (RISC-V/400 МГц/разрешение ввода: 320x240 / квантование int8) — данные предоставлены NNCase.
Модель | Время логического вывода (мс) |
---|---|
slim-320 | 65,6 |
RFB-320 | 164,8 |
Модель | Размер файла модели (МБ) |
---|---|
Libfacedetection v1 (caffe) | 2,58 |
Libfacedetection v2 (caffe) | 3,34 |
Official Retinaface-Mobilenet-0,25 (Mxnet) | 1,68 |
Version-slim | 1,04 |
Version-RFB | 1,11 |
Загрузите официальный веб-сайт набора данных wideface или загрузите предоставленный мной обучающий набор и распакуйте его в папку ./data: (1) Чистый пакет данных wideface после фильтрации лиц размером 10 пикселей * 10 пикселей: Baidu cloud disk (код извлечения: cbiu), Google Drive; (2) Полный пакет данных сжатия wideface без фильтрации маленьких лиц: Baidu cloud disk (код извлечения: ievk), Google Drive.
(PS: Если вы загрузили отфильтрованные пакеты в (1), вам не нужно выполнять этот шаг) Поскольку в wideface много маленьких и неясных лиц, что не способствует сходимости эффективных моделей, для обучения необходимо выполнить фильтрацию. По умолчанию будут отфильтрованы лица размером менее 10 пикселей на 10 пикселей. Запустите ./data/wider_face_2_voc_add_landmark.py:
python3 ./data/wider_face_2_voc_add_landmark.py
После запуска программы и её завершения в каталоге ./data будет создана папка wider_face_add_lm_10_10. Папка data и пакет данных (1) после распаковки совпадают. Полная структура каталогов выглядит следующим образом:
data/
retinaface_labels/
test/
train/
val/
wider_face/
WIDER_test/
WIDER_train/
WIDER_val/
wider_face_add_lm_10_10/
Annotations/
ImageSets/
JPEGImages/
wider_face_2_voc_add_landmark.py
На данный момент обучающий набор VOC готов. В корневом каталоге проекта есть два скрипта: train-version-slim.sh и train-version-RFB.sh. Первый используется для обучения модели slim версии, а второй — для обучения модели RFB версии. Параметры по умолчанию уже установлены, если параметры необходимо изменить, обратитесь к описанию каждого параметра обучения в ./train.py.
Запустите train-version-slim.sh или train-version-RFB.sh:
sh train-version-slim.sh or sh train-version-RFB.sh
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )