💎 Основы YOLOv5 для распознавания жестов
Этот проект представляет собой тренировку на основе YOLOv5 v6.0 и является демонстрационным. Его цель — продемонстрировать ценность и значимость скрипта opencv-webcam-script в создании компьютерного визуального набора данных.
Набор данных Gesture v1.0 был собран с помощью скрипта opencv-webcam-script и размечен с использованием label-studio PyPi версии. Формат разметки — Pascal VOC XML.
⚡ 2022-02-05
Набор данных Gesture v1.0 официально открыт на Kaggle.
📌 Исходный набор данных: gesture_v1_raw
📌 Размеченный набор данных: gesture_v1_annotation
📌 Набор данных для тренировки и проверки YOLOv5: gesture_v1_yolov5
Набор данных Gesture v1.0 собран с использованием opencv-webcam-script v0.5. В автоматическом режиме он собирает один кадр каждые 5 кадров, всего собрано 500 изображений. Команда выглядит следующим образом:
python opencv_webcam.py -isasf -fsd gesture -fdn one -fns 5 -afn 2500 # В качестве примера используется класс one, для других классов аналогично
Журнал сбора данных выглядит следующим образом:
2022-01-30 21:01:18
Автоматический режим: Всего собрано 500 кадров, сохранено в: gesture/one
Время: 2 минуты 43,001 секунды
2022-01-30 21:05:53
Автоматический режим: Всего собрано 500 кадров, сохранено в: gesture/two
Время: 2 минуты 44,675 секунд
2022-01-30 21:11:17
Автоматический режим: Всего собрано 500 кадров, сохранено в: gesture/three
Время: 2 минуты 40,040 секунд
2022-01-30 21:14:37
Автоматический режим: Всего собрано 500 кадров, сохранено в: gesture/four
Время: 2 минуты 43,015 секунд
2022-01-30 21:17:51
Автоматический режим: Всего собрано 500 кадров, сохранено в: gesture/five
Время: 2 минуты 42,426 секунд
Свойство набора данных | Значение параметра |
---|---|
Общее количество исходных изображений | 2500 |
Общее количество размеченных изображений | 2417 |
Общий объём данных | 183,2 МБ |
Общее число экземпляров | 4159 |
Размер изображения | 640x480 |
Класс | Количество экземпляров | Количество размеченных изображений | Исходное количество изображений |
---|---|---|---|
one | 894 | 495 | 500 |
two | 804 | 487 | 500 |
three | 837 | 484 | 500 |
four | 807 | 480 | 500 |
five | 817 | 471 | 500 |
Название | Количество | Доля |
---|---|---|
Тренировочный набор | 1916 | 0,793 |
Проверочный набор | 501 | 0,207 |
Класс | Общее количество экземпляров | Количество в тренировочном наборе | Количество в проверочном наборе | Доля в тренировочном наборе | Доля в проверочном наборе |
---|---|---|---|---|---|
one | 894 | 709 | 185 | 79,31 % | 20,69 % |
two | 804 | 635 | 169 | 78,98 % | 21,02 % |
three | 837 | 670 | 167 | 80,05 % | 19,95 % |
four | 807 | 636 | 171 | 78,81 % | 21,19 % |
five | 817 | 655 | 162 | 80,17 % | 19,83 % |
Этот проект основан на операционной системе Ubuntu Linux, использует label-studio (PyPi версия) для разметки данных и YOLOv5 v6.0 (клон) для обучения.
Программное обеспечение | Версия |
---|---|
Операционная система | Ubuntu Linux 20.04.2 LTS |
Драйвер видеокарты | NVIDIA 460.80 |
CUDA | 11.1.1 |
cuDNN | 8.0.5.39 |
Anaconda | 4.10.1 |
Python | 3.8.10 |
PyTorch | 1.9.0 |
❤️ YOLOv5 | v6.0 (клон) |
❤️ label-studio | 1.4 (PyPi версия) |
Аппаратное обеспечение | Модель | Объём | Количество |
---|---|---|---|
Процессор | CORE i9 10900K | — | 1 |
Видеокарта | ROG-STRIX-RTX3090-O24G-GAMING | 24 ГБ | 1 |
Память | CORSAIR VENGEANCE DDR4 16G 3600 |
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )