1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/paddlepaddle-PaddleClas

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
README_ch.md 20 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
Отправлено 27.02.2025 14:57 7765f7f

PaddleClas

Введение

Пакет PaddleClas для распознавания изображений от Пайплайн является набором инструментов для промышленного и академического использования, предназначенным для задач распознавания и классификации изображений. Он помогает пользователям создавать лучшие визуальные модели и внедрять их.

Эффект демонстрации системы распознавания изображений PP-ShiTuV2 Эффект демонстрации практических моделей классификации изображений PULC

📣 Последние обновления

  • 🔥 5 ноября 2024 года Добавление низкого уровня программирования для полного цикла разработки в области классификации изображений и поиска изображений:

    • Низкоуровневое программирование для полного цикла разработки с использованием передовых технологий PaddleClas, поддерживающее низкое уровень программирования для полного цикла разработки в области классификации изображений и поиска изображений:
      • 🎨 Модели могут быть легко вызваны: Объединение 98 моделей общего назначения для классификации изображений, многоцелевой классификации изображений, общего распознавания изображений, распознавания лиц в шесть линий моделей. Через простой Python API можно быстро протестировать модели. Кроме того, тот же API также поддерживает детекцию объектов, сегментацию изображений, анализ текстовых изображений, общую OCR, прогноз временных рядов и еще более 200 моделей, образуя более 20 односмысловых модулей, что делает удобной работу с моделями.
      • 🚀 Увеличение производительности и снижение порога входа: Предоставляет использование моделей, их сочетание и кастомизацию через унифицированные команды и графический интерфейс. Поддерживает высокопроизводительное выполнение, сервисное развертывание и развертывание на стороне устройства. Кроме того, при работе с различными основными аппаратными средствами, такими как NVIDIA GPU, Kunlun Chip, Ascend, Cambricon и Hygon, можно бесшовно переключаться между ними.
    • Добавлены алгоритмы классификации изображений MobileNetV4, StarNet, FasterNet
    • Добавлены серверные модели распознавания изображений (изображения с характеристиками) PP-ShiTuV2_rec_CLIP_vit_base, PP-ShiTuV2_rec_CLIP_vit_large
    • Добавлены многолабелевые модели классификации изображений CLIP_vit_base_patch16_448_ML, PP-HGNetV2-B0_ML, PP-HGNetV2-B4_ML, PP-HGNetV2-B6_ML, PP-LCNet_x1_0_ML, ResNet50_ML
    • Добавлены модели распознавания лиц MobileFaceNet, ResNet50_face, а также система распознавания лиц от конца до конца [https://github.com/PaddlePaddle/PaddleX/blob/develop/docs/pipeline_usage/tutorials/cv_pipelines/face_recognition.md].
  • 13 сентября 2022 года выпущена сверхлегкая система распознавания изображений PP-ShiTuV2:

    • Улучшение точности recall1 на 8 пунктов, покрытие 20+ сцен распознавания, таких как распознавание товаров, сортировка мусора, съемка с воздуха,
    • Добавлено управление библиотекой [./deploy/shitu_index_manager/], новое мобильное приложение Android [./docs/zh_CN/quick_start/quick_start_recognition.md] для опыта работы.
  • ещё

🌟 Основные характеристики

PaddleClas поддерживает множество передовых алгоритмов классификации и распознавания изображений, выпускает специализированные сетевые модели для промышленного применения PP-HGNet, PP-LCNetv2, PP-LCNet и полуавтоматическую систему обучения SSLD и создаёт сверхлегкие решения для классификации изображений PULC и системы распознавания изображений PP-ShiTu.

Для методов использования рекомендовано начать с быстрого старта в руководстве.

Быстрый старт

🔥 Низкое уровне программирования для полного цикла разработки

🛠️ Список моделей серии PP

Краткое описание модели Применяемые сценарии Ссылки на скачивание моделей
PULC сверхлегкие модели классификации изображений Фиксированная классификация типов изображений 9 моделей, связанных с человеком, автомобилем и текстом:Ссылка на модель
PP-ShituV2 сверхлегкая система распознавания изображений Для данных с часто меняющимся количеством категорий и большим количеством данных Основная модель детекции:Преобученная модель / Модель для вывода
Модель распознавания:Преобученная модель / Модель для вывода
PP-LCNet сверхлегкая базовая модель Для устройств Intel CPU и MKLDNN PPLCNet_x1_0:Преобученная модель / Модель для вывода
PP-LCNetV2 сверхлегкая базовая модель Для устройств Intel CPU и OpenVINO PPLCNetV2_base:Преобученная модель / Модель для вывода
PP-HGNet высокоточная базовая модель Для устройств GPU с одинаковым временем выполнения PPHGNet_small:Преобученная модель / Модель для вывода

Все ссылки на скачивание моделей доступны в руководстве.

Примеры промышленного применения- Распознавание товаров самообслуживания на основе PP-ShiTuV2: Нажмите здесь

  • Управление видео входа и выхода сотрудников на основе PULC: Нажмите здесь
  • Распознавание товаров в умном супермаркете на основе PP-ShiTu: Нажмите здесь
  • Распознавание электробайков в лифте на основе PP-ShiTu: Нажмите здесь

📖 Guides

Image Recognition System PP-ShiTuV2

PP-ShiTuV2 is a convenient lightweight universal image recognition system consisting of three modules: object detection, feature learning, and vector search. The system uses various strategies to optimize each module, such as selecting and configuring the main network, choosing loss functions, applying data augmentation, using learning rate scheduling strategies, setting regularization parameters, utilizing pre-trained models, and pruning models. Compared to version V1, PP-ShiTuV2 shows an increase in Recall1 by nearly 8 points. For more details, see the detailed description of PP-ShiTuV2.

Effectiveness of the PP-ShiTuV2 Image Recognition System

  • Beverage bottle recognition
  • Product recognition
  • Cartoon character recognition
  • Logo recognition
  • Vehicle recognition

Ultra-lightweight Image Classification Scheme PULC

PULC combines advanced algorithms like the main network, data augmentation, and distillation to automatically obtain ultra-lightweight and high-precision image classification models. PaddleClas provides classification models covering nine common tasks for people, machines, and OCR, with execution time on CPUs as low as 3 milliseconds and accuracy comparable to that of SwinTransformer.

Practical Efficiency of PULC Image Classification Models

License

The distribution of this project is governed by the Apache License 2.0.

Code Contributions

We are very grateful for your contributions to PaddleClas and thank you for your feedback. If you would like to contribute to PaddleClas, please read our contribution guide.

  • Big thanks to for fixing the configuration file for data augmentation in PaddleClas.
  • Big thanks to for correcting some spelling errors in the PaddleClas documentation.
  • Big thanks to for adding ViT, DeiT, and RepVGG models to PaddleClas.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/paddlepaddle-PaddleClas.git
git@api.gitlife.ru:oschina-mirror/paddlepaddle-PaddleClas.git
oschina-mirror
paddlepaddle-PaddleClas
paddlepaddle-PaddleClas
release/2.6