Модель ResNet, предварительно обученная на ImageNet-1k с разрешением 224x224. Представлена в статье «Глубокое остаточное обучение для распознавания изображений» (Deep Residual Learning for Image Recognition) Хе и др.
Отказ от ответственности: команда, выпустившая ResNet, не писала карточку модели, поэтому эта карточка модели была написана командой Hugging Face.
ResNet (остаточная сеть) — это свёрточная нейронная сеть, которая демократизировала концепции остаточного обучения и пропускных соединений. Это позволяет обучать гораздо более глубокие модели.
Это версия ResNet v1.5, которая отличается от оригинальной модели: в блоках узких мест, требующих понижающей дискретизации, v1 имеет шаг = 2 в первой свёртке 1x1, тогда как v1.5 имеет шаг = 2 в свёртке 3x3. Это различие делает ResNet50 v1.5 немного более точным (~0,5% top1), чем v1, но приводит к небольшому снижению производительности (~5% imgs/sec) согласно Nvidia.
Вы можете использовать необработанную модель для классификации изображений. См. модельный хаб, чтобы найти настроенные версии для интересующей вас задачи.
Вот как можно использовать эту модель для классификации изображения из набора данных COCO 2017 по одному из 1000 классов ImageNet:
from transformers import AutoImageProcessor, ResNetForImageClassification
import torch
from datasets import load_dataset
dataset = load_dataset("huggingface/cats-image")
image = dataset["test"]["image"][0]
processor = AutoImageProcessor.from_pretrained("microsoft/resnet-50")
model = ResNetForImageClassification.from_pretrained("microsoft/resnet-50")
inputs = processor(image, return_tensors="pt")
with torch.no_grad():
logits = model(**inputs).logits
# модель предсказывает один из 1000 классов ImageNet
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])
Дополнительные примеры кода см. в документации.
@inproceedings{he2016deep,
title={Deep residual learning for image recognition},
author={He, Kaiming and Zhang, Xiangyu and Ren, Shaoqing and Sun, Jian},
booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
pages={770--778},
year={2016}
}
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )