1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/modelee-convnext-base-224

В этом репозитории не указан файл с открытой лицензией (LICENSE). При использовании обратитесь к конкретному описанию проекта и его зависимостям в коде.
Клонировать/Скачать
README.md 3.2 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 25.11.2024 23:28 dc5a54a

ConvNeXT (базовая модель)

Модель ConvNeXT, обученная на ImageNet-1k с разрешением 224x224. Она была представлена в статье «ConvNet для 2020-х годов» Лю и др. и впервые выпущена в этом репозитории.

Отказ от ответственности: команда, выпустившая ConvNeXT, не писала карточку модели для этой модели, поэтому эта карточка модели была написана командой Hugging Face.

Описание модели

ConvNeXT — это чистая свёрточная модель (ConvNet), вдохновлённая дизайном Vision Transformers, которая утверждает, что превосходит их. Авторы начали с ResNet и «модернизировали» его дизайн, взяв за основу Swin Transformer.

Изображение модели

Предназначение и ограничения

Вы можете использовать необработанную модель для классификации изображений. См. хаб моделей, чтобы найти версии, настроенные на конкретную задачу, которая вас интересует.

Как использовать

Вот как можно использовать эту модель для классификации изображения из набора данных COCO 2017 по одному из 1000 классов ImageNet:

from transformers import ConvNextImageProcessor, ConvNextForImageClassification
import torch
from datasets import load_dataset

dataset = load_dataset("huggingface/cats-image")
image = dataset["test"]["image"][0]

processor = ConvNextImageProcessor.from_pretrained("facebook/convnext-base-224")
model = ConvNextForImageClassification.from_pretrained("facebook/convnext-base-224")

inputs = processor(image, return_tensors="pt")

with torch.no_grad():
    logits = model(**inputs).logits

# модель предсказывает один из 1000 классов ImageNet
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label]),

Дополнительные примеры кода см. в документации.

BibTeX и информация о цитировании

@article{DBLP:journals/corr/abs-2201-03545,
  author    = {Zhuang Liu and
               Hanzi Mao and
               Chao{-}Yuan Wu and
               Christoph Feichtenhofer and
               Trevor Darrell and
               Saining Xie},
  title     = {A ConvNet for the 2020s},
  journal   = {CoRR},
  volume    = {abs/2201.03545},
  year      = {2022},
  url       = {https://arxiv.org/abs/2201.03545},
  eprinttype = {arXiv},
  eprint    = {2201.03545},
  timestamp = {Thu, 20 Jan 2022 14:21:35 +0100},
  biburl    = {https://dblp.org/rec/journals/corr/abs-2201-03545.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/modelee-convnext-base-224.git
git@api.gitlife.ru:oschina-mirror/modelee-convnext-base-224.git
oschina-mirror
modelee-convnext-base-224
modelee-convnext-base-224
main