1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/xinntao-BasicSR

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
ModelZoo.md 12 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
Отправлено 11.03.2025 09:08 d8428c6

Каталог моделей и базовых линий

English | Русский

Скачивание: ⏬ Google Drive: Предобученные модели | Переобученные эксперименты ⏬ Baidu Netdisk: Предобученные модели | Переобученные эксперименты

📈 Кривые обучения в WandB


Мы предоставляем:

  1. Официальные модели, преобразованные непосредственно из официально выпущенных моделей
  2. Переобученные модели с использованием BasicSR. Предобученные модели и примеры логов предоставляются

Вы можете поместить скачанные модели в папку experiments/pretrained_models.

[Скачать официальные предобученные модели] (Google Drive, Baidu Netdisk)

Вы можете использовать скрипт для скачивания предобученных моделей с Google Drive.

python scripts/download_pretrained_models.py ESRGAN
# метод может быть ESRGAN, EDVR, StyleGAN, EDSR, DUF, DFDNet, dlib

[Скачать переобученные модели и логи] (Google Drive, Baidu Netdisk)

Кроме того, мы загружаем процесс обучения и кривые обучения в WandB.

Кривые обучения в WandB

Содержание

  1. Изображение сверхразрешения
    1. Официальные модели изображения сверхразрешения
    2. Переобученные модели изображения сверхразрешения
  2. Видео сверхразрешения

Изображение сверхразрешения

При оценке:

  • Мы вырезаем scale пикселей границы со всех сторон
  • Оценивается на каналах RGB

Официальные модели изображения сверхразрешения

Имя эксперимента Set5 (PSNR/SSIM) Set14 (PSNR/SSIM) DIV2K100 (PSNR/SSIM)
EDSR_Mx2_f64b16_DIV2K_official-3ba7b086 35.7768 / 0.9442 31.4966 / 0.8939 34.6291 / 0.9373
EDSR_Mx3_f64b16_DIV2K_official-6908f88a 32.3597 / 0.903 28.3932 / 0.8096 30.9438 / 0.8737
EDSR_Mx4_f64b16_DIV2K_official-0c287733 30.1821 / 0.8641 26.7528 / 0.7432 28.9679 / 0.8183
EDSR_Lx2_f256b32_DIV2K_official-be38e77d 35.9979 / 0.9454 31.8583 / 0.8971 35.0495 / 0.9407
EDSR_Lx3_f256b32_DIV2K_official-3660f70d 32.643 / 0.906 28.644 / 0.8152 31.28 / 0.8798
EDSR_Lx4_f256b32_DIV2K_official-76ee1c8f 30.5499 / 0.8701 27.0011 / 0.7509 29.277 / 0.8266

Переобученные модели для увеличения разрешения изображений

Конвенция названий экспериментов указана в Config.md.|Имя эксперимента | Set5 (PSNR/SSIM) | Set14 (PSNR/SSIM) | DIV2K100 (PSNR/SSIM) | | :--------------------- | :-----------: | :-----------: |:-----------: | | 001_MSRResNet_x4_f64b16_DIV2K_1000k_B16G1_wandb | 30.2468 / 0.8651 | 26.7817 / 0.7451 | 28.9967 / 0.8195 | | 002_MSRResNet_x2_f64b16_DIV2K_1000k_B16G1_001pretrain_wandb | 35.7483 / 0.9442 | 31.5403 / 0.8937 | 34.6699 / 0.9377 | | 003_MSRResNet_x3_f64b16_DIV2K_1000k_B16G1_001pretrain_wandb | 32.4038 / 0.9032 | 28.4418 / 0.8106 | 30.9726 / 0.8743 | | 004_MSRGAN_x4_f64b16_DIV2K_400k_B16G1_wandb | 28.0158 / 0.8087 | 24.7474 / 0.6623 | 26.6504 / 0.7462 | | | | | | | 201_EDSR_Mx2_f64b16_DIV2K_300k_B16G1_wandb | 35.7395 / 0.944 | 31.4348 / 0.8934 | 34.5798 / 0.937 | | 202_EDSR_Mx3_f64b16_DIV2K_300k_B16G1_201pretrain_wandb | 32.315 / 0.9026 | 28.3866 / 0.8088 | 30.9095 / 0.8731 | | 203_EDSR_Mx4_f64b16_DIV2K_300k_B16G1_201pretrain_wandb | 30.1726 / 0.8641 | 26.721 / 0.743 | 28.9506 / 0.818 | | 204_EDSR_Lx2_f256b32_DIV2K_300k_B16G1_wandb | 35.9792 / 0.9453 | 31.7284 / 0.8959 | 34.9544 / 0.9399 | | 205_EDSR_Lx3_f256b32_DIV2K_300k_B16G1_204pretrain_wandb | 32.6467 / 0.9057 | 28.6859 / 0.8152 | 31.2664 / 0.8793 | | 206_EDSR_Lx4_f256b32_DIV2K_300k_B16G1_204pretrain_wandb | 30.4718 / 0.8695 | 26.9616 / 0.7502 | 29.2621 / 0.8265 |## Увеличение разрешения видео

Оценка

При оценке мы используем все входные кадры и не вырезаем никаких пикселей с границ, если это не указано явно.
Мы не используем стратегию самосборки (тестирование с отражением) и любые другие методы послепроцессинга.

EDVR

Конвенция названий

EDVR_(набор данных обучения)_(название трека)_(сложность модели)- название трека. В НТИРЕ 2019 Challenge по восстановлению и улучшению видео есть четыре трека:

  • SR: сверхразрешение с фиксированной функцией понижения разрешения (часто используется MATLAB bicubic downsampling kernel). Большинство предыдущих методов сверхразрешения видео сосредоточены на этом наборе задач.
  • SRblur: входные данные также повреждены движением.
  • deblur: стандартное удаление движения (движение).
  • deblurcomp: движение + артефакты сжатия видео.
  • сложность модели
    • L (Большая): количество каналов = 128, количество обратных блоков Residual = 40. Этот набор используется в нашем конкурсе.
    • M (Средняя): количество каналов = 64, количество обратных блоков Residual = 10.
Название модели [Набор тестовых данных] PSNR/SSIM
EDVR_Vimeo90K_SR_L [Vid4] (Y1) 27,35/0,8264 [↓Результаты]
(RGB) 25,83/0,8077
EDVR_REDS_SR_M [REDS] (RGB) 30,53/0,8699 [↓Результаты]
EDVR_REDS_SR_L [REDS] (RGB) 31,09/0,8800 [↓Результаты]
EDVR_REDS_SRblur_L [REDS] (RGB) 28,88/0,8361 [↓Результаты]
EDVR_REDS_deblur_L [REDS] (RGB) 34,80/0,9487 [↓Результаты]
EDVR_REDS_deblurcomp_L [REDS] (RGB) 30,24/0,8567 [↓Результаты]

Модели второго этапа для соревнования NTIRE19

Название модели [Набор тестовых данных] PSNR/SSIM
EDVR_REDS_SR_Stage2 [REDS] (RGB) / [↓Результаты]
EDVR_REDS_SRblur_Stage2 [REDS] (RGB) / [↓Результаты]
EDVR_REDS_deblur_Stage2 [REDS] (RGB) / [↓Результаты]
EDVR_REDS_deblurcomp_Stage2 [REDS] (RGB) / [↓Результаты]

DUF

Модели были преобразованы из официально выпущенных моделей.

Название модели [Набор тестовых данных] PSNR/SSIM1 Официальные результаты2
DUF_x4_52L_official3 [Vid4] (Y4) 27,33/0,8319 [↓Результаты]
(RGB) 25,80/0,8138
(Y) 27,33/0,8318 [↓Результаты]
(RGB) 25,79/0,8136
DUF_x4_28L_official [Vid4]
DUF_x4_16L_official [Vid4]
DUF_x3_16L_official [Vid4]
DUF_x2_16L_official [Vid4]

1 Y или RGB указывают на оценку по каналу Y (луминанса) или RGB.

2 Официальные результаты получены путём запуска официальных кодов и моделей.

3 В отличие от официальных кодов, где используется нулевое заполнение для краевых кадров, мы используем стратегию new_info.

4 Y или RGB указывают на оценку по каналу Y (луминанса) или RGB.

TOFМодели были преобразованы из официально выпущенных моделей.

Название модели [Набор тестовых данных] PSNR/SSIM Официальные результаты1
TOF_official2 [Vid4] (Y3) 25.86/0.7626 [↓Результаты]
(RGB) 24.38/0.7403
(Y) 25.89/0.7651 [↓Результаты]
(RGB) 24.41/0.7428

1 Официальные результаты получены путём запуска официального кода и моделей. Обратите внимание, что TOFlow не предоставляет стратегию восстановления границ кадров, а мы просто используем стратегию replicate для границ кадров.
2 Преобразованная модель имеет немного отличающиеся результаты из-за различий в реализации. Мы используем стратегию new_info для границ кадров.
3 Y или RGB указывают на оценку по каналу Y (луминосность) или каналам RGB.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/xinntao-BasicSR.git
git@api.gitlife.ru:oschina-mirror/xinntao-BasicSR.git
oschina-mirror
xinntao-BasicSR
xinntao-BasicSR
master