Фото в мультфильм
Цель стилизации портрета под мультфильм — преобразовать реальные фотографии в изображения с мультяшным стилем, сохранив информацию об идентичности и детали текстуры. Мы используем метод генеративно-состязательной сети для сопоставления картинки с мультфильмом. Учитывая сложность получения парных данных и несоответствие формы ввода и вывода, мы применяем метод непарного перевода изображений.
Недавно Ким и др. предложили новую функцию нормализации (AdaLIN) и модуль внимания в статье «U-GAT-IT» и достигли превосходных результатов в преобразовании селфи в аниме. В отличие от преувеличенного стиля аниме, наш мультяшный стиль более реалистичен и содержит однозначную информацию об идентичности.
Мы предлагаем метод Soft Adaptive Layer-Instance Normalization (Soft-AdaLIN), который объединяет статистику кодирующих и декодирующих признаков при стандартизации.
На основе U-GAT-IT мы ввели два модуля песочных часов перед энкодером и после декодера, чтобы постепенно улучшить производительность.
В исходном проекте мы добавили потерю Face ID (косинусное расстояние между признаками ID входного изображения и изображения мультфильма), чтобы достичь инвариантности идентичности (потеря Face ID не добавлена в этом репозитории, пожалуйста, обратитесь к photo2cartoon).
Также мы предварительно обрабатываем данные по фиксированному шаблону, чтобы облегчить оптимизацию. Подробнее см. ниже.
from ppgan.apps import Photo2CartoonPredictor
p2c = Photo2CartoonPredictor()
p2c.run('test_img.jpg')
Подготовка наборов данных:
Тренировочные данные содержат портретные фотографии (домен A) и мультяшные изображения (домен B), которые можно скачать с baidu driver(пароль: fo8u). Структура набора данных следующая:
├── data
└── photo2cartoon
├── trainA
├── trainB
├── testA
└── testB
Обучение:
python -u tools/main.py --config-file configs/ugatit_photo2cartoon.yaml
модель | ссылка |
---|---|
photo2cartoon_genA2B | photo2cartoon_genA2B |
@inproceedings{Kim2020U-GAT-IT:,
title={U-GAT-IT: Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation},
author={Junho Kim and Minjae Kim and Hyeonwoo Kang and Kwang Hee Lee},
booktitle={International Conference on Learning Representations},
year={2020}
}
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )