1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/modelee-layoutlmv3-base

Клонировать/Скачать
README.md 2.2 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 25.11.2024 19:29 9aa7eae

LayoutLMv3

Microsoft Document AI | GitHub

Описание модели

LayoutLMv3 — это предобученный мультимодальный трансформер для Document AI с унифицированным маскированием текста и изображений. Простая унифицированная архитектура и цели обучения делают LayoutLMv3 универсальной предобученной моделью. Например, LayoutLMv3 можно дообучать как для текстовых задач, включая понимание форм, квитанций и ответы на визуальные вопросы по документам, так и для задач, связанных с изображениями, таких как классификация изображений документов и анализ структуры документов.

«LayoutLMv3: предобучение для Document AI с использованием унифицированного маскирования текста и изображения». Юпан Хуан, Тэнчао Лв, Лэй Цуй, Юйтун Лу, Фуру Вэй, ACM Multimedia 2022.

Цитирование

Если вы считаете, что LayoutLM полезен в вашем исследовании, пожалуйста, процитируйте следующую статью:

@inproceedings{huang2022layoutlmv3,
  author={Yupan Huang and Tengchao Lv and Lei Cui and Yutong Lu and Furu Wei},
  title={LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking},
  booktitle={Proceedings of the 30th ACM International Conference on Multimedia},
  year={2022}
}

Лицензия

Содержание этого проекта лицензировано согласно международной лицензии Attribution-NonCommercial-ShareAlike 4.0. Части исходного кода основаны на проекте transformers. Кодекс поведения Microsoft Open Source.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/modelee-layoutlmv3-base.git
git@api.gitlife.ru:oschina-mirror/modelee-layoutlmv3-base.git
oschina-mirror
modelee-layoutlmv3-base
modelee-layoutlmv3-base
main