README.md · OSCHINA-MIRROR/modelee-layoutlmv3-base

LayoutLMv3

Microsoft Document AI | GitHub

Описание модели

LayoutLMv3 — это предобученный мультимодальный трансформер для Document AI с унифицированным маскированием текста и изображений. Простая унифицированная архитектура и цели обучения делают LayoutLMv3 универсальной предобученной моделью. Например, LayoutLMv3 можно дообучать как для текстовых задач, включая понимание форм, квитанций и ответы на визуальные вопросы по документам, так и для задач, связанных с изображениями, таких как классификация изображений документов и анализ структуры документов.

«LayoutLMv3: предобучение для Document AI с использованием унифицированного маскирования текста и изображения». Юпан Хуан, Тэнчао Лв, Лэй Цуй, Юйтун Лу, Фуру Вэй, ACM Multimedia 2022.

Цитирование

Если вы считаете, что LayoutLM полезен в вашем исследовании, пожалуйста, процитируйте следующую статью:

@inproceedings{huang2022layoutlmv3,
  author={Yupan Huang and Tengchao Lv and Lei Cui and Yutong Lu and Furu Wei},
  title={LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking},
  booktitle={Proceedings of the 30th ACM International Conference on Multimedia},
  year={2022}
}

Лицензия

Содержание этого проекта лицензировано согласно международной лицензии Attribution-NonCommercial-ShareAlike 4.0. Части исходного кода основаны на проекте transformers. Кодекс поведения Microsoft Open Source.

OSCHINA-MIRROR/modelee-layoutlmv3-base

Описание модели

Цитирование

Лицензия

Опубликовать ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/modelee-layoutlmv3-base .gitee-modal { min-width: 500px !important; } .gitee-modal .close { right: 0.6rem !important; }

Описание модели

Цитирование

Лицензия

Опубликовать ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/modelee-layoutlmv3-base