README.md · OSCHINA-MIRROR/modelee-electra-base-discriminator

ELECTRA: Предварительное обучение кодировщиков текста в качестве дискриминаторов, а не генераторов

ELECTRA — это новый метод обучения представлению языка без учителя. Его можно использовать для предварительного обучения сетей-трансформеров с относительно небольшими вычислительными затратами. Модели ELECTRA обучаются отличать «реальные» входные токены от «поддельных» входных токенов, сгенерированных другой нейронной сетью, подобно дискриминатору GAN. В небольших масштабах ELECTRA достигает хороших результатов даже при обучении на одном GPU. В больших масштабах ELECTRA показывает лучшие результаты на наборе данных SQuAD 2.0.

Для подробного описания и экспериментальных результатов см. нашу статью ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators.

В этом репозитории содержится код для предварительного обучения ELECTRA, включая небольшие модели ELECTRA на одном графическом процессоре. Он также поддерживает точную настройку ELECTRA для последующих задач, включая задачи классификации (например, GLUE), задачи QA (например, SQuAD) и задачи тегирования последовательностей (например, разбиение текста на фрагменты).

Как использовать дискриминатор в `transformers`

from transformers import ElectraForPreTraining, ElectraTokenizerFast
import torch

discriminator = ElectraForPreTraining.from_pretrained("google/electra-base-discriminator")
tokenizer = ElectraTokenizerFast.from_pretrained("google/electra-base-discriminator")

sentence = "The quick brown fox jumps over the lazy dog"
fake_sentence = "The quick brown fox fake over the lazy dog"

fake_tokens = tokenizer.tokenize(fake_sentence)
fake_inputs = tokenizer.encode(fake_sentence, return_tensors="pt")
discriminator_outputs = discriminator(fake_inputs)
predictions = torch.round((torch.sign(discriminator_outputs[0]) + 1) / 2)

[print("%7s" % token, end="") for token in fake_tokens]

[print("%7s" % int(prediction), end="") for prediction in predictions.tolist()]

OSCHINA-MIRROR/modelee-electra-base-discriminator

ELECTRA: Предварительное обучение кодировщиков текста в качестве дискриминаторов, а не генераторов

Как использовать дискриминатор в `transformers`

Опубликовать ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/modelee-electra-base-discriminator .gitee-modal { min-width: 500px !important; } .gitee-modal .close { right: 0.6rem !important; }

ELECTRA: Предварительное обучение кодировщиков текста в качестве дискриминаторов, а не генераторов

Как использовать дискриминатор в transformers

Опубликовать ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/modelee-electra-base-discriminator

Как использовать дискриминатор в `transformers`