1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/gapyanpeng-gpt2-ml

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

GPT2 для нескольких языков

GPT2 для нескольких языков

Open In Colab GitHub GitHub All Releases contributions welcome GitHub stars

中文说明 | English

  • Скрипты обучения Simplifed GPT2 (на основе Grover, поддержка TPU)
  • Перенесённый токенизатор bert, совместим с многоязычным корпусом
  • 1,5 млрд предварительно обученная китайская модель GPT2 (~15 ГБ корпус, 10 тыс. шагов)
  • Демо Colab с батарейками в комплекте #
  • 1,5 млрд предварительно обученная китайская модель GPT2 (~50 ГБ корпус, 100 тыс. шагов)

Предварительно обученная модель

1,5 млрд предварительно обученная китайская модель GPT2 [Google Drive]

SHA256: 4a6e5124df8db7ac2bdd902e6191b807a6983a7f5d09fb10ce011f9a073b183e

Корпус из THUCNews и nlp_chinese_corpus

Использование Cloud TPU Pod v3-256 для обучения 10 тысяч шагов

loss

Google Colab

Всего 2 клика (не считая процесса аутентификации Colab), и демо с предварительно обученной китайской моделью на 1,5 миллиарда готово к работе:

[Colab Notebook]

Обучение

Отказ от ответственности

Содержимое этого репозитория предназначено для академических исследований, и мы не предоставляем никаких окончательных замечаний.

Цитирование

@misc{GPT2-ML,
  author = {Zhibo Zhang},
  title = {GPT2-ML: GPT-2 for Multiple Languages},
  year = {2019},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/imcaspar/gpt2-ml}},
}

Ссылка

https://github.com/google-research/bert

https://github.com/rowanz/grover

Исследование поддержано облачными TPU от Google TensorFlow Research Cloud (TFRC).

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

GPT2 for Multiple Languages. Развернуть Свернуть
Apache-2.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/gapyanpeng-gpt2-ml.git
git@api.gitlife.ru:oschina-mirror/gapyanpeng-gpt2-ml.git
oschina-mirror
gapyanpeng-gpt2-ml
gapyanpeng-gpt2-ml
master