Проект Unpaired Probability Prediction: структура проекта
Участники: Шуй Тао, Яо Чжичао, Чжу Маньцинь, Цю Кай, Е Юнчжи и другие.
Содержание требует разработки, впереди — светлое будущее.
Революция ещё не удалась, товарищи должны продолжать прилагать усилия.
Вперёд, к победе!
Структура проекта
├── config.py // конфигурационный файл ├── data │ ├── data_explanation.txt // файл с объяснением данных │ ├── dev.txt // набор данных для проверки │ ├── README.md // объяснение данных в формате .md │ ├── test_nolabel.txt // данные для тестирования A-ранга │ └── train.txt // набор тренировочных данных ├── demo.py // демонстрационный скрипт ├── inference_model │ ├── ... │ ├── ... │ ├── ... │ └── ├── ... // параметры модели обучения ├── logs │ └── train_1612239291.log // файл журнала ├── max_models // каталог с оптимальными моделями │ │ ├── ... │ │ ├── ... │ │ ├── ... │ └── 4.635 // оптимальная модель ├── net │ ├── network.py // код сетевой модели │ └── bilm.py // структура Elmo ├── README.md // описание проекта ├── requestments.txt // библиотека конфигурации ├── result │ ├── prediction // путь сохранения результатов прогнозирования │ | ├── 1.predict.txt // результат прогнозирования 1 │ | ├── 2.predict.txt // результат прогнозирования 2 │ | ├── ... │ | ├── n.predict.txt // результат прогнозирования n │ ├── model.svg // схема модели │ ├── predict.file.zip // сжатый файл для отправки └── utils ├── process.py // создание словаря ├── reader.py // программа чтения данных ├── utils.py // предварительная обработка данных └── vocabulary.py // класс форматирования данных ├── test.py // тестовая программа ├── train.py // обучающая программа
Зависимости проекта, обучение и тестирование модели
pip install -r requestments -i https://pypi.douban.com/simple
, чтобы установить необходимые зависимости.python train.py
, чтобы начать обучение. Параметры обучения будут сохранены в каталоге ./inference_model
.visualdl --logdir ./log post 8040
, затем откройте http://localhost:8040/
в браузере, чтобы отслеживать процесс обучения.python test.py
, чтобы получить результаты тестирования (можно задать каталог параметров модели с помощью --param_path=параметры каталога
). Результаты тестирования сохраняются в каталоге ./result/prediction
, а также генерируется файл predict.files.zip
для отправки.Модель
Основная структура модели основана на двунаправленной LSTM (двунаправленная сеть LSTM) и так далее. Можно попробовать оптимизировать модель по следующим направлениям:
LSTM layers=6
.256
.embedding
мы попытались внедрить структуры сетей Elem
и GRU
. Во время практического обучения потери в конечном итоге стабилизировались примерно на том же значении, что и без этого улучшения. Однако после отправки прогноза этой модели на A-таблицу произошло резкое снижение баллов. Поэтому в последующих экспериментах по обучению это улучшение не использовалось.PaddleHelix
для создания новой вторичной структуры для базовых последовательностей набора данных. Это улучшение помогло нам достичь наилучшего результата на A-таблице, но результаты на B-таблице оказались неудовлетворительными. Затем мы использовали метод обработки данных с использованием исходных последовательностей. Это позволило нам достичь наилучшего результата на B-таблице.Baseline
. Увеличение размера пакета обучения (Batch size) также не дало хороших результатов.RMSD_STD
отсутствует, мы разработали собственный метод расчёта RMST_STD
, который применялся для проверки во время обучения.Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )