Введение в DI-engine
DI-engine — это обобщённый движок интеллектуального принятия решений. Он поддерживает различные алгоритмы глубокого обучения с подкреплением (deep reinforcement learning, DRL). Среди них:
Цель DI-engine — стандартизировать различные среды и приложения для интеллектуального принятия решений. Также поддерживаются различные обучающие конвейеры и индивидуальные приложения искусственного интеллекта для принятия решений.
Примеры сред:
Наслаждайтесь исследованием и использованием.
— Введение в DI-engine. — План. — Установка. — Быстрый старт. — Функции. — Разнообразие алгоритмов. — Разнообразие сред. — Обратная связь и вклад. — Сторонники. — Звёзды. — Форкеры. — Цитирование. — Лицензия.
Вы можете просто установить DI-engine из PyPI с помощью следующей команды:
pip install DI-engine
Если вы используете Anaconda или Miniconda, вы можете установить DI-engine от conda-forge с помощью следующей команды:
conda install -c opendilab di-engine
Для получения дополнительной информации об установке см. Установка.
И наш репозиторий dockerhub можно найти здесь, мы подготовили базовый образ
и образ среды
с общими средами RL. | № | Название | | Ссылки | Команда |
| :-- |:--:| --: |:--:|:--:|
| 1 | DQN | | DQN doc, DQN中文文档, policy/dqn | python3 -u cartpole_dqn_main.py / ding -m serial -c cartpole_dqn_config.py -s 0 |
| 2 | C51 | | C51 doc, policy/c51 | ding -m serial -c cartpole_c51_config.py -s 0 |
| 3 | QRDQN | | QRDQN doc, policy/qrdqn | ding -m serial -c cartpole_qrdqn_config.py -s 0 |
| 4 | IQN | | IQN doc, policy/iqn | ding -m serial -c cartpole_iqn_config.py -s 0 |
| 5 | FQF | | FQF doc, policy/fqf | ding -m serial -c cartpole_fqf_config.py -s 0 |
| 6 | Rainbow | | Rainbow doc, policy/rainbow | ding -m serial -c cartpole_rainbow_config.py -s 0 |
| 7 | SQL | | SQL doc, policy/sql | ding -m serial -c cartpole_sql_config.py -s 0 |
| 8 | R2D2 | | R2D2 doc, policy/r2d2 | ding -m serial -c cartpole_r2d2_config.py -s 0 |
| 9 | PG | | PG doc, policy/pg | ding -m serial -c cartpole_pg_config.py -s 0 |
| 10 | A2C | | A2C doc, policy/a2c | ding -m | Сериальное обучение — конфигурации и политики
№ | Политика | Особенности | Документация | Команда |
---|---|---|---|---|
11 | PPO | Ссылки на статьи | — | serial -c cartpole_a2c_config.py -s 0 |
12 | PPG | — | — | python3 -u cartpole_ppg_main.py |
13 | ACER | — | — | ding -m serial -c cartpole_acer_config.py -s 0 |
14 | IMPALA | Распределённое обучение, дискретное пространство состояний | — | ding -m serial -c cartpole_impala_config.py -s 0 |
15 | DDPG/PADDPG | Непрерывное пространство состояний, гибридное обучение | — | ding -m serial -c pendulum_ddpg_config.py -s 0 |
16 | TD3 | Непрерывное пространство состояний, гибридное обучение | — | python3 -u pendulum_td3_main.py / ding -m serial -c pendulum_td3_config.py -s 0 |
17 | D4PG | Непрерывное пространство состояний | — | python3 -u pendulum_d4pg_config.py |
18 | SAC/MASAC | Дискретное и непрерывное пространство состояний, обучение с марковскими цепями | — | ding -m serial -c pendulum_sac_config.py -s 0 |
19 | PDQN | Гибридное обучение | — | ding -m serial -c gym_hybrid_pdqn_config.py -s 0 |
20 | MPDQN | Гибридное обучение | — | ding -m serial -c gym_hybrid_mpdqn_config.py -s 0 |
— | QMIX | |||
— | COMA | |||
— | QTran | |||
— | WQMIX | |||
— | CollaQ | |||
— | MADDPG | |||
— | GAIL | |||
— | SQIL | |||
— | DQFD | |||
— | R2D3 | |||
— | Guided Cost Learning |
В запросе присутствуют ссылки на научные статьи и репозиторий с кодом, но нет цельного текста для перевода. Пожалуйста, уточните запрос. Learning 中文文档
reward_model/guided_cost | python3 lunarlander_gcl_config.py |
| 33 | TREX | | TREX doc
reward_model/trex | python3 mujoco_trex_main.py |
| 34 | Implicit Behavorial Cloning (DFO+MCMC) | | policy/ibc
model/template/ebm | python3 d4rl_ibc_main.py -s 0 -c pen_human_ibc_mcmc_config.py |
| 35 | BCO | | entry/bco | python3 -u cartpole_bco_config.py |
| 36 | HER |
| HER doc
reward_model/her | python3 -u bitflip_her_dqn.py |
| 37 | RND | | RND doc
reward_model/rnd | python3 -u cartpole_rnd_onppo_config.py |
| 38 | ICM | | ICM doc
ICM中文文档
reward_model/icm | python3 -u cartpole_ppo_icm_config.py |
| 39 | CQL | | CQL doc
policy/cql | python3 -u d4rl_cql_main.py |
| 40 | TD3BC | | TD3BC doc
policy/td3_bc | python3 -u d4rl_td3_bc_main.py |
| 41 | Decision Transformer | | policy/dt | python3 -u d4rl_dt_main.py |
| 42 | MBSAC(SAC+MVE+SVG) |
| policy/mbpolicy/mbsac | | No | Среда | Метка | Визуализация | Код и ссылки на документацию |
| :--: | :---------------------------------------------------------------------------------: | :--------------------------------------: | :---------------------------:|:------------------------------------------------------------:|
| 1 | atari (https://github.com/openai/gym/tree/master/gym/envs/atari) |
|
| ссылка на dizoo, учебник по env, руководство по среде |
| 2 | | | | | box2d/bipedalwalker
box2d/bipedalwalker | |
| dizoo link
| 3 | box2d/lunarlander | |
| dizoo link
env tutorial |
| 4 | classic_control/cartpole | |
| dizoo link
env tutorial |
| 5 | classic_control/pendulum | |
| dizoo link
env tutorial |
| 6 | competitive_rl |
|
| dizoo link
|
| 7 | gfootball | |
| dizoo link
env tutorial |
| 8 | minigrid | |
| dizoo link
env tutorial |
| 9 | mujoco | |
| dizoo link
env tutorial | ## License
DI-engine выпущен под лицензией Apache 2.0.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )