1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/daochenzha-rlcard

Клонировать/Скачать
developping-algorithms.md 1.4 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 28.11.2024 18:31 21f438a

Разработка алгоритмов

Хотя пользователи могут делать всё, что им нравится, для разработки и тестирования своих алгоритмов, мы рекомендуем оборачивать новый алгоритм в класс Agent на примере агента (../rlcard/agents/random_agent.py). Чтобы быть совместимым с основными интерфейсами, агент должен иметь следующие функции и атрибут:

  • step: на основе текущего состояния предсказать следующее действие.
  • eval_step: аналогично step, но для целей оценки. Алгоритмы обучения с подкреплением обычно добавляют некоторый шум для лучшего исследования в процессе обучения. При оценке шум не добавляется, чтобы сделать прогнозы.
  • use_raw: логический атрибут. True, если агент использует необработанные состояния для рассуждений; False, если агент использует числовые значения для игры (например, нейронные сети).

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/daochenzha-rlcard.git
git@api.gitlife.ru:oschina-mirror/daochenzha-rlcard.git
oschina-mirror
daochenzha-rlcard
daochenzha-rlcard
master