Разработка алгоритмов

Хотя пользователи могут делать всё, что им нравится, для разработки и тестирования своих алгоритмов, мы рекомендуем оборачивать новый алгоритм в класс Agent на примере агента (../rlcard/agents/random_agent.py). Чтобы быть совместимым с основными интерфейсами, агент должен иметь следующие функции и атрибут:

step: на основе текущего состояния предсказать следующее действие.
eval_step: аналогично step, но для целей оценки. Алгоритмы обучения с подкреплением обычно добавляют некоторый шум для лучшего исследования в процессе обучения. При оценке шум не добавляется, чтобы сделать прогнозы.
use_raw: логический атрибут. True, если агент использует необработанные состояния для рассуждений; False, если агент использует числовые значения для игры (например, нейронные сети).

OSCHINA-MIRROR/daochenzha-rlcard

Разработка алгоритмов

Опубликовать ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/daochenzha-rlcard .gitee-modal { min-width: 500px !important; } .gitee-modal .close { right: 0.6rem !important; }

Разработка алгоритмов

Опубликовать ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/daochenzha-rlcard