ElasticCTR
ElasticCTR — это решение для распределённого обучения и прогнозирования CTR, которое можно развернуть в один клик. Пользователю нужно только настроить источник данных и формат образца.
Этот проект предлагает комплексное решение для обучения и разработки CTR. Основные характеристики:
Перед использованием ElasticCTR необходимо создать кластер Kubernetes и установить компонент Volcano. Процесс развёртывания кластера Kubernetes сложен и не рассматривается в этой статье. На Baidu Smart Cloud CCE можно использовать контейнерный движок после подачи заявки. Создание кластера Kubernetes на Baidu Cloud описано в документе «Руководство по созданию кластера Kubernetes и использованию». Elastic CTR также поддерживает развёртывание на других облачных платформах, таких как Huawei Cloud и AWS.
После подготовки кластера Kubernetes необходимо настроить HDFS в качестве источника данных.
Для развёртывания можно использовать скрипт elastic-control.sh. Перед запуском скрипта убедитесь, что на вашем компьютере установлен Python 3 и пакет mlflow, установленный с помощью pip. Команда установки mlflow:
python3 -m pip install mlflow -i https://pypi.tuna.tsinghua.edu.cn/simple
Скрипт используется следующим образом:
bash elastic-control.sh [COMMAND] [OPTIONS]
Доступные команды (COMMAND):
При определении конфигурации обучения необходимо добавить дополнительные параметры (OPTIONS), чтобы указать ресурсы конфигурации. Доступные параметры конфигурации:
Обратите внимание, что формат ваших файлов данных должен соответствовать следующему примеру:
$show $click $feasign0:$slot0 $feasign1:$slot1 $feasign2:$slot2......
Пример:
1 0 17241709254077376921:0 132683728328325035:1 9179429492816205016:2 12045056225382541705:3
Файл data.config содержит следующие переменные:
export HDFS_ADDRESS="hdfs://${IP}:9000" # HDFS地址
export HDFS_UGI="root,i" # HDFS用户名密码
export START_DATE_HR=20200401/00 # 训练集开始时间,代表2020年4月1日0点
export END_DATE_HR=20200401/03 # 训练集结束时间,代表2020年4月1日3点
export DATASET_PATH="/train_data" # 训练集在HDFS上的前缀
export SPARSE_DIM="1000001" # 稀疏参数维度,可不动
Пример использования скрипта:
bash elastic-control.sh -r -u 4 -m 20 -t 2 -p 2 -b 5 -s slot.conf -f data.config
bash elastic-control.sh -a
bash elastic-control.sh -l
bash elastic-control.sh -c
Мы предлагаем два способа отслеживания прогресса обучения:
bash elastic-control.sh -l
Пользователь может ввести следующую команду, чтобы просмотреть журнал файлового сервера:
bash elastic-control.sh -l
Когда модель будет готова, можно выполнить прогнозирование, выполнив следующую команду:
bash elastic-control.sh -c
Следуйте инструкциям на экране для выполнения прогноза. Результаты будут выведены в стандартном выводе.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )