Закончено, отобразите список промежуточных сохранённых путей.
За исключением автоматического построения ClusterSpec в распределённом режиме TensorFlow, программа в автономном режиме TensorFlow и других фреймворках глубокого обучения может быть выполнена непосредственно в XLearning.
— JDK >= 1.7; — Maven >= 3.3.
Выполните следующую команду в корневом каталоге исходного кода:
mvn package
.
После компиляции в target
в корневом каталоге будет создан дистрибутивный пакет с именем xlearning-1.1-dist.tar.gz
.
Распаковав дистрибутивный пакет, в корневом каталоге будут созданы следующие подкаталоги:
— bin: скрипты для фиксации приложения; — lib: jar-файлы для XLearning и зависимостей; — conf: файлы конфигурации; — sbin: скрипты для службы истории; — data: данные и файлы для примеров; — examples: примеры XLearning.
— CentOS 7.2; — Java >= 1.7; — Hadoop = 2.6, 2.7, 2.8; — [необязательно] Зависимая среда для фреймворков глубокого обучения на узлах кластера, таких как TensorFlow, numpy, Caffe.
В каталоге «conf» распакованного дистрибутивного пакета $XLEARNING_HOME
настройте связанные файлы:
— xlearning-env.sh: установите переменные среды, такие как:
— xlearning-site.xml: настройте соответствующие свойства. Обратите внимание, что свойства, связанные со службой истории, должны соответствовать тому, что было настроено при запуске службы истории. Для получения более подробной информации см. часть «Конфигурация» (./doc/configure.md).
— log4j.properties: настройте уровень журнала.
— Запустите $XLEARNING_HOME/sbin/start-history-server.sh
.
Используйте $XLEARNING_HOME/bin/xl-submit
, чтобы отправить приложение в кластер на клиенте XLearning.
Вот пример отправки для приложения TensorFlow.
Загрузите каталог «data» в корне распакованного дистрибутива в HDFS:
cd $XLEARNING_HOME
hadoop fs -put data /tmp/
cd $XLEARNING_HOME/examples/tensorflow
$XLEARNING_HOME/bin/xl-submit \
--app-type "tensorflow" \
--app-name "tf-demo" \
--input /tmp/data/tensorflow#data \
--output /tmp/tensorflow_model#model \
--files demo.py,dataDeal.py \
--launch-cmd "python demo.py --data_path=./data --save_path=./model --log_dir=./eventLog --training_epochs=10" \
--worker-memory 10G \
--worker-num 2 \
--worker-cores 3 \
--ps-memory 1G \
--ps-num 1 \
--ps-cores 2 \
--queue default \
Значение параметров следующее:
Свойство | Значение |
---|---|
app-name | имя приложения «tf-demo» |
app-type | тип приложения «tensorflow» |
input | входной файл, путь HDFS — «/tmp/data/tensorflow», связанный с локальным каталогом «./data» |
output | выходной файл, путь HDFS — «/tmp/tensorflow_model», связанный с локальным каталогом «./model» |
files | программа приложения и необходимые локальные файлы, включая demo.py и dataDeal.py |
launch-cmd | команда выполнения |
worker-memory | объём памяти для использования рабочим процессом составляет 10 ГБ |
worker-num | количество рабочих контейнеров для использования приложением равно 2 |
worker-cores | количество ядер для использования рабочим процессом равно 3 |
ps-memory | объём памяти для процесса ps составляет 1 ГБ |
ps-num | количество контейнеров ps для использования приложением равно 1 |
ps-cores | количество ядер для процесса ps равно 2 |
queue | очередь, в которую отправляется приложение |
Для получения дополнительной информации установите часть «Параметры отправки» (./doc/submit.md). Авторы
XLearning разработан, создан, проверен и протестирован командой на GitHub:
Свяжитесь с нами
Почта: g-xlearning-dev@360.cn QQ группа: 588356340
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )