MindSpore Operator — это плагин для распределённого обучения MindSpore на Kubernetes. В Custom Resource Definition (CRD) определены роли Scheduler, PS и Worker. Пользователю достаточно настроить файл в формате yaml, чтобы легко реализовать распределённое обучение.
Есть несколько способов установки:
kubectl apply -f deploy/v1/ms-operator.yaml
После установки можно использовать команду kubectl get pods --all-namespaces
, чтобы увидеть развёртывание в пространстве имён ms-operator-system. Также можно использовать команду kubectl describe pod ms-operator-controller-manager-xxx-xxx -n ms-operator-system
, чтобы просмотреть подробную информацию о модуле.
make deploy IMG=swr.cn-south-1.myhuaweicloud.com/mindspore/ms-operator:latest
make run
В настоящее время ms-operator поддерживает обычное обучение с одним Worker, обучение в режиме PS с одним Worker и автоматическое параллельное выполнение (например, параллельное выполнение данных, моделей и т. д.) при запуске Scheduler и Worker.
Примеры выполнения доступны в папке config/samples/. В качестве примера рассмотрим параллельное выполнение данных при запуске Scheduler и Worker. Для этого необходимо заранее подготовить набор данных и сетевой сценарий:
kubectl apply -f config/samples/ms_wide_deep_dataparallel.yaml
Чтобы увидеть запущенные в кластере Scheduler и Worker, а также соответствующую службу Scheduler, используйте команду kubectl get all -o wide
.
pkg/apis/v1/msjob_types.go
определяет CRD для MSJob.
pkg/controllers/v1/msjob_controller.go
содержит основную логику контроллера MSJob.
make docker-build IMG=swr.cn-south-1.myhuaweicloud.com/mindspore/ms-operator:latest
docker push swr.cn-south-1.myhuaweicloud.com/mindspore/ms-operator:latest
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )