Ресурсное планирование и диспетчеризация: инструмент для высокопроизводительных систем управления большими данными
Описание
Это инструмент для управления ресурсами, предназначенный для высокопроизводительной системы управления большими данными. Система основана на данных и представляет собой часть ключевого проекта технологического отдела, направленного на разработку систем управления большими данными для высокотехнологичных производств.
Из-за особенностей больших данных в производственной сфере система должна быть способна обрабатывать различные типы данных, такие как временные ряды, графические данные и структурированные данные. Кроме того, система должна обеспечивать детальное управление ресурсами для разнородных механизмов обработки данных. На основе этих требований был разработан данный инструмент.
Инструмент представляет собой систему управления ресурсами для контейнерных аналитических механизмов, основанную на открытом инструменте оркестровки контейнеров Kubernetes. Он использует возможности Kubernetes по управлению контейнерами и основывается на его вторичной разработке. Инструмент предоставляет следующие функции:
Вторичная разработка модуля Scheduler в Kubernetes позволяет предложить и внедрить новые алгоритмы планирования, адаптированные к специфическим потребностям системы. Это обеспечивает более эффективное распределение компонентов и повышает эффективность использования ресурсов кластера.
Использование алгоритмов машинного обучения, таких как LSTM, и других моделей для прогнозирования потребления ресурсов в кластере в краткосрочной и среднесрочной перспективе. Это позволяет более эффективно использовать ресурсы кластера и выполнять задачи доступа к данным и анализа.
Мониторинг ресурсов кластера в реальном времени с использованием сторонних открытых и собственных модулей управления ресурсами. Пользователи могут контролировать и управлять ресурсами кластера на различных уровнях детализации.
Управление ресурсами, необходимыми для контейнерных механизмов обработки данных, с помощью инструментов Linux, таких как cgroup. Пользователи могут точно распределять и разделять ресурсы между различными механизмами обработки данных.
Разделение вычислений и хранения для разнородных данных с использованием распределённых файловых систем. Это обеспечивает высокую скорость доступа к данным через границы узлов благодаря высокоскоростным сетям Ethernet между узлами.
Автоматическое масштабирование и перепланирование ресурсов для распределённых и централизованных механизмов обработки данных. Благодаря разделению вычислений и хранения, инструмент может автоматически расширять и сокращать ресурсы в зависимости от использования ресурсов каждым механизмом обработки данных. Также возможно перераспределение компонентов между узлами кластера для более равномерного использования ресурсов.
Улучшенный пользовательский интерфейс с применением новых функций H5, что значительно повышает интерактивность и разнообразие представления информации. Пользователи могут легко получать необходимую информацию и эффективно управлять системой.
Среда подготовки
Быстрая установка
Установка Kubernetes и других компонентов
На этом этапе необходимо загрузить и установить модифицированный инструмент Kubernetes (с добавлением алгоритмов планирования) на кластер, а затем установить Docker, распределённую файловую систему GlusterFS и сетевую среду Flanneld для связи между контейнерами на разных узлах. Подробные инструкции по установке можно найти в следующих документах:
Создание образов разнородных механизмов обработки данных
Этот этап включает в себя контейнеризацию различных механизмов обработки данных, управляемых системой. Подробные шаги описаны в руководстве по контейнеризации механизмов обработки данных:
Установка необходимых компонентов
Установите компонент мониторинга Heapster, создайте и установите компонент автоматического масштабирования Rescheduler. Подробные инструкции можно найти здесь:
Клонируйте или скачайте этот репозиторий на локальный компьютер и обновите файл конфигурации /src/config.xml
. В этом файле обновите записи, такие как адрес сервиса Kubernetes, адрес частного репозитория образов и т. д., указав реальные адреса. Затем можно скомпилировать исходный код в пакет war или другой формат на локальном компьютере или на сервере. После компиляции опубликуйте полученный пакет в кластере на сервере Tomcat.
Запустите сервер Tomcat в кластере. Затем, в зависимости от IP-адреса сервера Tomcat и настроек порта, откройте порт и перейдите по URL-адресу http://YourIP:YourPort/ResourceManagement
, чтобы проверить, работает ли инструмент нормально.
Если у вас возникли проблемы при использовании или вы обнаружили ошибку в инструменте, пожалуйста, оставьте свои комментарии или предложения в разделе Issues
этого репозитория.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )