1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/WeBank-DataSphereStudio

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

Введение

DataSphere Studio (DSS) — это универсальный портал управления разработкой приложений для работы с данными, разработанный WeBank. Благодаря модульной интегрированной структуре и Linkis, промежуточному программному обеспечению для вычислений, DSS может легко интегрировать различные системы приложений верхнего уровня для обработки данных, упрощая разработку данных.

DSS позиционируется как портал разработки приложений для работы с данными. Замкнутый цикл охватывает весь процесс разработки приложений для данных. С помощью унифицированного пользовательского интерфейса и графического интерфейса, похожего на рабочий процесс, разработка методом перетаскивания соответствует всему жизненному циклу разработки приложений для обработки данных: от импорта данных, очистки, анализа, интеллектуального анализа данных, проверки качества, визуализации, планирования до приложений вывода данных и т. д.

Благодаря возможностям подключения, повторного использования и упрощения Linkis, DSS обладает финансовыми возможностями, такими как высокая степень параллелизма, высокая доступность, изоляция нескольких арендаторов и управление ресурсами.

Предварительный просмотр пользовательского интерфейса

Пожалуйста, проявите терпение, загрузка gif займёт некоторое время.

Рисунок 1. GIF-файл DSS-V1.0

Основные функции

  1. Универсальное управление разработкой приложений с полным циклом в одном интерфейсе

DSS имеет высокую степень интеграции. В настоящее время интегрированные компоненты включают (для получения информации о совместимости версий компонентов DSS см. «Список совместимости интегрированных компонентов»):

— IDE для разработки данных — Scriptis;

— Инструмент для визуализации данных — Visualis (на основе открытого исходного проекта Davinci, предоставленного CreditEase);

— Средство управления качеством данных — Qualitis;

— Инструмент планирования рабочего процесса — Schedulis;

— Инструмент обмена данными — Exchangis;

— Сервис Data Api — DataApiService;

— Управление разработкой потоковых приложений — Streamis;

— Универсальная платформа машинного обучения — Prophecis;

— Инструмент планирования задач рабочего процесса — DolphinScheduler (в процессе слияния кода);

— Документация и руководство для начинающих — UserGuide (в процессе слияния кода);

— Центр моделей данных — DataModelCenter (в разработке).

С помощью модульной архитектуры DSS позволяет пользователям быстро интегрировать новые инструменты для работы с приложениями или заменять различные инструменты, которые уже интегрированы в DSS. Например, заменить Scriptis на Zeppelin, а Schedulis на DolphinScheduler...

Рисунок 2. Видео DSS one-stop

  1. AppConn на основе Linkis определяет уникальную концепцию дизайна

AppConn — это основная концепция, которая позволяет DSS легко и быстро интегрировать различные веб-системы верхнего уровня.

AppConn, соединитель приложений, определяет набор... Унифицированные протоколы интеграции трёх уровней для фронтэнда и бэкэнда, позволяющие внешним системам приложений данных легко и быстро стать частью разработки приложений данных DSS.

Спецификации AppConn трёх уровней: спецификация SSO первого уровня, спецификация организационной структуры второго уровня и спецификация процесса разработки третьего уровня.

DSS организует несколько AppConns последовательно, формируя рабочий процесс, который поддерживает выполнение в реальном времени и запланированное выполнение. Пользователи могут завершить весь процесс разработки приложений данных с помощью простых операций перетаскивания.

Поскольку AppConn интегрирован с Linkis, внешняя система приложения данных разделяет возможности управления ресурсами, ограничения параллелизма и высокую производительность. AppConn также позволяет совместно использовать контекст на уровне системы и, таким образом, полностью избавляет внешнее приложение данных от изолированных приложений.

3. Workspace как единица управления

С Workspace в качестве единицы управления он организует и управляет бизнес-приложениями различных систем приложений данных, определяет набор общих стандартов для совместной разработки рабочих пространств в системах приложений данных и предоставляет возможности управления ролями пользователей.

4. Интегрированные компоненты приложений данных

DSS интегрировала множество систем приложений верхнего уровня путём внедрения нескольких AppConns, которые в основном могут удовлетворить потребности пользователей в разработке данных.

При желании новые системы приложений данных также можно легко интегрировать, чтобы заменить или обогатить процесс разработки данных DSS.

Компонент Описание Совместимая версия DSS0.X (рекомендуется DSS0.9.1) Совместимая версия DSS1.0 (рекомендуется DSS1.1.0)
Linkis Промежуточное программное обеспечение для вычислений Apache Linkis. Предоставляя стандартные интерфейсы, такие как REST/WebSocket/JDBC/SDK, приложения верхнего уровня могут легко подключаться и получать доступ к базовым механизмам, таким как MySQL/Spark/Hive/Presto/Flink. Рекомендуется Linkis0.11.0 (выпущено) >= Linkis1.1.1 (выпущено)
DataApiService Служба данных API (DSS имеет встроенные инструменты сторонних приложений). SQL-скрипт можно быстро опубликовать в виде интерфейса Restful, предоставляя внешнему миру доступ через Rest. Не поддерживается Рекомендуется DSS1.1.0 (выпущено)
Scriptis Поддержка онлайн-написания сценариев SQL, Pyspark, HiveQL и других (DSS имеет встроенные сторонние инструменты). Отправляется в веб-инструмент анализа данных Linkis. Рекомендуется DSS0.9.1 (выпущено) Рекомендуется DSS1.1.0 (выпущено)
Schedulis Система планирования задач рабочего процесса, основанная на вторичной разработке Azkaban, с такими функциями финансового уровня, как высокая производительность, высокая доступность и изоляция ресурсов для нескольких арендаторов. Рекомендуется Schedulis0.6.1 (выпущено) >= Schedulis0.7.0 (выпущено)
EventCheck Обеспечивает возможность связи по сигналам между бизнесом, инженерией и рабочим процессом (встроенный инструмент сторонних приложений DSS). Рекомендуется DSS0.9.1 (выпущено) Рекомендуется DSS1.1.0 (выпущено)
SendEmail Возможность отправки данных (DSS имеет встроенный инструмент сторонних приложений). Все результирующие наборы других узлов рабочего процесса можно отправить по электронной почте. Рекомендуется DSS0.9.1 (выпущено). Рекомендуемый DSS1.1.0 (выпущен)
---
Qualitis Инструмент проверки качества данных, предоставляющий такие возможности проверки данных, как целостность и корректность данных Рекомендуется Qualitis0.8.0 (выпущено) >= Qualitis0.9.2 (выпущено)
Streamis Инструмент управления разработкой потоковых приложений. Поддерживает выпуск Flink Jar и Flink SQL, а также предоставляет возможности разработки, отладки и управления производством потоковых приложений, такие как запуск-остановка, мониторинг состояния, контрольная точка и т. д. Не поддерживается >= Streamis0.2.0 (выпущено)
Prophecis Универсальная платформа машинного обучения, объединяющая несколько фреймворков машинного обучения с открытым исходным кодом. MLFlow Prophecis можно подключить к рабочему процессу DSS через AppConn. Не поддерживается >= Prophecis 0.3.2 (выпущено)
Exchangis Платформа обмена данными, которая поддерживает передачу данных между структурированными и неструктурированными разнородными источниками данных. Предстоящий Exchangis1. 0 будет работать с рабочим процессом DSS не поддерживается = Exchangis1.0.0 (выпущено)
Visualis BI-инструмент визуализации данных на основе вторичной разработки Davinci, проекта с открытым исходным кодом CreditEase, предоставляет пользователям возможности визуализации финансовых данных с точки зрения безопасности данных. Рекомендуется Visualis0.5.0 = Visualis1.0.0 (выпущено)
DolphinScheduler Apache DolphinScheduler, распределённая и легко масштабируемая платформа визуального планирования задач рабочего процесса, поддерживает публикацию рабочих процессов DSS в DolphinScheduler одним щелчком мыши. Не поддерживается DolphinScheduler1.3.X (выпущено)
UserGuide (DSS будет встроен в сторонние инструменты приложения) содержит справочные документы, руководство для начинающих, скиннинг тёмного режима и т.д. Не поддерживается >= DSS1.1.0 (выпущено)
DataModelCenter (сторонний инструмент приложения, который будет создавать DSS) в основном предоставляет возможности планирования хранилища данных, разработки модели данных и управления активами данных. Планирование хранилища данных включает предметные области, иерархии хранилищ данных, модификаторы и т. д.; разработка модели данных включает индикаторы, измерения, метрики, построение таблиц на основе мастера и т. д.; активы данных подключены к Apache Atlas для обеспечения возможностей отслеживания данных . Не поддерживается Планируется в DSS1.2.0 (в разработке)
UserManager (В DSS есть встроенные сторонние инструменты приложения), автоматически инициализирует все пользовательские среды, необходимые новому пользователю DSS, включая: создание пользователей Linux, различные пути пользователей, авторизацию каталогов и т. д. Рекомендуется DSS0.9.1 (выпущено) Планируется
Airflow Поддерживает публикацию рабочих процессов DSS в Apache Airflow для запланированного планирования. PR ещё не объединён Не поддерживается

Demo Trial environment

       Функция поддержки выполнения сценариев DataSphere Studio имеет высокие риски безопасности, и изоляция демонстрационной среды WeDataSphere не была завершена. Учитывая, что многие пользователи интересуются демонстрационной средой, мы решили сначала выдать коды приглашений сообществу и принять пробные заявки от предприятий и организаций.

       Если вы хотите попробовать демонстрационную среду, пожалуйста, присоединитесь к группе пользователей сообщества DataSphere Studio (см. конец документа) и свяжитесь с WeDataSphere Group Robot, чтобы получить код приглашения.

       Страница входа в демонстрационную среду DataSphereStudio: нажмите здесь, чтобы войти

Download

       Перейдите на страницу DSS Releases Page, чтобы загрузить скомпилированную версию или пакет исходного кода DSS.

Compile and deploy

       Пожалуйста Пользователи пробной версии «DSS» представляют различные отрасли: финансы, банковское дело, телекоммуникации, производство, интернет-компании и так далее.

License

DSS находится под лицензией Apache 2.0. Подробнее см. в файле License.

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Описание недоступно Развернуть Свернуть
Apache-2.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/WeBank-DataSphereStudio.git
git@api.gitlife.ru:oschina-mirror/WeBank-DataSphereStudio.git
oschina-mirror
WeBank-DataSphereStudio
WeBank-DataSphereStudio
master