OSCHINA-MIRROR/shenzhanwang-Kettle-demo

ETL — это процесс извлечения, очистки, преобразования и загрузки данных. Пользователи извлекают из источников нужные данные, которые затем проходят очистку и преобразование, формируя требуемое хранилище данных. В дальнейшем эти данные могут использоваться для статистического анализа или принятия бизнес-решений.

В данном проекте с помощью открытого инструмента ETL Kettle демонстрируются некоторые функции.

Запрос и соединение: компоненты, связанные с запросом и соединением потоков данных.
Скрипт: использование пользовательских скриптов для добавления переменных в поток данных с помощью кода.
Вход и выход: обязательные компоненты для ввода и вывода, где ввод используется для создания потока данных из файлов или таблиц, а вывод — для записи данных потока в таблицы или файлы.
Приложения и процессы: предоставление дополнительных функций и управление состоянием процесса.
Преобразование: обработка преобразования данных, включая калькуляторы и сопоставление значений.

Далее идёт информация о книгах и статьях, не имеющая отношения к теме запроса.

Перевод выполнен с учётом контекста и без использования дополнительных комментариев. 1. Реализация мгновенной связи через интеграцию WebSocket в Spring boot.

Интеграция OAuth2 в Spring security для реализации аутентификации на основе токенов.
Интеграция клиента MinIO в Spring boot для управления файлами.
23 типа шаблонов проектирования, исходный код, комментарии и сценарии использования.
Пример использования инструмента ETL Kettle.
Руководство по Git и стратегия управления ветками.
Создание хранилища данных в реальном времени с использованием Apache Doris.
Принципы, архитектура, сценарии использования и визуализация Zookeeper.
Интеграция Apache dubbo v2.7.5 в Spring boot для реализации управления распределёнными сервисами (архитектура SOA).
Реализация микросервисной архитектуры (MSA) с помощью Spring Cloud Alibaba v2.2.7.
Построение озера потоковых данных с использованием Apache Paimon.
Организация облачных сервисов с использованием Kubernetes, Docker, GitLab и Spring cloud.
Распределённые вычисления с использованием Spark.
Реализация распределённых вычислений с использованием Flink.
Создание высокодоступного кластера nginx и балансировка нагрузки с Tomcat.
Использование mycat для реализации репликации главного и подчинённого серверов MySQL, разделения чтения и записи, разделения таблиц и баз данных, балансировки нагрузки и высокой доступности.
Исходный код «Elasticsearch: практика поиска и анализа данных».
Реализация распределённой транзакции на основе надёжной конечной согласованности (activeMQ).
Интеграция Seata в Spring boot и dubbo для реализации распределённых транзакций.
Интеграция Seata в Spring cloud alibaba для реализации распределённых транзакций.
Управление параллелизмом: реализация механизмов блокировки базы данных и уровней изоляции транзакций.
Управление параллелизмом: использование Redission для реализации распределённой блокировки.
Управление параллелизмом: использование Zookeeper для реализации распределённой блокировки.
Управление параллелизмом: примеры многопоточного программирования на Java.
Управление параллелизмом: реализация высокопроизводительной коммуникации NIO с использованием Netty.

OSCHINA-MIRROR/shenzhanwang-Kettle-demo

Комментарии ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/shenzhanwang-Kettle-demo .gitee-modal { min-width: 500px !important; } .gitee-modal .close { right: 0.6rem !important; }

Комментарии ( 0 )

Введение

Обновления

Участники

Недавние действия

OSCHINA-MIRROR/shenzhanwang-Kettle-demo