1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/yangdechao_admin-guage-notes

В этом репозитории не указан файл с открытой лицензией (LICENSE). При использовании обратитесь к конкретному описанию проекта и его зависимостям в коде.
Клонировать/Скачать
39-Flink得算子有哪些.md 4.4 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
Отправлено 24.06.2025 02:12 0782333

1. Какие операторы есть в Flink

Flink — это распределенная открытая платформа для работы с потоками данных и пакетной обработки. Ниже приведены некоторые часто используемые операторы Flink:

а) Операторы источников данных

  • SocketTextStreamSource: Читает данные с указанного адреса сокета, часто используется для быстрого тестирования и демонстрации реального времени.

  • FileSource: Читает данные из файловой системы, поддерживает различные форматы файлов, такие как текстовые файлы, CSV, JSON и т.д.

б) Преобразовательные операторы

  • Map: Выполняет одно-к-одно преобразование каждого элемента входного потока. Например, умножение входящего целого числа на 2.

  • FlatMap: Аналогично Map, но может преобразовать один элемент в несколько элементов. Например, разделение строки, содержащей слова, на отдельные слова.

  • Filter: Фильтрует элементы входного потока на основе заданного условия, сохраняет элементы, удовлетворяющие условию, и отбрасывает остальные.

в) Операторы окон

  • Tumbling Window: Разделяет поток данных на непересекающиеся окна по фиксированному временному интервалу или объему данных, каждый из которых обрабатывается независимо.

  • Sliding Window: Аналогично скользящему окну, но окна могут пересекаться. Управление размером окна и шагом слайдинга позволяет контролировать разбиение окон.- Session Window: Разделяет поток данных на окна на основе активного времени элементов данных. Когда нет данных в течение определённого периода времени, считается окончанием сессии, и начинается вычисление данных внутри окна.

г) Агрегирующие операторы

  • Sum: Выполняет суммирование элементов входного потока по заданному полю.

  • Min: Вычисляет минимальное значение поля в элементах входного потока.

  • Max: Вычисляет максимальное значение поля в элементах входного потока.

  • Count: Подсчитывает количество элементов в входном потоке.

д) Операторы соединения

  • Union: Объединяет несколько потоков в один поток, требует, чтобы типы элементов входных потоков были одинаковыми.

  • Join: Используется для соединения двух потоков, связывает элементы из разных потоков на основе заданного условия.

  • CoGroup: Аналогично Join, но позволяет выполнять более сложные группировки и обработку результатов соединения.

е) Операторы вывода

  • Print: Выводит данные на консоль, обычно используется для отладки и просмотра промежуточных результатов.

  • FileSink: Выводит данные в файловую систему, поддерживает различные форматы файлов и режимы записи.

  • KafkaSink: Выводит данные в очередь сообщений Kafka для последующей обработки в реальном времени или хранения.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/yangdechao_admin-guage-notes.git
git@api.gitlife.ru:oschina-mirror/yangdechao_admin-guage-notes.git
oschina-mirror
yangdechao_admin-guage-notes
yangdechao_admin-guage-notes
master