唯品会分布式数据管道系统
RDP — это Real-Time Data Pipeline, система, которая синхронизирует данные из MySQL с Kafka. Как следует из названия, RDP не производит данные, а только передаёт их.
Основной принцип работы системы заключается в том, что она извлекает данные Binlog из источника MySQL, анализирует и обрабатывает их, затем сериализует и сжимает в формате PB. После этого данные отправляются в систему назначения, например, Apache Kafka, чтобы пользователи могли получать уведомления об изменениях данных. Системы назначения могут подписываться на данные или запрашивать их для дальнейшей обработки. В этом процессе RDP выступает в роли канала передачи данных между системами.
Во время процесса извлечения и отправки данных RDP может обрабатывать более 20 000 транзакций в секунду (около 100 000 событий в секунду), что удовлетворяет требованиям высокой параллельности. Кроме того, задержка обработки данных в RDP составляет миллисекунды, что также соответствует требованиям к обработке данных в реальном времени.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )