DataService-Framework
Основанный на платформе больших данных, сервис обработки данных.
На основе сценариев реального использования проектов с большими данными были выделены некоторые общие функции, которые сформировали структуру обработки данных для платформы больших данных.
В настоящее время реализованы следующие основные функции:
Программное обеспечение имеет следующую структуру:
DataService-Framework проектный корневой каталог
├── commons 公共功能模块,提供配置文件读取、数据库连接、日志打印、工具类等公共功能,以供其他模块调用。
├── examples 样例模块,提供各个功能点的样例代码。
├── kafka-clients KafkaClients相关功能,比如生产者、消费者等。
├── kafka-streams 主题数据过滤模块,Kafka自带的流处理功能,业务系统记录的日志如果包含了大量的:程序异常日志、数据库操作日志、调试日志等日志信息,而采集的数据只需要日志文件中的特定数据的日志记录,那么对于我们采集到的日志来说,可能会有90%以上的日志都是垃圾数据,但是Flume组件没有提供日志过滤功能,而Spark程序又不应该消费这些数据。这时就需要提供一个中间层,将Flume采集到的Topic1的日志中满足条件的数据筛选出来放到Topic2中,Spark程序只需要消费Topic2的数据即可,过滤条件按照正则表达式进行配置。这样Spark消费Topic2的数据都是我们需要的数据,并且我们可以及时的清理掉Topic1的数据以释放空间。
├── rule-engine 规则引擎功能。
├── spark-sql SparkSQL相关功能,扩展了Dataset/DataFrame的方法,集成Redis数据的读写、MongoDB数据的读写。
├── spark-streaming SparkStreaming实时数据处理模块,通过SparkStreaming程序,准实时消费Kafka中的数据,流式方式处理MongoDB中的数据.
└── third-party 第三方源码
├── hammurabi Scala规则引擎
├── mongodb Spark操作MongoDB
└── redislabs Spark操作Redis
В настоящий момент программное обеспечение реализует сбор данных с Flume, фильтрацию данных по темам Kafka и обработку данных в реальном времени с помощью SparkStreaming. Однако обработка данных в SparkStreaming ограничивается базовыми функциями, такими как стандартизация значений кода.
Расширение функциональности возможно в двух направлениях:
Инструмент настройки данных: данные инструмент настройки.xlsx
Документация по настройке и развёртыванию среды: документация по настройке и развертыванию среды.docx
Документация по разработке и упаковке программного обеспечения: документация по разработке и упаковке программного обеспечения.docx
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )