Apache CarbonData — это решение для хранения данных в виде индексированного столбцового хранилища, предназначенное для быстрой аналитики на платформе больших данных, такой как Apache Hadoop или Apache Spark.
С актуальной документацией и дополнительной информацией по CarbonData можно ознакомиться здесь: http://carbondata.apache.org.
Особенности: Формат файлов CarbonData представляет собой столбцовое хранилище в HDFS и обладает множеством функций современного столбцового формата, такими как возможность разделения, схема сжатия и сложные типы данных. Кроме того, CarbonData имеет следующие уникальные особенности:
Сборка CarbonData: CarbonData собирается с использованием Apache Maven. Для сборки CarbonData см. здесь.
Онлайн-документация:
Управление индексом CarbonData
Индекс CarbonData BloomFilter [https://github.com/apache/carbondata/blob/master/docs/index/bloomfilter-index-guide.md]
Индекс Lucene CarbonData [https://github.com/apache/carbon-data/blob/master/docs/index/lucene-index-guide.md]
MV CarbonData [https://github.com/apache/carbon-data/blob/master/docs/mv-guide.md]
Вторичный индекс CarbonData [https://github.com/apache/carbondata/blob/master/docs/index/secondary-index-guide.md]
Руководство по SDK [https://github.com/apache/carbondata/blob/master/docs/sdk-guide.md]
C++ Руководство по SDK [https://github.com/apache/carbondata/blob/master/docs/csdk-guide.md]
Настройка производительности [https://github.com/apache/carbondata/blob/master/docs/performance-tuning.md]
S3 Хранилище [https://github.com/apache/carbondata/blob/master/docs/s3-guide.md]
Распределённый сервер индексов [https://github.com/apache/carbondata/blob/master/docs/index-server.md]
CDC и SCD [https://github.com/apache/carbondata/blob/master/docs/scd-and-cdc-guide.md]
Carbon как источник данных Spark [https://github.com/apache/carbondata/blob/master/docs/carbon-as-spark-datasource-guide.md]
Часто задаваемые вопросы [https://github.com/apache/carbondata/blob/master/docs/faq.md]
Некоторые функции помечены как экспериментальные, поскольку синтаксис или реализация могут измениться в будущем.
Hive [https://github.com/apache/carbondata/blob/master/docs/hive-guide.md]
Presto [https://github.com/apache/carbondata/blob/master/docs/prestodb-guide.md]
Alluxio [https://github.com/apache/carbondata/blob/master/docs/alluxio-guide.md]
Flink [https://github.com/apache/carbondata/blob/master/docs/flink-integration-guide.md]
Материалы встреч Apache CarbonData [https://cwiki.apache.org/confluence/pages/viewpage.action?pageId=66850609]
Статьи об использовании CarbonData [https://cwiki.apache.org/confluence/display/CARBONDATA/CarbonData+Articles]
Это активный проект с открытым исходным кодом для всех, и мы всегда открыты для людей, которые хотят использовать эту систему или внести в неё свой вклад. В этом руководстве рассказывается, как внести свой вклад в CarbonData. [https://github.com/apache/carbondata/blob/master/docs/how-to-contribute-to-apache-carbondata.md].
Чтобы принять участие в CarbonData:
Apache CarbonData — это проект с открытым исходным кодом The Apache Software Foundation (ASF).
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )