Добро пожаловать на Gather Platform — платформу для сбора и анализа данных
Приглашаем присоединиться к группе общения Gather Platform QQ: 206264662.
Подробные инструкции по использованию доступны в онлайн-документации.
Gather Platform — это платформа для сбора данных, основанная на Webmagic и предоставляющая интерфейс для настройки веб-задач и управления ими. Она обладает следующими функциями:
- Сбор данных в соответствии с настроенными шаблонами;
- Автоматическое обнаружение текста веб-страниц и извлечение времени публикации статей без предварительной настройки шаблонов сбора;
- Извлечение динамических и статических полей;
- Управление собранными данными, включая поиск, добавление, изменение и удаление данных, а также повторный сбор данных на основе новых шаблонов;
- Обработка собранных данных с помощью NLP, включая извлечение ключевых слов, составление резюме и выделение сущностей;
- Предложение связанных статей и анализ взаимосвязей между людьми и местами в статьях.
Развёртывание занимает всего 5 минут, а создание поискового робота — полминуты. После этого можно приступать к сбору данных. Для создания функционального поискового робота не требуется писать код.
Для работы системы требуются следующие зависимости:
Дополнительные компоненты (необязательные):
- Elasticsearch 5.0.
Все инструкции по развёртыванию, использованию, разработке и часто задаваемые вопросы доступны в онлайн-документации
Электронная почта: 63388@qq.com
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )