Присоединяйтесь к Gather Platform
QQ-группе: 206264662
Подробные методы использования см. в онлайн-документации
Gather Platform — это набор инструментов для сбора данных, основанный на ядре Webmagic, который включает веб-конфигурацию задач и интерфейс управления задачами. Она обладает следующими функциями:
- Сбор данных по заданному шаблону, поддерживает Ajax-веб-страницы
- Автоматическое обнаружение текста страницы без задания шаблона, автоматическое извлечение даты публикации статьи
- Динамическое извлечение полей и статическое внедрение полей
- Управление уже собранными данными, включая: поиск, добавление, удаление, изменение, извлечение данных по новому шаблону
- Обработка собранных данных с использованием NLP, включая: извлечение ключевых слов, извлечение краткого содержания, извлечение сущностей
- Включает рекомендации по связанным статьям, анализ взаимосвязей между персонажами и местами в статьях
Установка занимает всего 5 минут, создание одного паука — 30 секунд, начните сбор данных.Без необходимости писать код можно создать мощного паука.
Для работы системы необходимы следующие зависимости:
Необязательные зависимости:
Электронная почта: 63388@qq.com
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )