1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/buaalining-CasperMagic

В этом репозитории не указан файл с открытой лицензией (LICENSE). При использовании обратитесь к конкретному описанию проекта и его зависимостям в коде.
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

CasperMagic

CasperMagic — это интеграция на основе PhantomJS, CasperJS и WebMagic. CasperJS позволяет легко тестировать динамические веб-страницы, но JavaScript не очень удобен для выполнения задач по сбору данных и аналитики. Обычные пауки с трудом могут получить содержание динамических веб-страниц или выполнять действия над страницами и извлекать данные. CasperMagic представляет собой упаковку CasperJS с использованием WebMagic.

CasperJS WebMagic

Режим работы

Как и у CasperJS, режим работы CasperMagic также основан на последовательной модели. Когда требуется выполнение действий над страницей, действие, основанное на одном теге, считается одним Action'ом. Несколько таких Action'ов образуют ActionChain, который выполняется последовательно согласно порядку ActionChain. В конце концов получается страница после выполнения всех действий, а затем используются средства WebMagic для извлечения данных.

Для выполнения CasperMagic требуются установленные PhantomJS и CasperJS, а также правильно настроенные пути к ним в системе. CasperMagic создаёт соответствующие JS-скрипты на основе ActionChain и выполняет эти скрипты для получения данных с веб-страниц.

Настройка ActionChain довольно проста:```java ActionChain chain = new ActionChain(); ActionNode node = new ActionNode(); node.setNodetype(ActionNodeType.CLICK).setEventElement("div.article-content p a"); chain = ActionFactory.CreateActionChain(node).ChainEnd("click.js"); Spider.create(this).startUrls(urls).setDownloader(new JsDownload(env, chain).setEnableClick(true)).run();


Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

CasperMagic — это интеграция, основанная на PlantomJS, CasperJS и WebMagic. CasperJS позволяет удобно тестировать динамические веб-страницы, но выполнение данных операций с помощью JavaScript не очень удобно для сохранения данных и анализа. А обычным краулерам сложно извлекать содержимое динамических веб-страниц или выполнять операции над страни... Развернуть Свернуть
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/buaalining-CasperMagic.git
git@api.gitlife.ru:oschina-mirror/buaalining-CasperMagic.git
oschina-mirror
buaalining-CasperMagic
buaalining-CasperMagic
master