1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/nlh774-DotnetSpider

Клонировать/Скачать
Design.md 1.6 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
Отправлено 04.06.2025 17:03 b48ecee

ДИЗАЙН

Перед этим рефакторингом, загрузчик, селектор и пайплайн были связаны вместе, и теперь я думаю, что следует их разделить. Если кто-то хочет использовать только загрузчик и извлекать данные с помощью AngleSharp.

Загрузчик

Загрузчик — это независимый модуль, который помогает пользователю загружать данные с целевого сайта. Есть много деталей, см. ниже:

  1. Два способа установки cookie: один — вызов метода AddCookie в загрузчике, который добавляет cookie в CookieContainer, влияя на каждый запрос. Установка заголовка cookie в запросе, результатом будет объединение вашего заголовка cookie и cookie в CookieContainer.
  2. CookieInjector в загрузчике вызывается один раз и добавляет cookie в CookieContainer.

Расписание

Хэш запроса

  1. Разные заголовки для одного и того же URL — это разные запросы, поэтому заголовки являются фактором.
  2. В запросе есть свойство CycleRetryTimes, если значения различаются, то запросы различаются. Свойство Depth не является фактором.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/nlh774-DotnetSpider.git
git@api.gitlife.ru:oschina-mirror/nlh774-DotnetSpider.git
oschina-mirror
nlh774-DotnetSpider
nlh774-DotnetSpider
master