Просто для развлечения, во время изучения colly я решил попробовать свои силы. В процессе парсинга я вел переговоры с администратором сайта, что было довольно забавно. Если скорость парсинга слишком высока, IP-адрес может быть заблокирован. Также, если при загрузке изображений не указать referer, вы скачаете изображение с надписью "не крадите ссылки".
В этом проекте используется colly для парсинга. Colly — это популярная библиотека для создания пауков на языке Go. Go имеет преимущества в области высокой конкуренции и распределённых систем, что соответствует требованиям к паукам. Основные характеристики colly — это легкость, скорость и элегантный дизайн. Распределённое использование и расширение также очень просты.
git clone https://github.com/pwh19920920/go-colly-mzitu
go mod init mzitu
go mod vendor
Если установка зависимостей происходит медленно, вы можете обратиться к следующей статье
Использование goproxy для решения проблем с go get, медленной загрузкой пакетов с GitHub
mzitu-linux
mzitu-mac
mzitu-windows.exe
#### 5. Обучающие материалы по colly
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )