Используя схему редактирования ссылок публичных аккаунтов, преодолеваем ограничение в 10 запросов схемы Sogou. ~~~ ;-)
todo.list записывает все данные ссылок на статьи в публичном аккаунте. Из-за частого вызова интерфейса поиска статей или перехода по страницам может произойти бан. Поэтому текущий подход заключается в использовании маски для записи всех данных обработки индекса, что гарантирует отсутствие повторного перехода на одну и ту же страницу и повышает вероятность получения новых ссылок.
pip install -r requirements.txt
wxhub/
├── README.md
├── arti.cache.list (создаётся после использования)
├── chromedriver (версия macOS по умолчанию, версия для Windows доступна для отдельной загрузки, просто переименуйте её)
├── cookies.json (создаётся после использования)
├── gongzhonghao.py (создаётся после использования)
├── output (создаётся после использования)
├── requirements.txt
├── url.cache.list (создаётся после использования)
└── wxhub.py
(py3) isyuu:wxhub isyuu$ python wxhub.py -h
использование: wxhub.py [-h] -biz BIZ [-chrome CHROME] [-arti ARTI] [-method METHOD]
[-sleep SLEEP] [-pipe PIPE] [-pl PAGE_LIMIT]
решает все проблемы с общедоступными аккаунтами
необязательные аргументы:
-h, --help показать это справочное сообщение и выйти
-biz BIZ обязательно: имя общедоступного аккаунта
-chrome CHROME необязательно: путь к веб-браузеру Chrome, по умолчанию используется chromedriver в том же каталоге скрипта
-arti ARTI необязательно: название статьи, по умолчанию обрабатываются все статьи
-method METHOD необязательно, метод обработки: all_images, baidu_pan_links, whole_page
-sleep SLEEP время ожидания между переходами на страницы, по умолчанию 1 секунда на страницу.
-pipe PIPE при указании метода как pipe этот параметр определяет процесс обработки потока. Например: "pipe_example,
pipe_example1, pipe_example2, pipe_example3"
-pl PAGE_LIMIT указывает максимальное количество переходов на страницы, слишком большое количество переходов на одни и те же страницы общедоступного аккаунта в течение короткого времени может привести к бану, 0: не переходит на другие страницы и обрабатывает только todo.list, по умолчанию <0: нет ограничений
>0: количество переходов на страницу
В настоящее время есть функции кэширования, и кэш хранится в следующих файлах.
Если необходимо полностью перезагрузить данные, удалите соответствующие файлы.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )