Эта система основана на Python и использует веб-интерфейс для отображения всех её функций. Каждый модуль системы — сбор данных с помощью пауков, анализ данных, визуализация данных и взаимодействие — работает независимо друг от друга, но при этом они могут общаться между собой. Все эти функции реализованы с использованием богатого набора библиотек Python.
Для сбора данных используется библиотека Requests, а парсинг выполняется с помощью lxml и BeautifulSoup4. Анализ данных осуществляется с помощью NumPy и Pandas, а визуализация — с помощью PyEcharts. Для создания веб-интерфейса используется Flask. Данные хранятся и передаются через CSV-файлы, базу данных MySQL и конфигурационные файлы.
Для расширения функциональности была внедрена возможность использования планировщика задач, отправки сообщений через WeChat, а также были созданы регистратор функций и итератор параметров. Исходные данные для пауков собираются с сайтов Zhipin, QiLu Talent, Liepin и LaGou, и все необходимые данные присутствуют.
Система имеет следующую общую структуру, представленную ниже:- Директория spider
содержит код пауков (скрейперы);
analysis
выполняет задачи импорта, анализа данных, отрисовки графиков и взаимодействия;data
хранит первичные данные;conf
содержит конфигурационные файлы для графиков и базы данных MySQL.Импорт, анализ и визуализация данных осуществляются через единственный входной точкой analysis_main
, которая вызывается сервером. Все остальные функции вызываются непосредственно сервером. Все возможности можно запустить с главной страницы.
Благодарю за продукты и техническую поддержку от Server酱, PyEcharts, Tencent Cloud и других.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )