GUI интерфейс + Python парсер + обработка и очистка данных + визуализация данных с помощью pyecharts
(1) Создание GUI интерфейса с помощью tkinter, запуск парсера и анализа данных по нажатию кнопок.
(2) Парсер извлекает данные и использует алгоритмы машинного обучения для вычислений, очистки данных и разбиения текста.
(3) При нажатии кнопки "Анализ данных" происходит переход по гиперссылке к HTML странице, содержащей графики: статистика по жанрам, анализ "горячих" тем (облако слов), состояние популярных novels (диаграмма секторов), топ авторов по количеству символов, график рассеяния символов-ранг.
Операционная система: Windows 10
Версия Python: Python 3.7.6
Редактор кода: PyCharm 2020.1.3
(1) Выбор сайта для парсинга
Определение сайта для парсинга, просмотр исходного кода с помощью "F12", анализ возможности парсинга информации, поиск необходимых для парсинга тегов, содержащих данные: "Номер", "Жанр", "Название novels", "Обновленная глава", "Состояние", "Количество символов", "Автор", "Дата обновления".
(2) Реализация метода getList()
Получение исходного кода сайта с помощью etree.HTML, извлечение текста тегов с помощью xpath, добавление их в массив и возврат массива, запись данных в файл bangdan.csv.(3) Проектирование графического интерфейса пользователя (GUI)
Создание окна с помощью tkinter, добавление контейнеров и компонентов.
(4) Очистка и обработка данных
Использование алгоритмов машинного обучения, таких как библиотека Pandas, для обработки данных в файле, например, суммирование и группировка.
(5) Визуализация данных
Использование инструмента pyecharts для создания графиков, которые позволяют получить необходимую информацию.
(1) GUI страница
(2) При нажатии кнопки "Обновить рейтинг", начинается парсинг данных
(3) Завершение парсинга данных, отображение полного рейтинга
(4) При нажатии кнопки "Анализ данных", отображается страница с визуализацией данных
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )