1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/huang_jia_son-duoduo

Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

Парсер для получения данных о рейтинге novels и визуализация данных

Описание

GUI интерфейс + Python парсер + обработка и очистка данных + визуализация данных с помощью pyecharts

Архитектура программного обеспечения

(1) Создание GUI интерфейса с помощью tkinter, запуск парсера и анализа данных по нажатию кнопок.

(2) Парсер извлекает данные и использует алгоритмы машинного обучения для вычислений, очистки данных и разбиения текста.

(3) При нажатии кнопки "Анализ данных" происходит переход по гиперссылке к HTML странице, содержащей графики: статистика по жанрам, анализ "горячих" тем (облако слов), состояние популярных novels (диаграмма секторов), топ авторов по количеству символов, график рассеяния символов-ранг.

Описание окружения

Операционная система: Windows 10

Версия Python: Python 3.7.6

Редактор кода: PyCharm 2020.1.3

Описание кода

(1) Выбор сайта для парсинга

Определение сайта для парсинга, просмотр исходного кода с помощью "F12", анализ возможности парсинга информации, поиск необходимых для парсинга тегов, содержащих данные: "Номер", "Жанр", "Название novels", "Обновленная глава", "Состояние", "Количество символов", "Автор", "Дата обновления".

(2) Реализация метода getList()

Получение исходного кода сайта с помощью etree.HTML, извлечение текста тегов с помощью xpath, добавление их в массив и возврат массива, запись данных в файл bangdan.csv.(3) Проектирование графического интерфейса пользователя (GUI)

Создание окна с помощью tkinter, добавление контейнеров и компонентов.

(4) Очистка и обработка данных

Использование алгоритмов машинного обучения, таких как библиотека Pandas, для обработки данных в файле, например, суммирование и группировка.

(5) Визуализация данных

Использование инструмента pyecharts для создания графиков, которые позволяют получить необходимую информацию.

Скриншоты

(1) GUI страница

Входное изображение

(2) При нажатии кнопки "Обновить рейтинг", начинается парсинг данных

Входное изображение

(3) Завершение парсинга данных, отображение полного рейтинга

Входное изображение

(4) При нажатии кнопки "Анализ данных", отображается страница с визуализацией данных

Входное изображение

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

GUI интерфейс + Python паук для парсинга + обработка и очистка данных + визуализация данных с помощью pyecharts Развернуть Свернуть
Apache-2.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Язык

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/huang_jia_son-duoduo.git
git@api.gitlife.ru:oschina-mirror/huang_jia_son-duoduo.git
oschina-mirror
huang_jia_son-duoduo
huang_jia_son-duoduo
master