Слияние кода завершено, страница обновится автоматически
import re
import pandas as pd
import requests
from lxml import etree
from dask.bytes.tests.test_http import requests
class getList:
def input(self):
###网址
url = "https://xs.sogou.com/top/hot/"
###模拟浏览器
header = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36'}
html = etree.HTML(requests.get(url, headers=header).text)
rank = html.xpath('//ul[@class="list-content list-0"]//span[@class="text-num icon"]/text()')#序号
type = html.xpath('//ul[@class="list-content list-0"]//a[@class="list-type"]/text()')#类型
name = html.xpath('//ul[@class="list-content list-0"]//a[@class="list-name"]/text()')#小说名称
section = html.xpath('//ul[@class="list-content list-0"]//a[@class="list-section"]/text()')#更新章节
status = html.xpath('//ul[@class="list-content list-0"]//span[@class="list-status"]/text()')#状态
count = html.xpath('//ul[@class="list-content list-0"]//span[@class="list-count"]/text()')#字数
author = html.xpath('//ul[@class="list-content list-0"]//span[@class="list-author"]/text()')#作者
time = html.xpath('//ul[@class="list-content list-0"]//span[@class="list-time"]/text()')#更新时间
list = []
for i in range(0, len(name)):
subList = []
subList.append(rank[i])
subList.append(re.sub('「','',re.sub('」','',type[i])))
subList.append(name[i])
subList.append(section[i])
subList.append(status[i])
subList.append(re.sub(',','',re.sub('万字','',count[i])))
subList.append(author[i])
subList.append(time[i])
list.append(subList)
name = ['排名', '类型', '小说名称', '更新章节', '状态', '字数(万字)', '作者', '更新时间']
test = pd.DataFrame(columns=name, data=list)
print(test)
test.to_csv('bangdan.csv')
return list
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )