Слияние кода завершено, страница обновится автоматически
# -*- coding: utf-8 -*
import requests#网络请求
import re#提取数据
import time
URLadd1='%URL%'#分类URL头
URLadd2='%URL%'#子页面URL头
def auto_download_link_DEMO(pages):
for n in range(1,pages):
a_url='http://www.ygdy8.net/html/gndy/dyzz/list_23_'+str(n)+'.html'
print('URL:',a_url)
html_1=requests.get(a_url)
html_1.encoding = 'gb2312'
print('status code:',html_1.status_code) #200
#print('网页源码:',html_1.text) #查看网页源代码
print('Process Page:',n)
detil_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)
print('Deril list:',detil_list)
for m in detil_list:
#for m in detil_list[0]:提取一个
b_url ='http://www.ygdy8.net/'+ m
print('URL2:',b_url)
html_2=requests.get(b_url)
#指定网页编码格式
html_2.encoding = 'gb2312'
#print(html_2.text)
#re.findall()返回列表
ftp = re.findall('<a href="(.*?)">.*?</a></td>',html_2.text)
print('FTP下载地址:',ftp)#打印查看
with open('C:\\Users\\留学帮帮01\\Desktop\\dytt.txt','a',encoding='utf-8')as f:
#写入本地 write写文本
f.write(ftp[0]+'\n')
def auto_download_link(pages):
index_1=0
for n in range(1,pages):
a_url=URLadd1+str(n)+'.html'
print('分类 URL:',a_url)
html_1=requests.get(a_url)
html_1.encoding = 'utf-8'
#print('status code:',html_1.status_code) #200
#print('网页源码:',html_1.text) #查看网页源代码
print('处理第',n,'/',pages,'页面时间:',time.strftime('%Y-%m-%d %H:%M:%S'))
detil_list=re.findall('<a href="(.*?)" style="color:',html_1.text)
print('子页面数量:',len(detil_list))
print('子页面清单:',detil_list)
index_2=0
for m in detil_list:
#for m in detil_list[0]:提取一个
b_url =URLadd2+ m
index_1=index_1+1
index_2=index_2+1
print('开始处理新任务...')
print('处理第',n,'/',pages,'主页面的',index_2,'/',len(detil_list),'子页面时间:',time.strftime('%Y-%m-%d %H:%M:%S'))
print('子页面 URL:',b_url)
html_2=requests.get(b_url)
#指定网页编码格式
html_2.encoding = 'utf-8'
#print(html_2.text)
#re.findall()返回列表
ftp = re.findall(r"<ol><li>(.+)</ol>",html_2.text)
if len(ftp) ==0:
ftp='磁力链 is null'
print('磁力链地址:',ftp)#打印查看
with open('C:\\Users\\%username%\\Desktop\\磁力链.txt','a',encoding='utf-8')as f:
#写入本地 write写文本
f.write(ftp[0]+'\n')
print('写文件时间:',time.strftime('%Y-%m-%d %H:%M:%S'),'累计写入次数:',index_1)
print('任务成功')
print('.')
print('..')
print('...')
xb_auto_download_link(211)
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )