原理:
1.抓取网页内容
2.从网页内容读取图片链接
代码(详解见代码):
import requests
import re
import time
# 获取到网页内容
r = requests.get('https://www.douyu.com') # 斗鱼
html=r.text
# 通过正则表达式获取网页内容的图片
images=re.findall(r'data-original="(.*?\.(jpg|png))"',html)
print(images)
# 通过遍历下载图片存储到本地
for image in images:
s=image[0]
index=s.rindex('/')
# 睡眠一秒下载
time.sleep(1)
req=requests.get(s)
# 将文件url文件最后一个/后面的字符作为文件名称
with open('/Users/lyf/test/%s'%s[index+1:],'wb') as code:
code.write(req.content)
效果