python连续爬取多个网页的图片分别保存到不同的文件夹
python连续爬取多个网页的图片分别保存到不同的文件夹
作者:vpoet
mail:vpoet_sir@163.com
1 #coding:utf-82 import urllib
3 import urllib2
4 import re
5
6
7 # 将正则表达式编译成Pattern对象
8 rex=r'src="(http://imgsrc.baidu.com/forum/w%3D580.*?\.jpg)"';
9 pages = ('1','2');
10
11 for page in pages:
12 pageurl = "http://tieba.baidu.com/p/3710495592?pn="+page;
13 Response=urllib2.urlopen(pageurl);
14 Html=Response.read();
15 lists = re.findall(rex, Html);
16 lensofpage=len(lists);
17 print lensofpage;
18
19 picname = 'pic' + page;
20 print picname;
21 x=1;
22 for picurl in lists:
23 urllib.urlretrieve(picurl,'C:\Users\Administrator\Desktop\%s\%s.jpg' % (picname,x));
24 print page+picurl;
25 x=x+1;
26
27
28
29 print 'DownLoadPicOver'
30 # 图片存储路径:C:\Users\Administrator\Desktop\pic1
31 # C:\Users\Administrator\Desktop\pic2
32 #测试爬取网址:http://tieba.baidu.com/p/3710495592?pn=1
33 # http://tieba.baidu.com/p/3710495592?pn=2
运行截图:
以上是 python连续爬取多个网页的图片分别保存到不同的文件夹 的全部内容, 来源链接: utcz.com/z/386769.html