使用python爬取出版社的地址_实战

使用python爬取出版社的地址,我们只需要通过正则,匹配符合条件的值,然后将其循环遍历,存入本地文件就可以了 1234567891011121314151617#出版社地址爬取 …

使用python爬取出版社的地址,我们只需要通过正则,匹配符合条件的值,然后将其循环遍历,存入本地文件就可以了

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#出版社地址爬取
import urllib.request
import re
data = urllib.request.urlopen("https://read.douban.com/provider/all").read().decode("UTF-8")
pat = '<div class="name">(.*?)</div>'
rst = re.compile(pat).findall(data)

fn = open("C:/Users/Administrator/Desktop/excel/press.txt",'w')
for i in range(0,len(rst)):
    print(rst[i])
    fn.write(rst[i]+"\n")
fn.close()

print(rst[0])
#print(data)
#获取字节数
#print(len(data))

本文转载至:使用python爬取出版社的地址

作者: huanggr

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注