国瑞前端
当前位置: python > 使用python爬取出版社的地址_实战

使用python爬取出版社的地址,我们只需要通过正则,匹配符合条件的值,然后将其循环遍历,存入本地文件就可以了

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#出版社地址爬取
import urllib.request
import re
data = urllib.request.urlopen("https://read.douban.com/provider/all").read().decode("UTF-8")
pat = '<div class="name">(.*?)</div>'
rst = re.compile(pat).findall(data)

fn = open("C:/Users/Administrator/Desktop/excel/press.txt",'w')
for i in range(0,len(rst)):
    print(rst[i])
    fn.write(rst[i]+"\n")
fn.close()

print(rst[0])
#print(data)
#获取字节数
#print(len(data))

本文转载至:使用python爬取出版社的地址

「梦想一旦被付诸行动,就会变得神圣,如果觉得我的文章对您有用,请帮助本站成长」

赞(13) 打赏

支付宝扫一扫打赏

微信扫一扫打赏

标签:

上一篇:

下一篇:

相关推荐

0 条评论关于"使用python爬取出版社的地址_实战"

最新评论

    暂无留言哦~~

博客简介

国瑞个人博客: https://www.huanggr.cn/,我们关注Web前端开发技术,web前端开发,移动前端开发,前端资讯,同时分享前端资源和工具等,期待你的参与,了解更多..

博主独立研发主题:

广告

广告

广告

广告

精彩评论

广告

站点统计

  • 文章总数: 334 篇
  • 草稿数目: 86 篇
  • 分类数目: 28 个
  • 独立页面: 5 个
  • 评论总数: 108 条
  • 链接总数: 10 个
  • 标签总数: 111 个
  • 注册用户: 176 人
  • 访问总量: 8,677,314 次
  • 最近更新: 2021年7月21日
服务热线:
 

 QQ在线交流

 旺旺在线