python爬虫-爬取妹子图资源

文章目录 [ 隐藏 ]

爬虫其实很简单,只要用心,很快就就能掌握这门技术,下面通过实现抓取妹子图资源美女,来分析一下为什么爬虫事实上是个非常简单的东西。

本文目标

  • 解析妹子图网站网页源码
  • 抓取妹子图网站美女图片地址
  • 把每一个美女的写真图片按照文件夹保存到本地

网站分析

打开妹子图主页,点击清纯美女,然后点击下一页,我们可以看到Url地址为http://www.meizitu.com/a/qingchun_3_2.html,多次翻页,可以得知,最后一个数字2代表页数。
继续分析,选择某一个美女,点击进入妹子图详情,点击鼠标右键,查看源码。找到妹子图高清大图地址如:http://pic.meizitu.com/wp-content/uploads/2016a/07/10/01.jpg”

抓取网页源码

通过Requests框架抓取源码,对获取的网页源码,通过正则表达式进行匹配,找到妹子图详情页图片地址。

如果不了解Requests,可以点击查看Requests学习

直接上代码如下

运行结果如下

下载图片保存到本地

我们可以用python文件读写库对图片数据进行下载和保存
代码如下

执行结果

我们到E盘目录下,可以看到图片已经下载成功。

源码

我们可以用一个for循环进行翻页,然后解析网页源码,获取图片详情页地址,在E盘目录下简历对应的图片文件夹,然后解析图片详情页。获取美女高清大图地址,然后把图片下载到本地。
源码如下:

运行结果如下

源码下载

源码已上传到github:https://github.com/dy60420667/python_meizitu

未经允许不得转载:Python在线学习 » python爬虫-爬取妹子图资源

赞 (0)

来吐槽吧 2

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. 321感谢回复
    • 嘻哈大猫不用客气,希望这篇文章能帮助到您回复