从头学习爬虫（三十）实战篇----动漫之家漫画（分析） - 好文

本文主要分析爬取流程。

点击打开漫画 <https://manhua.dmzj.com/>

我下的漫画是食灵

一列表页

请求和浏览器所获得的页面大致一样，所以照着写xpath，拿到列表页链接

.xpath("//div[@class='cartoon_online_border']/ul/li/a/@href").all();

二详情页

首先发现每次要点下一张，才能有这一话所有的漫画，我们先点击从上到下，让他全部加载。

然后可以发现Cookie里面display_mode=1，原本是0。

找center_box img 这个图片地址,发现页面和请求不一样（js渲染）

我们这次采用渲染模式，去模拟浏览器。

那么直接跟浏览器一样xpath即可

//div[@class='btmBtnBox']/select/option 找到这个节点所有图片和信息。

下期我们用Java实战下

三结果

欢迎加群313557283（刚创建），小白互相学习~

« 上一篇：C#winform实现下载文件的功能
» 下一篇：一位5年iOS开发者的亲身经历，如果是你，你会选择放弃还是继续？【头条热门】

热门工具换一换

1 进制转换
2 GIF生成器
3 时间戳转换器
4 Cron表达式生成器
5 计算器
6 衣服尺码计算
7 身份证归属地、性别、出生日期、年龄查询
8 文本对比
9 图像文字识别
10 图像颜色识别
11 Base64编码解码
12 日期计算器
13 人脸识别
14 照片转素描
15 摩斯电码
16 端口扫描器
17 颜色选择器
18 卡通头像制作
19 图像转Base64
20 证件照换底色