Python3 网络爬虫(六):618,爱他/她,就清空他/她的购物车!

2020年6月12日 08:48:11 22 8,185 °C
摘要

模拟登陆淘宝,就这么简单!

Python3 网络爬虫(六):618,爱他/她,就清空他/她的购物车!

本文 GitHub https://github.com/Jack-Cherish/PythonPark 已收录,有技术干货文章,整理的学习资料,一线大厂面试经验分享等,欢迎 Star 和 完善。

一、前言

爬虫系列,已讲 5 篇。

文字、图片、视频这类常规的内容下载、API 的使用,这些操作对你来说,应该轻而易举了。

那今天,就讲解一下高级一点的技能,「模拟登录」。

值此 618 之际,帮他/她清空一波购物车!

二、模拟登录

学爬虫,总能听到「模拟登录」这四个字,究竟什么是「模拟登录」?

通俗一点讲,「模拟登录」就是程序用账号和密码自动登录一个网站。

然后,拿到只有登录后,才能下载的网站数据。

比如,我们只有登录淘宝账号之后,才能看到购物车里有哪些东西。

本文,就以「模拟登录」淘宝为例进行讲解,并帮他/她清空购物车。

你只需要知道他/她的 淘宝账号和密码 ,并且 有个充足的钱包 ,就可以运行程序,扫码支付一气呵成。

体验 自动结算 钱包秒空 的快感!

三、Selenium

模拟登录无非两种方法:请求包分析模拟登录、自动化测试工具模拟登录。

前者,需要抓包分析请求,解析各种参数,还可能涉及一些加密算法。

后者,可以绕过一些繁琐的分析过程,直接定位元素进行操作,但也会遇到一些反爬策略。

两者,都有各自的操作技巧。

之前的教程,讲解了很多基于 requests 请求包分析的爬虫思路。

本文讲解一个新思路,使用自动化测试工具 Selenium 模拟登录。

Selenium 基本的使用方法 ,以及如何 破解淘宝对于 Selenium 的反爬策略 ,尽在下文。​

1、Selenium 安装

Selenium 是一个自动化测试工具,支持各种主流浏览器,例如 Chrome、Safari、Firefox 等。

不知道什么是自动化测试工具没关系,我会通过实战操作,慢慢讲解。

不管怎样,先安装 Selenium 再说。