来 源:志斌的笔记
作 者:志斌
随着时间的推移,技术的进步 , 字符验证码越来越容易被破解,所以,开发者开发了一种新的反爬虫方式——滑块验证码反爬虫,来限制爬虫程序 。
今天来跟大家分享一下如何解决验证码反爬虫中的滑块验证码反爬虫 。
一
原理
网站开发者们认为可以从行为方面来区别人类和计算机 。例如:人们可以自由的完成拖拽、按下和释放鼠标等操作,但是计算机却不可以 。
二
破解
01
观察滑块和轨道的长度
我们首先要打开网页的开发者模式,来看一下滑块和轨道的长度分别是多少 。
滑块长度
轨道长度
从上面我们知道了滑块的长度是50,轨道的长度是390,也就是说,滑块需要滑动的距离是340 。
02
模拟滑动
在上面我们已经知道滑块要滑动的距离了,那么我们现在就可以开始尝试模拟滑动了 。这里我们使用来完成滑块滑动的工作 。
关于库的安装、配置和使用方法,可以看一下这篇文章学会 , 实现真正的可见即可爬! 。
模拟滑动主要分为以下两步:
1. 将鼠标定位到滑块位置
我们打开开发者模式 , 对滑块进行检查发现 , 滑块的class属性是hover,所以定位代码如下:
from selenium import webdriver
driver = webdriver.Chrome(r'chromedriver.exe')
url = 'http://www.porters.vip/captcha/sliders.html#'
driver.get(url)
hover = driver.find_element_by_css_selector('.hover')
2. 移动鼠标到轨道终点
库中有一个模块模式识别与人工智能 matlab,它可以模拟鼠标按住滑块进行移动,然后进行释放等操作,很符合我们的需求 。代码如下:
from selenium import webdriver
import time
move = webdriver.ActionChains(driver)
move.click_and_hold(hover).perform()
time.sleep(1)
move.move_by_offset(340,0)
time.sleep(1)
move.release().perform()
三
文章插图
文章插图
小结
1. 本文详细介绍了滑块验证码反爬虫的原理和破解方法 。
2. 滑块验证码是现在比较流行的一种验证码反爬虫,所以大家如果想成为一名爬虫工程师 , 那这是一个必备技能 。
【滑块验证码的原理和破解方法】3. 破解滑块验证码主要分两步:一、计算出滑块要滑动的距离;二、让滑块进行移动 。
4. 本文仅供学习参考,不做它用 。
END
留言赠书
爱数据教育与北京大学出版社联合开展 “ 留言送书 ” 活动,本次为大家选择的书籍为:《人工智能数学基础》
【内容简介】
本书以零基础讲解为宗旨,面向学习数据科学与人工智能的读者,通俗地讲解每一个知识点,旨在帮助读者快速打下数学基础 。
第1 篇:数学知识基础篇
主要讲述了高等数学基础、微积分、泰勒公式与拉格朗日乘子法 。
第 2 篇:数学知识核心篇
主要讲述了线性代数基础、特征值与矩阵分解、概率论基础、随机变量与概率估计 。
第 3 篇:数学知识提高篇
主要讲述了数据科学的几种分布、核函数变换、熵与激活函数 。
第 4 篇:数学知识应用篇
主要讲述了回归分析、假设检验、相关分析、方差分析、聚类分析、贝叶斯分析等内容 。
【作者简介】
唐宇迪,计算机专业博士,网易云课堂人工智能认证行家,51CTO学院讲师模式识别与人工智能 matlab,CSDN博客专家 。
李琳 , 河南工业大学副教授,在软件工程、机器学习、人工智能和模式识别等领域有深入研究 。
侯惠芳,教授 , 解放军信息工程大学通信与信息系统专业博士,擅长机器学习、大数据检索、人工智能和模式识别等 。
王社伟 , 河南工业大学副教授,西北工业大学航空宇航制造专业博士,挪威科技大学访问学者 , 对数字化制造、企业管理系统、机器学习、数据挖掘等有丰富的实战经验 。
本次福利活动将选取留言最走心的1位粉丝免费赠送上述书籍 。下周日公布中奖者及书籍领取方式 。期待大家的留言~
【上周中奖者公布】
我们会私下联系你收集信息地址进行邮寄,注意查收 , 收到书籍后欢迎反馈哦~
本文到此结束,希望对大家有所帮助 。
- ?240鞋码是多大码
- ?46码的鞋是多少厘米
- 90后回忆杀!小米手机的“掌上精灵”,梦幻联动《数码宝贝》
- 小胸与平胸的区别 ?70a是什么尺码
- ?数码相机和单反的区别
- 照片视频超清无码修复,再也不怕模糊画面了
- l是什么码的衣服 ?l是什么码
- 兑换码已核销是什么意思 ?已核销是什么意思
- 身份证号码的含义是什么
- 中码是? ?中码是什么字母