Github上一款自动识别验证码爬虫项目

百度已收录   阅读次数: 108
2020-09-1808:34:27 发表评论
摘要

想必大家在各大网站都会遇到要输入验证码的情况,尤其是要爬项目的时候,那就很不爽了,手动输入效率很低,有没有一种方式可以自动跳过验证码呢?恰好伯衡君在github上发现了一个自动跳过验证码的项目,似乎作者正在逐步扩大覆盖的网站范围,可以尝试关注一下,分享给大家……

Github上一款自动识别验证码爬虫项目

开篇寄语

想必大家在各大网站都会遇到要输入验证码的情况,尤其是要爬项目的时候,那就很不爽了,手动输入效率很低,有没有一种方式可以自动跳过验证码呢?恰好伯衡君在github上发现了一个自动跳过验证码的项目,似乎作者正在逐步扩大覆盖的网站范围,可以尝试关注一下,分享给大家。

项目地址

  • https://github.com/wkunzhi/Spider-Tools

项目介绍

工具主要功能包含: 各类调试转码、免费代理 IP 获取、验证码自动识别、免费短信接收器、等功能。

稍有限制:

  1. 仅支持简单验证码识别;
  2. 识别线程最大每秒 10 次;
  3. 不会提供完整的识别方案;

本地API调用Python:

import requests  
import base64    
 
# 1. 先二进制读图片  
with open('code.png', 'rb') as f:      
	img = f.read() 
     
# 2. 图片 base64 编码一下  
# 3. 组装 data 发送 post 请求!端口号是软件上绑定的端口号,默认 8820  
ret= requests.post('http://127.0.0.1:8820', data={"img": base64.b64encode(img)})    
 
# 4. 收到返回结果  
print(ret.text) 

普通验证码测试:

12306验证码测试:

温馨提示

如果你想找到更多的爬虫项目,可以看伯衡君之前分享的这篇文章:

分享至:
  • 我的微信
  • 微信扫一扫加好友
  • weinxin
  • 我的微信公众号
  • 扫描关注公众号
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: