开篇寄语
在上一篇,伯衡君介绍了Python的基本知识,命名,具体可以参看下方的前情提要。本篇文章则是继续沿着上一篇文章的内容展开,继续深化学习Python爬虫的基础知识——循环和判断,这一篇文章对于学好爬虫非常重要,是以为记。
前情提要
内容详情
函数与控制语句
本节主要介绍Python函数的定义与使用方法,介绍Python的判断和循环两种爬虫技术中常用的控制语句,先来介绍一下函数。
函数
“脏活累活交给函数来做”,首先,看看Python中定义函数的方法。
def 函数名(参数1,参数2...): return '结果'
制作一个输入边长就能计算出矩形的面积函数:
def function(a,b): print(a * b)
通过输入function(2,3),便可以调用函数,计算边为2和3的矩形的面积。
现在来做一个综合练习:读者都知道网上公布的电话号码,如156**9354,中间的数值用其他符号代替了,而用户输入手机号时却是完整地输入,下面就通过Python()函数来实现这种转换功能。
def change_number(phone): hiding_number = number.replace(phone[3:7],'*'*4) print(hiding_number) change_number('13888888888') //result 138****8888
注意:这里的手机号码是随意输入的,不是真实的号码。
代码说明如下:
定义了一个名为change_number的函数。
对输入的参数进行切片,把参数的[3:7]部分替换为‘*’号,并打印出来。
调用函数。
接下来则是来聊一下有关的控制语句:
控制语句
在爬虫实战中也会经常使用判断语句,Python的判断语句格式如下:
if condition: do else: do
注意:冒号和缩进不要忘记了
再看一下多重条件的格式
if condition: do elif condition: do else: do
在平时使用密码时,输入的密码正确即可登录,密码错误时就需要再次输入密码。
def count_login(): password = input('password:') if password == '12345': print('输入成功!') else: print('错误,再输入') count_login() count_login()
程序说明如下:
运行程序,输入密码后按Enter键。
如果输入的字符串为12345,则打印“输入成功!”,程序结束。
如果输入的字符串不是12345,则打印“错误,再输入”,继续运行程序,直到输入正确为止。
读者也可以将程序设计得更为有趣,例如,“3次输入失败后,退出程序”等。
循环语句
Python的循环语句包括for循环和while循环,代码如下:
for循环
for item in iterable: do
item表示元素,iterable是集合
for i in range(1,11): print(i)
其结果为依次输出1到10,切记11是不输出的,range为Python内置函数
while循环
while condition: do
例如,设计一个小程序,计算1~100的和:
i = 0 sum = 0 while i < 100: i = i + 1 sum = sum + i print(sum) //输出结果为5050
进阶玩法
当掌握到一定程度后,就可以参看以下文章来进行爬虫啦:
- 我的微信
- 微信扫一扫加好友
- 我的微信公众号
- 扫描关注公众号