盘点URLError和HTTPError异常处理方式

共 3676字,需浏览 8分钟

 ·

2024-04-11 04:53

点击上方“ Python爬虫与数据挖掘 ”,进行关注

回复“ 书籍 ”即可获赠Python从入门到进阶共10本电子书





不堪玄鬓影,来对白头吟。

一、前言


本文主要说URLError 还有 HTTPError,以及一些处理方式。




二、URLError


1. 解释下 URLError 可能产生的3个原因:


      

# 1. 网络无连接,即本机无法上网。









# 2. 连接不到特定的服务器。









# 3. 服务器不存在。



2. 案例


例:


在代码中,需要用 try-except 语句来包围并捕获相应的异常。


      

# coding:UTF8








import urllib.request







request = urllib.request.urlopen("http://www.baidu.com")







try:


urllib.request.urlopen(request)


print("[Errno 11004] getaddrinfo failed")


except urllib.URLError as e:


print(e.reason)


利用了 urlopen 方法访问了一个不存在的网址。


运行结果:


673979f5994345accb75a448df88c0b5.webp


注:


它说明了错误代号是11004,错误原因是 getaddrinfo failed。




三、HTTPError


HTTPError 是 URLError 的子类,在利用 urlopen 方法发出一个请求时,服务器上都会对应一个应答对象 response,其中它包含一个数字”状态码”。


例:


捕获的异常是 HTTPError,它会带有一个 code 属性,就是错误代号,另外又打印了 reason 属性,这是它的父类 URLError 的属性。


      
import urllib2


req = urllib2.Request('http://blog.csdn.net/cqcre')


try:


urllib2.urlopen(req)


except urllib2.HTTPError, e:


print e.code


print e.reason


运行结果:


fe8e2936f4649900a1609814f0688ce2.webp


1. 代码解析


错误代号是 403,错误原因是 Forbidden,说明服务器禁止访问。


知道,HTTPError 的父类是 URLError,根据编程经验,父类的异常应当写到子类异常的后面,如果子类捕获不到,那么可以捕获父类的异常,


2. 优化代码


      
import urllib2


req = urllib2.Request('http://blog.csdn.net/cqcre')


try:


urllib2.urlopen(req)


except urllib2.HTTPError, e:


print e.code


except urllib2.URLError, e:


print e.reason


else:


print "OK"


031187774e89533882cb3dd7607e2a56.webp


如果捕获到了 HTTPError,则输出 code,不会再处理 URLError 异常。如果发生的不是HTTPError,则会去捕获 URLError 异常,输出错误原因。


另外还可以加入 hasattr 属性提前对属性进行判断,代码改写如下


      
import urllib2


req = urllib2.Request('http://blog.csdn.net/cqcre')


try:


urllib2.urlopen(req)


except urllib2.URLError, e:


if hasattr(e,"code"):


print e.code


if hasattr(e,"reason"):


print e.reason


else:


print "OK"


b9232ed8e4d7250d284b90ab8f8e6ee5.webp


3. 异常处理方法



  1. 首先对异常的属性进行判断,以免出现属性输出报错的现象


  2. 假如 response 是一个”重定向”,需定位到别的地址获取文档,urllib2 将对此进行处理。



注 :


HTTPError 实例产生后会有一个 code 属性,这就是是服务器发送的相关错误号。


因为 urllib2 可以为处理重定向,也就是 3 开头的代号可以被处理,并且 100-299 范围的号码指示成功,所以只能看到 400-599 的错误号码。




四、总结


本文基于基础,通过案例的分析,代码的展示。解决在实际应用中,对于URLError空异常的处理方式。介绍了两种主要的异常错误。以及提供了相应错误的解决方案处理方法。


欢迎大家积极尝试,有时候看到别人实现起来很简单,但是到自己动手实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。


使用语言,能够让读者更清晰,更直观的理解文章内容。代码很简单,希望对学习有帮助。


------------------- End -------------------



往期精彩文章推荐:



欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持


想加入Python学习群请在后台回复【 入群


万水千山总是情,点个【 在看 】行不行


/今日留言主题/


随便说一两句吧~


浏览 11
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报