盘点URLError和HTTPError异常处理方式-技术圈

点击上方“ Python爬虫与数据挖掘 ”，进行关注

回复“ 书籍 ”即可获赠Python从入门到进阶共10本电子书

今

日

鸡

汤

不堪玄鬓影，来对白头吟。

一、前言

本文主要说URLError 还有 HTTPError，以及一些处理方式。

二、URLError

1. 解释下 URLError 可能产生的3个原因：

      

        

          # 1. 网络无连接，即本机无法上网。

        

      

      

        

          


      

      

        

          # 2. 连接不到特定的服务器。

        

      

      

        

          


      

      

        

          # 3. 服务器不存在。

2. 案例

例：

在代码中，需要用 try-except 语句来包围并捕获相应的异常。

      

        

          # coding:UTF8

        

      

      

        

          


      

      

        import urllib.request

      

      

        

          


      

      

        request = urllib.request.urlopen("http://www.baidu.com")

      

      

        

          


      

      

        try:

      

      

            urllib.request.urlopen(request)

      

      

            print("[Errno 11004] getaddrinfo failed")

      

      

        except urllib.URLError as e:

      

      

            print(e.reason)

利用了 urlopen 方法访问了一个不存在的网址。

运行结果：

注：

它说明了错误代号是11004，错误原因是 getaddrinfo failed。

三、HTTPError

HTTPError 是 URLError 的子类，在利用 urlopen 方法发出一个请求时，服务器上都会对应一个应答对象 response，其中它包含一个数字”状态码”。

例：

捕获的异常是 HTTPError，它会带有一个 code 属性，就是错误代号，另外又打印了 reason 属性，这是它的父类 URLError 的属性。

      

        import urllib2

      

      

        req = urllib2.Request('http://blog.csdn.net/cqcre')

      

      

        try:

      

      

            urllib2.urlopen(req)

      

      

        except urllib2.HTTPError, e:

      

      

            print e.code

      

      

            print e.reason

运行结果:

1. 代码解析

错误代号是 403，错误原因是 Forbidden，说明服务器禁止访问。

知道，HTTPError 的父类是 URLError，根据编程经验，父类的异常应当写到子类异常的后面，如果子类捕获不到，那么可以捕获父类的异常，

2. 优化代码

      

        import urllib2

      

      

        req = urllib2.Request('http://blog.csdn.net/cqcre')

      

      

        try:

      

      

            urllib2.urlopen(req)

      

      

        except urllib2.HTTPError, e:

      

      

            print e.code

      

      

        except urllib2.URLError, e:

      

      

            print e.reason

      

      

        else:

      

      

            print "OK"

如果捕获到了 HTTPError，则输出 code，不会再处理 URLError 异常。如果发生的不是HTTPError，则会去捕获 URLError 异常，输出错误原因。

另外还可以加入 hasattr 属性提前对属性进行判断，代码改写如下

      

        import urllib2

      

      

        req = urllib2.Request('http://blog.csdn.net/cqcre')

      

      

        try:

      

      

            urllib2.urlopen(req)

      

      

        except urllib2.URLError, e:

      

      

            if hasattr(e,"code"):

      

      

                print e.code

      

      

            if hasattr(e,"reason"):

      

      

                print e.reason

      

      

        else:

      

      

            print "OK"

3. 异常处理方法

首先对异常的属性进行判断，以免出现属性输出报错的现象 。

假如 response 是一个”重定向”，需定位到别的地址获取文档，urllib2 将对此进行处理。

注：

HTTPError 实例产生后会有一个 code 属性，这就是是服务器发送的相关错误号。

因为 urllib2 可以为处理重定向，也就是 3 开头的代号可以被处理，并且 100-299 范围的号码指示成功，所以只能看到 400-599 的错误号码。

四、总结

本文基于基础，通过案例的分析，代码的展示。解决在实际应用中，对于URLError空异常的处理方式。介绍了两种主要的异常错误。以及提供了相应错误的解决方案处理方法。

欢迎大家积极尝试，有时候看到别人实现起来很简单，但是到自己动手实现的时候，总会有各种各样的问题，切勿眼高手低，勤动手，才可以理解的更加深刻。

使用语言，能够让读者更清晰，更直观的理解文章内容。代码很简单，希望对学习有帮助。

------------------- End -------------------

往期精彩文章推荐：

手把手教你利用Python轻松拆分Excel为多个CSV文件

Python项目实战——手把手教你使用Django框架实现支付宝付款

手把手教你用Python爬取百度搜索结果并保存

欢迎大家点赞，留言，转发，转载，感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群】

万水千山总是情，点个【在看】行不行

/今日留言主题/

随便说一两句吧~

盘点URLError和HTTPError异常处理方式