机器人在解决验证码方面比人类表现更出色？-技术圈

大数据文摘授权转载自机器人大讲堂

潜伏在网络当中的不法分子防不胜防，灌水，炸帖都是网络攻击的常见手段，当封禁账号的速度跟不上恶意注册的速度，人工审核远远落后重复运行的代码时，确实需要对注册以及发言行为做限制了。

在2003年，一组来自卡内基梅隆大学的博士为了应对这一问题，创造了CAPTCHA，这是一个完全自动化的公共图灵测试，旨在区分计算机和人类。

早期的验证码主要由扭曲、变形或翻转的字符串和数字组成。这些对机器人而言是难以理解的，但人类可以轻松辨认。有了这种简单的门槛，垃圾邮件、黄牛插件和恶意攻击的爬虫程序就可以轻易地被挡在网页之外。

然而，好景不长，这样的验证码很快被计算机程序破解了。即使程序变得更为复杂，也无法摆脱使用26个英文字母和10个阿拉伯数字的组合。只要利用程序算法将字符与背景分离，数据库就可以逐渐学会识别。

与此同时，一套包含大量中文字符的中文验证码也随之出现。辨认相似结构的汉字、为汉字标注拼音，以及按顺序点击打乱的成语成为了中文验证码的常见操作。

随着发展的推进，验证码的形式变得愈发多样，涵盖了图像和文本，甚至需要进行阅读理解。

这些多样化的形式让计算机的识别技术不断增强。

但越来越难的验证码却对人类进行了限制，首先，他每次出现并不都是万无一失的，有时候显示出来的也会出错，甚至在整个图形当中，并没有正确答案。其次，它们会耗费大量用户的宝贵时间，给用户带来困扰。第三，验证码也会经常出现无厘头的内容，比如放大镜贴在公交车上，它算作公交车吗？交通信号灯杆底部被剪裁的照片算不算交通信号灯？是红绿灯吗？高架人行横道算桥吗？

但现在的研究显示，目前的机器人似乎比人类更擅长绕过验证码的操作。现在重新回到验证码设计之初的原点，你认为验证码是在防恶意程序，还是在防止人类使用？

近日加利福尼亚大学欧文分校研究人员对1400名受试者进行了多种类型的验证码测试。他们发现，机器人不仅在图像识别、拼图滑块和扭曲文字等多种形式的验证码上表现更出色，而且速度更快。

他们认为这就像是一场猫捉老鼠的游戏。题为《现代验证码的实证研究与评估》的论文的作者Andrew Searles指出："验证码的复杂性和多样性都在不断发展，""机器人（机器）和人类都越来越难以解决"。该研究已发布在arXiv预印本服务器上。

"但随着计算机视觉和机器学习的进步，机器人在识别扭曲文字方面的能力大大提高，准确率超过99%......而且，机器人常常将验证码的解决外包给验证码农场，类似于血汗工厂的操作，人类获得报酬来解决验证码。（这里是不是有一种机器人统治人类的感觉？）

在研究中，研究人员发现机器人解决扭曲文字验证码的正确率接近100%。而人类的正确率在50%到84%之间。人类需要长达15秒的时间来解决这些难题，而机器人则在不到一秒钟内就能解决。

论文的另一位作者Gene Tsudik表示："我们确实可以确定，[这些测试]并不受欢迎。" 这个结论无需研究也能得出。然而，人们或许不清楚每天、每年、每月为解决验证码问题所花费的努力，以及为了解决验证码问题而在全球投入的巨大精力，是否真的值得。

机器人在其他类型的验证码测试中也表现出色，但在基于图像的测试中稍显吃力，无论是准确率还是速度方面都略低于人类。（请找到上图当中微笑的狗狗！找到的请举手。）

Gene Tsudik表示："现在已经没有简单的方法可以通过这些小小的图像挑战或其他手段来区分人类和机器人了。" 相反，他建议利用人工智能的进步来设计 "智能算法"，以更好地区分机器人的活动和人类的输入。

点「在看」的人都变好看了哦！