草根影响力新视野  编译 钟艺

来源 https://www.livescience.com

QRC

当你登录邮箱、购物平台、电子银行时,常常会遇到要输入验证码。对于会涉及用户个人信息的网站来说,验证码是他们一道有利的防火墙,能在很大程度上阻拦机器人对用户信息的窃取。不少网站为了防止非法分子利用机器人自动注册、登录、灌水,核查登录用户是否为真人,都采用了验证码技术。

但正所谓“道高一尺魔高壹丈”,近日一项研究结果显示,机器人已经可以破解验证码,连人眼有时都难以识别的验证码,比如变形的文字、隐藏的数字等,对于机器人来说不再是件难事。人工智能创业公司Vicarious作为这项技术的发明人说:“虽然从结果上来看,这项技术可能并不是一件多么了不起的事情。但是从人工智能的整体发展来说,想要把人工智能普及化,必定要实现人工智能在少量数据中也能成功运转的目标,从这个意义上讲,机器人破解验证码这件事就意义非凡。”

QRC2

文本样式的验证码都是被扭曲过的,对于机器来说,它们要识别这些字符需要花费比人类多N倍的时间。尽管之前就已经有识别这些复杂字符的机器存在,但是它们必须要接受数以百计的图像学习和训练后才能实现识别功能。

而对于Vicarious来说,它只需要提前进行几百个实例的学习和识别就能处理多种不同扭曲方式的文本验证码,除此以外,它也能被用作识别手写文本、照片中的文本等。Vicarious为何能高效的进行学习?原因是它采用了递归皮层网络的学习方式。递归皮层网络就像是一栋建筑的脚手架,其核心是仿真人脑基于形状对物体进行辨别的机制开发出壹种新型算法,它让人工智能不是从表面事实的呈现来总结推演出下一个可能的结果,而是从思维结构出发来进行计算,从而让计算机同样能够基于形状来识别物体。

目前,Vicarious开发团队测试了来自领先验证码供应商reCAPTCHA和Bot Detect的文本类的验证码系统,雅虎和PayPal均是这套验证码系统的使用者,结果显示,Vicarious破解的成功率在57%到67%左右。 Vicarious的开发团队表示,人们认为,文本类验证码被机器破解的成功可能性最多为1%。而现在Vicarious的表现已经远远超过了这个数字。

现在许多网站已经不再使用文本验证码,而是使用基于图像验证码或鼠标移动验证码。但研究人员表示,这将不会对基于递归皮层网络的人工智能造成阻碍。因为递归皮层网络对数据的利用效率是现有深度学习算法的300倍,超过以往很多优秀的验证码破解算法,而且通用性更强。

毫无疑问,Vicarious是人工智能领域继目前流行的深度学习算法之后的又一进步。他的出现也告诉人们,结合认知科学和神经科学原理才能开发出更多像人类一样拥有强大学习认知能力的机器学习算法。