小议验证码的安全性及如何绕过

什么是验证码？

CAPTCHA是(全自动区分计算机和人类的图灵测试)的简称，是用于区分计算机和人类的一种程序算法，这种程序必须能生成并评价人类能很容易通过但计算机却通不过的测试。

像我们平时最常遇到的，就是基于图片的验证码。这类图片验证码通常包含的，都是些易于用户识别简单的验证信息。如下图所示。用户必须准确的识别图像内的字符，并以此作为人机验证的答案，方可通过验证码的人机测试。相反如果验证码填写错误，那么验证码字符将会自动刷新并更换一组新的验证字符，直到用户能够填写正确的验证字符为止。

验证码的重要性：

防止与认证相关的攻击行为：

以下列举的是一些较易受到暴力攻击的点。例如：

登录：一旦缺少验证码的保护，攻击者则很可能通过暴力破解的方式非法接管用户账户。
忘记密码：如果网络应用程序使用详细消息响应帐户存在或不存在，那么攻击者则可以进行用户名的枚举。
注册：程序批量创建垃圾账户。此外还可以进行用户名的枚举。（正常情况下没有应用程序会允许用户，同时注册两个相同用户名的账号）

避免垃圾邮件和DOS：

我们知道很多网站都有提交表单的功能，并需要由站点管理员审核通过。例如：会员申请，联系我们，反馈表，调查表等。这些功能都需要验证码的保护，如果不加以防护那么将会导致以下情况的出现：

大量的垃圾表单可能产生，不仅会影响网站的访问速度，还会加大站点管理员的工作量，而且一些合法用户的请求，也可能会因此被拒绝。
电子邮件轰炸：一些功能可以发送电子邮件到一个任意的邮件地址。如果没有得到有效的验证保护，那么恶意攻击者则可以利用程序，向特定的目标发送大量的垃圾邮件。

保护数据挖掘机器人：

某些包含大量数据的站点极易遭受数据挖掘攻击，因此它们也需要验证码的保护。例如：社交网络和搜索引擎。

验证码为什么能被绕过？

验证码被绕过，有以下两个原因：

设计问题
执行问题

在以下的内容，我将会带大家认识到这两个问题所在。以及如何解决这些问题，建立更为安全的人机验证。

设计问题

设计问题则意味着验证码本质上的脆弱性，但执行却不存在问题。以下演示将有助于我们了解设计问题的真正原因，以及如何破解它：

设计问题＃1：

以下的示例中我们可以看到，这里的验证码就是一道数学运题。而这里的问题就出在页面的HTML源码上。

你可以在Github上下载到该验证码的源码：https://github.com/securelayer7/Captch-Bypass-Vulnerable-Script/tree/master/ArithmeticCAPTCHA

如何破解？

在这种情况下攻击者往往都会通过获取该页面的HTML源码，计算答案并提交HTTP响应来破解验证码。

你可以在Github上下载到该利用代码：https://github.com/securelayer7/Captch-Bypass-Vulnerable-Script/tree/master/CaptchaExploits

设计问题＃2：

某些验证码可能会采用相对有限的问题数据库。例如以下是一个基于图片的验证码，很显然这里不能再利用上面提到的破解方案来破解。但这里的问题出在，这里的图片验证码字符是固定并且有限的，在本例中该验证码只会在来回10个固定字符组合中更换。因此一旦掌握了它的问题数据库，那么破解也自然就不成问题了。

你可以在Github上下载到该验证码的源码：https://github.com/securelayer7/Captch-Bypass-Vulnerable-Script/tree/master/TenRepeatedCAPTCHA

如何破解？

攻击者首先必须手动解决这10个验证码问题，并同时记录下这些问题的答案。然后通过工具将这些问题的答案存放在自己的数据库中，进行不断的暴力攻击尝试即可。

你可以在Github上下载到该利用代码：https://github.com/securelayer7/Captch-Bypass-Vulnerable-Script/tree/master/CaptchaExploits

执行问题：

执行问题则意味着验证码由于执行不力而可被破解，但从设计的角度来看是完美的。

以下示范将有助于我们了解，执行问题的真正含义以及如何破解它：

执行问题＃1：

在演示中，我们正在使用Google reCAPTCHA人机验证。我们使用API将用户解决的CAPTCHA响应发送给Google的端点。更多请点击：https://www.google.com/recaptcha/intro/index.html?。API以JSON的输出形式回复请求，以及HTTP状态码。到现在为止，还没发现什么问题！！

但是执行问题也就出在这里。开发人员无法检查JSON响应，而以检查发送的HTTP状态码是否为200 OK，作为验证码正确与否的判断依据。