Google早在2009年就收购了广泛使用的reCAPTCHA工具。加州大学于2023年进行的一项研究《关于reCAPTCHAv2的大规模真实用户研究》得出结论,验证码不仅在实际阻止机器人流量方面效果不佳,还通过追蹤cookie引发隐私问题,浪费了我们大家总计数十亿小时的时间,并且为Google生成了价值近万亿美元的数据。

该研究聚焦于通过Google reCAPTCHAv2在现实中最常见的两种验证码形式:「隐形」或基于行为的验证码,当你勾选「我不是机器人」框时,甚至在你浏览网站时,它会暗中分析你的输入;还有基于图像的验证码,你需要从Google街景获取的图片中选择所有摩托车、交通信号灯之类的内容。

这两种验证码对Google都很有价值,前者生成的追蹤cookie可能有助于广告定向投放,而后者则可用于Google内部的人工智慧模型训练,或者出售给其他公司。

无意义的验证码

这项实验并未告知实验对象,而是将Google的reCAPTCHAv2添加到该大学内部学生帐户系统的帐户创建和密码找回功能中,研究人员既测量完成验证码所需的时间,又对这项为期13个月的研究中的3600名用户进行抽样调查,了解他们的体验。不出所料,当涉及到更複杂的图像识别验证码时,用户花费的时间更多,反应也多为负面。该研究还指出,完成时间会因学科、经验以及是创建帐户还是找回帐户而有所不同。

研究人员算出图像和行为验证码的平均完成时间为3.53秒,并将其与2010年至2023年间网际网路上完成的5120亿个reCAPTCHAv1和v2验证码的低端估计数相乘,得出了以下关于验证码对我们生活影响的估算结果: