DoNews 9月3日消息(记者 刘文轩)为了保护隐私,很多用户已经开始将追踪阻止插件、VPN等产品和服务作为必备工具,不过有时候,第三方在不使用追踪器的情况下也能精准追踪用户。Firefox浏览器开发商、非营利组织Mozilla的一项研究指出,只要通过分析用户的浏览历史记录,就能以独特的网页浏览习惯辨认出用户,让广告商能够创建精确的个人资料,向用户推送精准广告。
类似的研究曾在2012年进行过,但随着技术发展,2020年已经可以达到精确追踪用户的程度。Mozilla研究人员复制并扩展2012年的一篇论文,并在2020安全会议Usenix上发表研究成果。
在之前的研究中,研究人员预先列出了6000个网站,并且使用特殊的CSS程式码,追踪441627个不同的受试者,各造访过这6000个网站中的哪些网站,并为每个使用者建立一个专有的网站浏览历史记录列表。
研究人员发现,其中有97%的用户,拥有唯一的浏览历史记录,这便可作为用户指纹,提供第三方进行辨识。当研究人员要求这些用户再次存取测试网站,只要查看使用者在50个网站的浏览记录,就能辨识出38%的用户,分析到500个网站,就能将辨识准确度提高到70%。
Mozilla的研究人员在2019年7月开始新一轮实验,有超过52000名Firefox用户自愿参加,由于这次的浏览历史资料直接从Firefox收集,相比过去的CSS方法更加可靠,而且研究人员收集的这些资料,与线上广告、移动应用和数据分析厂商收集的资料大致相同。
也就是说,Mozilla研究人员如果能够从这些资料辨识出用户,那么第三方也可以做到同样的事。
实验总共进行两个星期,受试者先于第一个星期,向Mozilla分享浏览历史记录,并会在第二个星期,再次与Mozilla共享资料,研究人员将尝试依据第一星期的资料,辨识出用户。根据两周收集的资料,研究人员收集了约66万个不同的网站的浏览资料,共有3500万次网站存取数据,发现这些受试者中有48919名具有唯一的浏览配置资料,也就是有99%是唯一的。
即便只追踪前100名的网站,用户的浏览模式仍然维持高度的唯一性。研究人员指出,只要用户在资料收集期间,曾访问过50个或以上唯一地址的网站,光追踪前1万个网站,大约就可以辨识出50%的用户,当用户浏览越多网站,辨识度就越高,当用户浏览超过150个不同的网站,研究人员将可以辨识出80%的用户。研究人员警告,无数的第三方已经通过收集用户的浏览历史资料,将其作为唯一辨识指纹来识别使用者。