Den 与 Ken 当作何感想?
从感情上说,Dennis 和 Ken 可能是为了偷懒才发明了 C,如今,AT&T 的后生们继承衣钵,摆弄出了一个 C 的变体,Hancock,用来挖掘数以G计的通话记录和 Internet 访问信息,目的是…监视。

老实说,Hancock 在 2001 年就成型了,只是最近才被挖据出来为世人知晓。ATT 每晚都用 Hancock 编写的软件分析成百上千万的长途电话通话记录,挖掘所谓的 communities of interest,比方说通话方组成的圈子。此前这种信息只有商业价值,不过,白痴都知道,911 之后,一切都变了。
FBI 也开始对 communities of interest 有兴趣了,他们要求电话公司提供此类信息,而且有法可依:USA PATRIOT Act。除了 ATT,Verizon 也在被要求的公司之列中。FBI 的兴趣可不光是谁和他们眼中的恐怖嫌疑人通了话,连那些与恐怖嫌疑人通过话的人通话的家伙也在监察之列。和 ATT 不同,可怜的 Verizon 没有这样的系统,也就交不了 FBI 的差,所以他们不得不给国会山里的某个委员会致信叫屈,FBI 的某些动作才因此曝光。ATT 不知是骄傲地还是尴尬地以一个“我早就做到了”的角色同时出现在公众视野里–他们甚至拥有与此相关的数据挖掘方法方面的专利哟。
和此前一些传统数据挖掘应用稍微不同的是,Hancock 编写的应用在数据进入数据仓库时即开始分析数据,传统方法倾向于在静态数据库上寻找模式。2004 年的 ACM Transactions on Programming Languages and Systems 有篇文章解释了 Hancock 如何从电话卡使用记录,长途电话,IP 地址和 Internet 流量数据,乃至手机移动从一个基站到另一个基站的物理位置移动中精挑细选或者千挑万选出精华来。此文章提到,ATT 的 Hancock 应用每天晚上分析的数据都达 9GB,有了 Hancock:
analysts could store sufficiently precise information to enable new applications previously thought to be infeasible
这件事当然也不是想像的那么邪恶,AT&T Research 网站上 Hancock 有代码和二进制可供下载,非商业应用免费,他们还提供了 instruction manual (链接为 PDF),包括示例程序。看上去 Hancock 很精炼,因为 Wired 文章中的示例程序只有 40 几行,就可以分析出用户访问了哪些 IP 地址(当然,针对的数据集是 ATT的,格式也是 ATT 的)。其他的示例程序还有,通过分析手机用户夜间使用的基站(此人停留处)和白天 ping 过的基站,勾勒此人的行动路线。
ATT 和 Verizon 目前正被指控,“罪状”是向 NSA 提供了数十亿条美国公民的电话记录,用于分析恐怖嫌疑人,或者实施未经授权的电话窃听。
如果你做的事情的恐怖分子一样坏,那即便打着追踪恐怖分子的由头又怎样?
[tags]hancock, att[/tags]
Comments
这些美国人…