EN

黑特·史德耶尔 | 数据之海:数据真理妄想与(错误)模式识别

时间: 2021.8.12

这是来自斯诺登档案中的一份图像。它被称为“秘密”[secret]。【1】不过,上面什么也看不到。这恰恰是不正常的征兆。

看不到任何可以辨识的东西是新常态[the new normal]。信息由一组人类感官无法识别的信号[signals]传递。当代的感知在很大程度上由机械操控。人类视觉的光谱只能覆盖其中极小的一部分。由机器编码并且只有机器才能识别的电荷、无线电波、光脉冲,以近乎亚光速的速度穿梭而过。眼睛观测[seeing]被计算概率[calculating probabilities]所取代。视力丧失了重要性,取而代之的是过滤机制[filtering]、解码[decrypting],以及模式识别[pattern recognition]。斯诺登的噪音图像可以代表人类对科技信号认知的普遍的无能为力,除非这些信号得到相应的处理和翻译。

但是噪声[noise]并不意味着什么也没有。相反,噪声事关重大,不仅仅对美国国家安全局NSA[National Security Agency]如此,对于机械超控的感知模式整体而言亦然。

《信号还是噪声》[Signal v.Noise]是2011-2012年期间NSA内网上一个专栏的名称。它言简意赅地框定了NSA的主要问题:如何从“海量的数据中提取信息”:

这和数据无关,甚至和获取数据也无关。它和从海量的数据中找到信息有关……研发者们,拜托伸出援手!我们在数据之海中快淹死了(不是沉浮)——数据,到处是数据,但是没有一滴信息。【2】

分析师们倍感压力。他们需要对这些“海量的数据”进行整理、过滤、解密、提炼以及加工处理。问题的焦点不再是获得[acquisition],而是辨识[discerning],从不足变成过量,从加法变成过滤,从研究变成模式识别。就连维基解密[WikiLeaks]的朱利安·阿桑奇[Julian Assange]也声称:“我们淹没在资料之中。”【3】

 

一、数据真理妄想

不过,让我们回到开篇提到的图像。上面的噪声实际上被英国政府通讯总部GCHQ[Britain Government Communications Headquarters]的技术人员解密了:它显示的是一幅天空中的云层图。英国的分析师们至少从2008年开始就一直在入侵来自以色列无人机的视频资料[video feeds],包括最近以色列国防军[IDF]对加沙地带的一系列空袭。【4】但是斯诺登档案上没有岀现这些空袭的图像。相反,档案里面截获和窃听到的广播资料均被抽象处理成各种各样的噪声、线条及颜电模块。【5】已被泄漏的训练手册显示,这类图像需要使用各种高度机密的操作制造出来。【6】

不过,让我告诉你吧:我会破译这个图像,并且不会使用任何秘密算法。相应,我将会使用一种秘密的忍者术。我甚至还会免费教会你如何使用它。下面请务必聚精会神地盯着这个图像。

它看上去像不像夕阳下波光粼粼的水面?也许这就是“数据之海”本身?大量的水,来势汹汹,可以淹死我们的那种?你能看到水波曾经轻微地移动过吗?

我正在使用一个很好的老方法,它叫数据真理妄想[Apophenia]。

数据真理妄想被定义为在随机数据中发现一些模式。【7】最常见的那些例子是人们在云朵或者月亮上看到人脸。本杰明·布拉顿[Benjamin Bratton]不久前这样定义数据真理妄想:即“从一些除了在感知层面具有不可否认的同时性、而实际上没有直接联系的资源中建立一些联系并且得岀一些结论。”【8】

我们不得不假定有时候分析师们也在使用数据真理妄想。

一定有人曾经在一片云中看到过阿玛尼·阿尔-纳萨斯拉[Amani al-Nasasra]的那张脸。四十三岁的她在2012年以色列对加沙的空袭中双目失明,当时她坐在自家的电视机前:

我们当时在家里看电视新闻。我丈夫说他想要睡觉,但是我想熬夜看半岛电视台[AlJazeera],看看有没有任何要停火的新闻。我记得的最后一件事,是我丈夫问我是否换台了,我回答是的。当炸弹落下的时候,我什么也没感觉到——我失去了意识。直到上了救护车后,我才醒过来。”阿玛尼遭受二度烧伤,几乎完全失明。【9】

什么样的“信号”从什么样的“噪声”中被提取,来表明阿尔-纳萨斯拉是一位合理的攻击目标[legitimate target]?哪些脸会出现在哪些屏幕上,为什么?换言之,谁是“信号”,谁又是可以任由处置的“噪声”?

 

二、模式识别

雅克·朗西埃讲述了一个神话故事,说的是信号和噪声的区分也许在古希腊就实现了。当地富裕的男性所发出的声音被定义为言语[speech],而那些女性、孩童、奴隶,以及外邦人则被认为是混乱噪声的制造者。言语和噪声的区分,提供了某种政治垃圾过滤器[spam filter]。那些被认定为可以发言的人拥有了公民的标签,而其余的人则被认定为无关紧要、没有理性、并且还潜伏一定危险的异体。与之类似,当下对信号和噪声区分是一个根本性的政治问题。模式识别同广义的政治识别[political recognition]休戚相关。谁在政治层面上被识别,作为什么被识别?作为一个主体?作为一个人?作为人口的一种合理类别?或者也许是作为“脏数据"[dirty data]?

什么是脏数据?下面是一个例子:

沙利文[Sullivan],来自博思·艾伦咨询公司[Booz Allen],举了一个例子,当时他的团队正在为一家豪华连锁酒店分析顾客的人口统计信息,偶然发现数据显示来自一个富裕的中东国家的青少年是酒店的常客。

“有一整组的十七岁少年待在全世界各地的连锁店中”,沙利文说道。“我们想,‘’这不可能是真的。’”【11】

这些人口统计资料被认为是混乱又无价值的一系列信息,即可以置之不理的脏数据,直到后来有人发现它实际上千真万确。

在这种世界观看来,棕色皮肤的少年,很有可能是存在的。比如,死去的棕色少年?为什么不呢?但是有钱的棕色少年?这太不可思议,以至于他们被当作脏数据,得从你的系统中清除掉!这种将噪声和信号区分开来的操作模式同朗西埃所说的用来分派公民身份、合理性以及特权的政治噪声过滤器[political noise filter]并无本质区别。富裕的棕色少年看上去就像希腊城邦中发言的奴隶和女性一样不太可能。

另一方面,脏数据也成了对某种悄无声息的抗拒的缓存——对统计和测量的拒绝:

研究公司Verve在一项针对2400名英国消费者的调查中发现,60%的人在网上提交个人资料时会故意提供虚假信息。例如,将近四分之一(23%)的入说他们有时候会提供错误的出生日期,9%的人说他们大多数时间会这么做,说总是这么做的人占5%。【12】

我们拒绝填写那些无休无止的在线表格,这些拒绝逐渐累积起来就是脏数据。只要可能的话,所有人随时都在撒谎,或者至少会偷工减料。毫不奇怪,数据收集“最脏”的领域始终是卫生部门,特别是在美国。医护人员尤其被指错误填写各种表格。看来,医护人员对填写那些设计出来取代他们的系统的表格很不感冒,这正如消费者们的态度,他们对那些用垃圾邮件回报他们的企业的表格不会太热情。

在《规则的乌托邦》[The Utopia of Rules]一书中,大卫·格雷伯[David Graeber]举了一个极其感人的例子,与强幻提取数据有关。他母亲中风以后,他不得不为她申请医疗补助[Medicaid],这个过程可谓煎熬:

我不得不花一个多月的时间……用来处理纽约机动车辆管理局的某位匿名的办事员之前把我的名字写成"Daid”所产生的连带后果,更不必说那位威瑞森[Verizon]的职员把我的姓拼写成"Grueber"。官僚机构,无论公私,也不论出于什么样的历史原因,似乎是这样组织工作的:即确保机构中相当一部分人员无法胜任他们的工作,无法执行预期的任务。【13】

格雷伯进一步地把这种现象称为乌托邦思维[utopianthinking]的一个例子。官僚主义是基于乌托邦思维的,因为它从自身的角度岀发,假定人皆完美。格雷伯的母亲在被医疗补助方案接纳之前就去世了。

无休无止地填写那些完全无意义的表格是一种新形式的家务劳动[domestic labor],因为它根本不被视作劳动,并且被认为是劳动者“自愿”提供或者是由那些低收入的所谓数据管理员[data janitors]从事的劳动。【14】然而所有这些看上去迅捷而无形的算法,以及它们对一切事物优雅的最佳化[optimization]和它们对模式和非常态[anomalies]的识别,都是基于那些无休止并且毫无意义的劳动:提供或者修缮混乱的数据。

简单地说,脏数据是真实的数据,正因为它们把真正的个人和官僚机构的斗争记录在案,后者利用了数字技术的不均衡分配和使用来剥削前者。【15】我们来看看位于柏林的LaGeSo卫生和社会事务办公室[the Health and Social Affairs Office]:那里的难民们每天冒着生病的风险在寒冬里一连数小时甚至数天地在室外排队,只是为了登记他们的数据然后获得应该享有的服务(例如获得购买食物的钞票)。【16】这些人被视为非常态,因为姑且不论他们有胆量来到这里,他们居然要求自己的权利得到尊重。这里有着一个类似的政治算法在起作用:有些人被隐去了。他们甚至到不了被识别为社保金申领人那一步。他们根本就被忽略不计了。

另一方面,数字技术也承诺会把不同类别的难民区分开来。IBM的沃森人工智能系统[Watson Al system]已投入实验,为的是把伪装成难民的恐怖分子识别出来:

IBM希望向人们展示,i2 EIA软件系统可以将狼和羊区别开来:也就是说,把大多数无恶意的寻求庇护者和少数对自己身份撒谎的人区分开来……

IBM假设了一个情境,把几个不同的数据源合并在一起,以便匹配一个虚构的持护照难民的名单。也许最重要的数据集[dataset]是一个冲突中的伤亡人员的名单,来自公开的媒体报道以及其他渠道。这其中有些材料来自暗网[the Dark Web],是与倒卖护照的黑市相关的数据;IBM说,他们在该数据集中隐匿或者模糊了可识别个人的信息……

博勒纳[Borene]曾经说,该系统能够提供评分,指明某位虚拟寻求庇护者的自我陈述具有多大可能性,并且可以相当迅速地完成这个测试以便有助于海关人员或者执勤警察。【17】

各种非官方数据库,包括暗网资源的交叉引用[Cross-referencing],被用来生产一个“评分”[score],计算出一个难民可能是恐怖分子的概率。通过各种不同数据集的协同,他们希望得出一种模式,但并没有校验它们是如何(或者是否)同任何的事实相符。这个例子实际上是一个巨大的“评分”系统的一个子集:信用评分、学术排名评分、对网络论坛上互动情况的评分排名,等等,这些评分把人们进行分类,其根据是各种财务互动情况、网上行为、市场数据,以及其他资源。输入的各种资料都被简化为一个单数——一个超级模式[superpattern]——它可以是一个对“威胁程度”的评分或者是一个“社会诚信评分”[social sincerity score],就像当局计划在下一个十年内为每一个公民量身定做的那样。但是这些输入参数[input parameters]远非透明,也难以验证。虽然把那些伪装成难民的伊斯兰国间谍[Daeshmoles]识别出来是一个让人满意的严肃之举,但是一个相似的系统似乎也存在着一些令人担忧的缺陷。

NSA的天网程序[SKYNET]通过在巴基斯坦筛选手机用户的元数据的方法来找到恐怖分子。但是专家们批评NSA的方法。人权数据分析组织[the Human Rights Data Analysis Group]的数据科学家和研究主管帕特里克·鲍尔[Patrick Ball]对科技网站[Ars Technica]指岀:"可以被用来训练并测试这种模型的’已知的恐怖分子’数量极少。如果他们训练模型时使用的数据与实际测试时的相同,那么他们的拟合性评估[assessment of the fit]就完全狗屁不如。"【18】

人权数据分析组织估计,也许有大约99000名巴基斯坦人曾经被天网错误地归类,这种统计误差也许已经产生了致命的后果,因为美国正在对这个国家的疑似武装分子[suspected miltants]发动无人机战争,据估计从2004年开始共有2500到4000人被杀死:“在随后的几年里,也许数以千计的巴基斯坦无辜平民被那种’无科学依据’的算法错误地贴上了恐怖分子的标签,他们的下场便是过早地死于非命。”【19】

需要特别强调,我们无法对天网的操作进行客观的评估,因为我们不知道它的结果是如何被使用的。几乎可以肯定,它并不是决定无人机攻击对象的唯一因素。【20】但是天网的例子也是清晰地表明,一个通过评估相互关系和计算概专项提取的“信号”和实际的事实并非是一回事,决定它缺用于训练软件而输入的那些资料和用于过滤、关联以及“识别”的那些参数。“废物进废物出”[crap in-crap out]这一老工程师的智慧似乎依然管用。尽管它们在技术上、地理上、还有伦理上完全不同,所有这些案例都用到了某种模式识别的版本,根据政治以及社会参数对人群们进行分类。有时候简单到这种程度:我们尽量避免登记难民。有时候会有更多让人云里雾里的数学上的术语[mathematical mumbo jumbo]牵涉其中。但是许多被使用的方法都模糊、带有偏见、排外,并且有时候——正如一位专家指岀——“荒唐地乐观”。【21】

 

三、公司式泛灵论

在纯粹的噪声中如何识别出点什么?谷歌实验室最近展示了一个纯粹并有意为之的数据真理妄想的视觉例子,令人震惊:【22】

我们训练一个人工神经网络,通过向其展示数以百万计的训练样本,并且逐渐地调配网络参数直至它给出我们想要的分类。该网络通常由10-30个人工神经元叠层组成。每一个图像都进入输入层,然后与下一层交谈,直至抵达最终的“输出”层。这个神经网络的"答案"来自这个最终的输出层。【23】

那些神经网络被训练去辨别边缘、形状,以及许多物体和动物,然后是纯粹噪点。它们最后“识别”一大群彩虹颜色的、无实体的分形眼睛[disembodied fractal eyes],绝大多数都没有眼睑,一刻不停地监控着它们的观众,触目惊心地展不对模式有意地过度识别。

谷歌的研究者们把这种无中生有地创造一个模式或者图像的行为称为噪声的“图像植入”[inceptionism]或者“深梦”[deepdreaming]。

但是这些实体绝不仅仅是幻觉。如果它们是梦,那么那些梦可以被解释成当下科技部署[technological disposition]的浓缩或者位移[condensations or displacements]。它们显小了计算机图像创造的网络化操作、某些机械视觉[machinic vision]的预置,以及强硬的意识形态和偏好[hardwired ideologies and preferences]。

视觉化呈现所发生之事的办法之一是反过来让网络对所输入的图像进行某种改善,以求得出某种特定的解释。比如说,你想要知道什么样的图像会以"香蕉”呈现。从一个充满随机噪声的图像开始,然后逐渐朝着神经网络认为是香蕉的图像转变。它并不能很好地单独进行工作,除非我们事先强加了一个约束[priorconstraint]:即该图像应该和自然图像有着相似的数据,例如对相邻像素进行相关化处理。【24】

在一项天才的壮举中,图像植入从视觉上呈现了那些产销者网络的无意识[the unconscious of prosumer networks]:那些监控用户的图像,时刻记录他们的眼球运动、行为、偏好,审美上如此无助,在仿制的汉德瓦萨[Hundertwasser]马克杯和装饰艺术[ArtDeco]的饰带之冋让人抓狂地无则乱窜。瓦尔特·本雅明的“视觉无意识”[optical unconscious]已经被升级为数字图像占卜[computational image divination]的无意识。【25】

通过“识别”并非给定的事物和模式,图像植入的神经网络实际上认岀了一种新的美学和社会关系整体。一些预置[presets]和刻板印象[stereotypes]被使用,不管它们是否真的合适:“结果令人乍舌至——甚至一个相对简单的神经网络都能够被用来过度阐释一个图像,就像当我们还是孩子的时候,喜欢观看那些云朵并把它们解释成任意的形状。”【26】

但是图像植入并非只是一种数字幻觉[digital hallucination]。它是一个时代的文档一这个时代会训练智能手机去识别小猫——因而它确实把一些吓人的\矫造的术语整合为生产方式。【27】它展示了公司式泛灵论[Corporate Animism]的一个版本,其中商品不仅仅作为所拜之物[fetishes]存在,还转化成拥有特权的妄想怪兽[franchised chimeras]。

然而,这些都是深刻的现实主义再现[representations]按照捷尔吉·卢卡奇的理论,“古典现实主义"[classical realism]创造“典型人物”[typical characters],只要它们再现了我们时代客观的社会(在本例中是科技)力量。【28】

图像植入做到了这一点,甚至更多。它还赋予这些力量一张脸——更加准确地说,无数的眼睛。那个从你装着通心面和肉丸子的盘子里凝视着你的生物不是一只两栖的比格犬(图3)。它是网络化图像制作无处不在的监控,一种通过模因(网络段子)改进过的智能[mimetically modified intelligence],它以午餐的形式观察你,这份午餐你马上就会照下来,分享到Instagram上,假如它不先攻击你的话。想象一下,一个由各种被奴役的物体所组成的世界,充满悔恨地审视着你。你的汽车、游艇、艺术收藏品用一种阴郁的、彻底绝望的表情观察着你。你可以拥有我们,它们似乎在说,但是我们要揭发你。猜猜,在你身上我们会识别出怎样的生物!【29】

 

四、数据新石器时代[Data Neolithic]

但是,我们怎么来理解这种自动化的数据真理妄想?”【30】我们应该假定机器知觉[machinic perception]已经进入到独立的巫术思维[magical thinking]阶段了吗?难道商品魅惑[commodity enchantment]在如今的意味就是:让人产生幻觉的产品?也许更加准确的是假定人类已经进入了巫术思维的另一个崭新阶段。令人惊奇的是,用来区分信号和噪声的词汇充满了田园色彩[pastoral]:数据“耕作”[farming]、“收割”[harvesting]、“釆矿'[mining],以及“釆掘”[extraction]这样的词汇大受欢迎,仿佛我们的生活刚经历了另一场大规模的新石器革命,【31】刘这场革命有自己的巫术。

各种在新石器时代发展起来的农业和采矿业的技术,正在被重新发明出来,使用在数据身上。过去的石头和矿石被硅和稀土矿物所取代,而沙盒游戏“我的世界”[Minecraft]的提取范式描述了把矿物加工为信息架构元素[elements of information architecture]的过程。【32】

模式识别当时也是新石器时代各种科技的一项重要资产。它标记着从巫术思维方式到更加注重经验的思维模式的转变。通过观察时间的模式而发展出历法,使灌溉和农业安排变得更加有效。对谷物的储存,创造了财产的概念。这期间还发端了制度化的宗教和官僚机构,同样产生了包括法律和登记制度在内的管理技术。所有这些创新同时也影响着社会:狩猎者和采集者的队伍被农业国王和奴隶主所取代。新石器革命不仅具有科技意义,同时也造成了重大的社会后果。

今天,经由数据路径[data trails]反映岀的各种生命表达,变成了一种可以耕种、可以收割、可以开采的资源,由信息生命政治[informational biopolitics]经营管理。【33】

假如你怀疑这是否真是另一个巫术思维的时代,只要看看NSA为了解读那些无人机窃取到的图像的训练手册就可以了。正如你所见,你需要用一个魔法棒来对那些文件施法。(“图像魔法”[Image Magick]是免费的图像转换器,:

从这些科技中生发的各种所谓的新统治形式,看上去有几分陈旧,又有几分迷信色彩。什么样的公司/国家实体是基于数据储存、图像解读、高频贸易,以及伊斯兰国外汇博弈[Daesh Forex gaming]的?当代社会对应于农业国王和奴隶主的是什么人,现存的社会等级制是如何进一步极端化的?例子千差万别,如:科技产业带来的都市市绅化[tech-related gentrification]以及圣战分子网络论坛游戏化。模式识别和大数据占卜的世界同当代杂乱的寡头政治[oligocracies]、巨魔农场[trollfarms]、黑客雇佣军[mercenary hackers]、支撑机器统治[bot governance]并使其可能的数据强盗大亨们[data robber barons]、哈里发标题党[Khelifah clickbait],以及多态代理战争[polymorphous proxy warfare]有何关联?这种在深层思维[Deep Mind]、深度学习[Deep Learning]和(谷歌)深梦时代的国家,是一种深国[DeepStateTM](影子政府)吗?在此国度,是否还有力量或者恰当的程序来抵抗以算法为准的法令和占卜?

但是,在原来的新石器时代和当下的“新石器时代”之间,还存在着另一个差别,这还要追溯到模式识别这一点上。在古代的天文学里面,星座是通过把动物形象投射到天空的一种想象。在宇宙的韵律[cosmic rhythms]和轨迹[trajectories]被记录在泥板[clay tablets]上之后,各种有关运动的模式开始岀现。作为新增的定位点,人们把一些星群与动物和天神[heavenly beings]联系起来。然而,天文学和数学之所以取得进展,不是因为人们还相信天上有动物或者诸神,而是因为他们认定了星座是一种物理逻辑的表达。那些模式是(想象的)投射[projections],不是事实。今天的统计学者和其他专家们自始自终都承认他们的调查结果大多是概率性的投射[probabilistic projections],但是各类政策制定者都图方便,忽视了这一点。实践中,你和你自己所投射的数据星座[data-constellation]共生。各种各样的社会评分[social scores]——信用评分、学业评分、威胁等级评分——还有商业和军事中对生命模式[pattern-of-life]的各种观察结果,影响着真实的人的现实生活,通过等级化、过滤和归类的方式使社会阶层既得以重组,又被激进化。

 

五“格式塔"完形现实主义[Gestalt Realism]

让我们假定,我们实际上正在处理的问题就是投射。一旦人们承认来自机器感知的那些模式和实际情况不一样,那么就肯定可以获得具有一定精确性的信息。

让我们再看看阿玛尼·阿尔-纳萨斯拉,那个在加沙的一次空袭中致盲的女人。我们知道:那些抽象图像,它们被英国间谍记录为以色列国防军无人飞机截获的情报,并没有显示2012年那次让她失明的对加沙的空袭。日期对不上。斯诺登档案中没有证据。没有这次空袭的任何图像,至少就我所知。我们所知道的就是她对人权观察组织[Human Rights Watch]所说的。她是这样说的:“我看不到了一从那次轰炸以后。我只能看到影子。”【34】

所以,解码这个图像还有另一个方法。每个人都看得很清楚。我们看到了阿玛尼无法看到的。

在这个案例中,噪声一定是她现在所“看到”虹个“纪录”:“阴影。”

这就是无人机战争的视觉无意识的一个纪录吗?来自它的那些可疑并保密的“模式识别”方法?如果是这样,我们还能不能找到某种方法能够“解密”(空袭后)一直与阿玛尼相伴的那些“影子”呢?

 [德]黑特·史德耶尔

刁俊春/译 

向在荣/校

【1】See https://www.documentcloud.org/documents/2699846-Anarchist-Training-m ad5-Redacted-Compat.hfmI

【2】“The SIGINT World Is Flat, Signal v Noise column,December 22,2011.

【3】Michael Sontheimer,“SPIEGEL Interview with Julian Assange:‘We Are Drowning in Materiali Spiegel Online July 20,2015

http://www.spiegel.de/international/world/spiegel-intervlew-with-wikileaks-head-fulian-assange-a-1044399.html

【4】Carc Currier and Henrik Moltke,“Spies in the Sky:Israeli Drone Feeds Hacked By British and Am erican Intelligence,”The Intercept, January 28,2016

https://theintercept.com/2016/01/28/israeli-drone-feeds-hacked-by-british-and-am erican-intelligence/

【5】同注4。这些图像中有许多现在成为劳拉·普瓦特拉斯在纽约惠特尼博物馆举办的杰出展览“天文噪音”的一部分。

【6】在有关如何解码这些资料的训练手册中,分析师们自豪地宣称他们使用了由剑桥大学研发的公开源软件入侵了天空电视[[sky Tv]。

【7】https://en.wikipedia.org/wiki/Apophenia

【8】Beniam in H.Brattan,Some Trace Effectsofthe Post-Anthropocene:On Acceleraionist Geopolitical Aesthetic. e-flux journal 46 (June 2013)

www.e-flux.com/journaI/some-trace-effects-of-the-post-anthropocene-on-accelerationist-geopolitical-aesthetics/

【9】“Israel:Gaza Airstrikes Violated Lawsof War,hrw.org,February12,2013.

https://www.hrw.org/news/2013/02/12/israel-gaza-airstrikes-violated-laws-war

【10】Jacques Rancire,“Ten Theses on Politics”,Theory & Event,Vol.5 No.3 (2001)“为了拒绝把一些政治主体纳入一个范畴——工人、女性,等等——传统上一直以来认为只要把他们定位于属于一个‘家庭内部’空间,一个区别于公共生活的空间,就足够了:来自这个空间的个体只能用呻吟或者哭喊来表达痛苦、饥饿或者愤怒,但是这些都不是真正的话语——用来表达共享的美感[shared aisthesis]。并且,这些范畴中的政治……已经涵盖了让那些看不到的事物具有可见性的努力;让那些听起来只是噪声的东西作为话语被倾听。”

【11】Verne Kopytoff, “ Big data’s dirty problem”, Fortune, June 30, 2014

【12】Larisa Bedgood “A Hafloween Special:Tales from the Dirty Data Crypt” relevategroup.cam,October 30,2015.文章继续写道:1991年的六月下旬和七月上旬,全国范围内有一千两百万人(主要来自巴尔的摩、华盛顿、匹兹堡、旧金山,以及洛杉矶)失去了电话服务功能,原因是控制那些调节电话流量的信号的软件出现了一个打字错误[typagraphicaI error]。一位员工把一个D打成了6。那些电话公司从根本上失去了对它们网络的所有控制。”

【13】David Graeber,The Utopia of Rules:On Technology, Stupidity and the Secret Joys of Bureaucracy, Melville House,2015,P.48.

【14】Steve Lohr,“For Big-Data Scientists,‘Janitor Work Is Key Hurdle to Insights New york Times,August 17 2014

【15】See“E-Verify: The Disparate Impact of Automated Matching Programs”,chap 2 in the report Civil Rights, Big Data, and Our Algorthmic Future, bigdata fairness io, September 2014.

【16】See MeIissa Eddy and Katarina Johannsen,“ Migrants Arriving in Germany Face a Chaotic Reception in Berlin ,” New York Times, November 26, 2015.

【17】Patrick Tucker.“Refugee or Terrorist? IBM Thinks itsSoftware Hasthe Answer” Defense0ne,January27,2016.这个例子凯特·克劳福德[Kate Crawford]在她的精彩讲座幸免于监控”[Surviving Surveillance】中曾提到过,该讲座是作为提交惠特尼博物馆2016年2月29日专题研讨会“幸免于整体监控”的论文的一部分。

【18】Christian Grothoff and J.M .Porup. The NSA’s SKYNET Program may be killing thousands of innocent people,” Ars Technlea,February16,2016,原文为斜体。

【19】同前注。

【2O】Michael V.Hayden To Keep America Safe,Embrace Drone Warfare”,NewYork Times February 19 2016

【21】Grothoff and Porup,“The NSA's SKYNET program”

【22】感谢本·布拉顿指出这一点。

【23】Inceptionism:Going Deeper into Neural Networks, Google Research Blog, June 17t 2015.

【24】同注23。

【25】Walter Benjamin, “A Short History of Photography”, 可以在monosop.org上获得文本。

【26】“Inceptionism”.

【27】同前注。

【28】Farhad B. Idris, “Realism”, Encyclopedia of Literature and Politics: Censorship, Revolution, and Writing, Volume II: H-R, Westport, CT: Greenwood, p. 601.

【29】数据真理妄想是一种新形式的焦虑妄想[paranoia]吗?1989年弗雷德里克·詹明信[Frederic Jameson]宣称焦虑妄想是一种后现代叙事的文化模式,弥漫在政治无意识[the political unconscious]中。按照詹明信的说法,社会关系的总和[totality]无法在冷战想象的语境中得到文化再现——填充那些空白之处的是妄想[delusions]、推测[conjecture],还有那些带有共济会标志[Freemason logos]的怪诞情节。