文:汉儒.萨尔弥(Hannu Salmi)
第二章 数位历史学中的阅读和文本性
(前略)
用机器阅读
在现今快速变化的媒体世界中,「阅读」这个词实际上愈来愈多是用於技术设备上,而不是人。例如,扫描器中使用光学阅读器来捕捉视觉资讯,并将其转换成其他格式,以便在电脑上进一步详读。书籍封底上的条码包含有关产品的资讯,可以透过光学方式来读取,从而将这些资讯导入到另一个系统,以便在书店的发票上使用。这里的「读取」所指涉的,既是数据的解码,也是数据的转换。
前一章讨论中,许多数位化计画都利用了光学阅读的观念。光学字元辨识(OCR)是一种将图像转换为文本的技术,它已经产生了大量的数位语料库。其识别是基於字元的视觉特徵,其基本要素是它产生的文本是机器可读的,可以用电脑加以分析,这在类比形式中是不可能的。
实际上,OCR的历史背景与更传统的阅读,或寻找新的阅读途径之必要条件有关。早在二十世纪初期,就已经出现了一种技术需求,也就是能够将印刷文本转换成一种不需要透过人类眼睛的形式。一九一三年,艾德蒙.爱德华.福涅尔.达尔贝(Edmund Edward Fournier d’Albe)发展了一种光学电话(optophone),能够扫描文本并将字元转换成音调,使盲人能够听到字母,从而在看不到任何字元的情况下阅读。在随後的几十年里,发展了许多技术来提高字元的自动识别能力。
数位人文学科的前提是:资料是机器可读的,这意味着资讯不仅可以由研究人员阅读,也可以由电脑或软体来阅读。光学阅读器只是实现机器可读性过程中的一种设备。如果我们把「阅读」定义为消化和组织所谓的资讯,那麽,机器当然也能阅读。如果我们进一步认为阅读也是一种解释,那麽很明显,我们可以教机器分析并解释它们所获取的数据。
然而,使问题进一步复杂化的是:在目前的情况下,我们本身不仅是读者,并且我们也是以创新和富有想像力的方式中被阅读的对象。用演算法来解读我们的言行,是一个迫切需要解决的问题。这也意味着,阅读的文化历史背景在过去几十年里发生了深刻的变化。
远读
本书的主题数位历史,是基於当前的文化条件,我们拥有机器可读的大数据,包含了被数位化的和原生的数位资讯,让我们可以发展出新的历史研究方法,毫无疑问地也可以发展出新的研究环境和历史研究的课题。如果可用於研究的原始材料的性质、品质和范围都发生了变化,那麽研究工具自然也必须随之改变。
在这种情况下,几十年来由历史学家和其他人文学科研究人员广泛培育的精读观念,在二十一世纪初受到了远读观念的挑战。「远读」一词之所以流行起来,是因其对於精读的争议性评论。这个词是由文学学者莫雷蒂在二○○○年发表在《新左翼评论》(New Left Review)上的文章〈世界文学的猜想〉(Conjectures on world literature)中所提出的。
莫雷蒂认为,远读让我们能够专注於比文本更小或更大的单位:设备、主题、比喻或文体和系统。与其精读,读者必须保持一定的距离,以便能够看到较大的特徵,否则这些特徵就不会被注意到。也可以看见那些较小的、微妙的元素,它们只有在积累时才会加重分量。
在莫雷蒂於二○○五年出版的《图表、地图、树木:文学史的抽象模型》(Graphs, Maps, Trees: Abstract Models for a Literary History)一书中写道,这种距离「不是障碍,而是一种特定的知识形式:元素更少,因此更能清晰地察觉到它们的整体联系,形状、关联、结构、形式乃至於范型」。
他发表於《新左翼评论》的原创性论点,挑衅地将「精读」与「远读」放在对立面。他甚至认为,距离是「知识的一种情境」。这一结论有很多理由,稍後将在本章中进行讨论;这些不必然与数位历史学家相关,因为,在我看来,数位历史学中的「精读」和「远读」的概念与莫雷蒂的观点不同。已有许多着作试图去解决这种二分法,并且超越这种二元对立的模式。
如今,远读的概念经常被用於数位人文学科的研究,假如材料包含大量文本,那麽它也与数位历史学相关。它也意味着在文化研究中,过去的取径着重在解释方法上,而远读被视为一种统计分析和定量方法的回归。远读经常被简单地描述为分析「成千上百本书」,甚至是一种「比精读更客观」的方式。然而,在诠释莫雷蒂的方法论之际,有几个方面是必须考虑的。
首先,他的方法源於文学研究,而在文学研究中一直有很多关於不同阅读方法的讨论。如前所述,作为一种实践,精读最初是针对文学作品的传记解释而提出的,指出分析文本的内部结构和深入词语和语法水准的重要性。在文学研究中,也强调了许多其他的阅读流行语。
在精神分析和马克思主义的推动下,提出了「症状式阅读」(symptomatic reading)的概念,它的假设是文本的真正意义在於它所没有说出来的,意味着读者必须努力超越文本的表面,找到隐藏的意义。与此相反,表面阅读(surface reading)的引入,则是为了认真对待文本的表面价值,并分析被症状性阅读所掩盖的文学表面的复杂性。