在阿富汗作家卡勒德·胡赛尼的小说《追风筝的人》中,一个名叫阿米尔的孩子因为一句谎言,失去了最好的朋友也是他的兄弟哈桑。1979年苏联入侵阿富汗后,阿米尔随父亲移民美国,成为作家,留在故乡的哈桑则被塔利班杀害。于是阿米尔回到喀布尔,千方百计寻找哈桑的儿子……这是一个阿富汗孩子寻找回家之路的故事,而每个孩子都渴望回家。
为了记住1979年后发生在阿富汗难民营的故事,一位政治学家、一位建筑史家和一位行为研究学教授,为阿富汗一个最大规模的难民营创建了虚拟情境,使之成为和解、证词提供、记忆重建和纪念的场所。虽然这个难民营依然存在,但地处在敏感地区,很难被访问。一位美国士兵拍摄的照片被秘密提供给美国的学术团队,利用这些照片对原址进行了虚拟重建,并开发了一个手机应用,这个应用像病毒一样传播开来。该项目已经记录了数百小时的访谈,收集了描述难民营的第一手资料、照片以及绘画。在仿真实验室,专家们通过虚拟形式重现昔日难民营的日常生活。这些曾经生长在集中营的孩子,现在他们分散在世界各地,项目专家一方面鼓励他们积极参与、为这个项目作出贡献,一方面小心翼翼地避免再次刺痛这些难民营的亲历者。
人们把这一研究方式称为数字人文。从2001年数字人文的概念被提出,随着互联网技术的飞跃式发展,它逐步被更多的人文学者所接纳,并积极投入其中。数字人文的概念也逐步演化,从基本等同于数字记忆,到今天远远超出了信息存储和展现媒介改变的范畴。那么什么是数字人文呢?
在人民大学出版社新近出版的《数字人文:改变知识创新与分享的游戏规则》一书中,作者认为,数字人文是指充分利用计算机技术与人文学知识开展的合作性、跨学科的研究、教学和出版的新型学术模式和组织形式。数字人文是一种“全球性的、超越历史和媒介的创建知识和意义的路径”。作为一种开展研究、教学和出版的学术模式和组织形式,数字人文更强调的是一个动态的过程而非一个静态的结果。在书中,作者特别指出了什么不是数字人文,并认为单纯地使用数字工具进行人文学研究与交流并不能算是数字人文。数字人文既不是简单地将已有的研究成果进行数字化转换,也不是拘泥于数字化时代新媒质的研究。数字人文将研究对象界定为从史前到当下的整个人类历史记录,数字人文某些主要领域的研究冲破人文学的传统核心,积极接受社会科学与自然科学的定量研究方法以及艺术学的技巧和思维模式。
当前数字人文在世界范围内方兴未艾。一些欧美国家在大学内建立了跨学科的数字人文研究中心,较为知名的研究中心如美国斯坦福大学的计算机辅助人文研究中心和斯坦福人文实验室、南加利福尼亚大学的数字人文研究中心、马里兰大学的人文技术研究所,英国伦敦国王学院的人文计算研究中心,日本立命馆大学的京都数字文艺研究中心等。在国际范围内还成立了计算机与人文学科联合会、欧洲数字人文协会、加拿大数字人文协会、日本数字人文协会等,并联合组建了国际数字人文组织联盟。
国际数字人文研究的蓬勃发展也推动了中国数字人文研究的持续进步。2011年,国内第一个数字人文研究中心落户于武汉大学,2014年“数字人文与语义技术”研讨会在上海图书馆召开,上海大学、北京大学(已召开两届)、南开大学都召开了相关的国际研讨会。台湾大学及台湾中央研究院自2009年起每年举办“数位人文/数位典藏”的国际研讨会。
当然,对于什么是数字人文大家还没有完全形成统一的意见,但探索和实践却是在紧锣密鼓地进行中,认识也在不断加深。数字人文带给人文学哪些不一样的东西?大家基本形成以下共识:
(1)跨学科、跨机构、跨国界的研究。其实这在自然科学领域并不罕见,在人文学领域也已有大项目研究。数字人文在于使研究者更加实时地沟通,它不再是个人研究的汇总叠加,而是不断在别人意见的基础上修订、迭代,并能够记录而不是抹掉每一个人的贡献。同时,数字人文研究项目的推进,不仅需要计算机专家和人文学者的跨学科融合,同时需要人文学科内部不同专业背景的学者的融合。数字人文的学者不再仅仅是坐在迷宫般的办公楼里获得终身职位的智者,而是涵盖更广泛的人群,包括研究培训者、社群档案管理者、文化资源保管者、参与人文项目的设计者、专门从事跨学科工具开发的程序员等。
(2)学者和民间普通人的共同参与。以往人文学的研究大多是由学者完成的,哪怕是田间调查,被采访者也大多只是一个被隐姓埋名的“个案”。数字人文研究,通过数字技术让每一个普通人、受访者成为知识提供者、创造者和生产者。因为数字化可以采集和拥有海量数据,研究者对客观性的认识发生了变化。“样本量”“样本的客观随机”以及调研成本在研究者那里已经具有了颠覆性概念。有人说人文学是孤独天才的领地,这些天才孤身一人为了一项创作而默默奋斗,而他们的成果(如一本哲学著作、一项权威性历史研究、一份撼动学界思维范式的文学评论)则因其非凡超群的价值而令人惊叹。今天孤独的天才依然有存在的价值,他们的一个主要职能就是研究架构的设计。而每个普通人(亲历者)都能为研究问题的界定、解答、再界定、再解答提供特定领域的专门信息。
(3)大数据和小数据兼顾。分布式计算和分布式存储,使数据的采集、存储、处理和挖掘、再处理、再挖掘的能力都超强。但数字人文的关键点并不在于存储,而在于多人参与的数据提供和多人参与修正的数据,不仅存储数据本身,还可以存储数据被不同的人处理过后的痕迹。特定的、带着浓重个性化信息的小数据比任何时候都更具价值。
(4)研究方式、手段的多样化。传统人文学科的研究从收集、查阅资料开始,数字人文学的研究可能从一个虚拟的网络游戏和社交媒体的参与式讨论开始。我们开篇介绍的阿富汗难民营的案例,研究者从确定可以创建带有社交媒体和参与式功能的虚拟场景的软件开始,行为研究学教授与界面设计师展开合作,创作一些虚拟形象和剧本小样,以展现可能出现在真实参与者之间的场景和故事情节。创建一个多用户活跃参与并利用历史材料和文献的多人场景界面,需要非常细致的脚本和指南。参与者不仅可以通过电脑参与,还可以通过手机提供图片、音视频和文字等。当然整个研究过程中所涉及的研究方法手段远不止于此。
(5)对多元观点的包容性更强。数字人文的研究方法注定会呈现多元的观点,也必须要体现多元的观点。过去,人文学研究受到量化研究的影响,似乎没有数据建模就不能体现研究的客观性和价值。然而人文学的“数据”恰恰是复杂多变的,在不同条件下呈现不同的特征。数字人文不能完全再现“数据”的复杂多变,但在一定程度上可以避免人为筛选、数据样本少等问题。在数字人文研究领域,个人经验、小事件、故事、多样性被重视,并成为社会记忆中的一部分,而主创人员的包容心是核心。
当然,数字人文领域除了需要面对互联网带给人们的隐私、安全等共同问题外,还特别需要面对一个重要问题:数字人文在根本上是发展了人类的创造力,还是制约了人类的创造力;我们可以得到的天才般的人文学者会更多,还是会更少?黑格尔说:凡是现实的都是合理的!我们会在发展中不断完善和修正,普通人的生活被记忆、被尊重无疑是一种美好的事物。