AI不可能剥夺史学家在研究工作中的主体性

来源:搜狐新闻 分类:手机

AI大模型堪称当前时代的一项突破性成就,其对人类社会的冲击将是全方位的。历史学作为探究过往人类社会的研究领域,想要完全隔绝AI的影响,既不现实,也不应该。传统史学方法并非一成不变,主动接纳新方法并融入研究,是题中之义。这就是所谓的“预流”。关键在于,我们如何更好地迎接这个“流”呢?

数字技术冲击史学主要有三次浪潮。第一波出现在20世纪90年代初,即“换笔”——从纸质书写转向键盘录入。文史学者完成这一转变的过程颇为漫长,这与当时计算机技术水平和改革开放初期社会经济状况密切相关。不过,多数学者对新技术持积极态度。“换笔”使我们摆脱了手工操作,迈入机器时代,实现了划时代的跨越。

第二波始于20世纪90年代末,全文数据库的应用逐渐普及,标志性事件涵盖《四库全书》全文检索数据库、《中国基本古籍库》及中国知网数据库的发布。全文数据库的大规模使用,极大地方便了学者搜集史料的效率。其后,在全文数据库应用基础上,催生了“数字人文”这一概念——通过综合分析数据,辅助史学研究,具体涉及文本挖掘、数据可视化等技术。

第三波则是近年来兴起的人工智能大模型。与前两次浪潮主要影响技术层面不同,AI大模型似乎具备了某种自主思考能力,甚至有人担忧其“抢夺”史学家的位置。

AI大模型与历史认知的关联究竟有多大?它与真正的史学家之间是否存在明确的界限?根据现有认知,有一点可以肯定:AI对语料库的解读是平面的,“大语言模型既无法体会研究对象背后的主观意图,更难理解思想的历史渊源和发展脉络,也无法通过算法呈现非理性因素”。它无法“移情”于历史对象,缺乏人文性,更不可能形成历史意识。基于此,本文将从两方面展开具体阐述。

一是笔者此前在一篇短文中提出的疑问:“当文本未直接反映历史信息时,应当如何应对?”作为可见可感的表层结构,文本虽有限但外观直观。从词元到段落,每一段都可能隐藏多重意义,即文本深层的隐性信息。AI可通过比较相关文本建立联系,推断出部分简单信息。例如,宋代范仲淹表字希文,这两个字符串指向同一人,将包含这些词元的文本关联起来进行归纳,或许问题不大——尽管仍需考虑为何有时称姓名,有时称表字。但若存在另一位名望远逊范仲淹的历史人物也以希文为号,释读时(即两者关联)难度便会显著增加。部分隐藏于文本背后的深层信息,本需要史学家多方考证方可揭示,AI可能难以胜任。从个别概念的借用、比喻,到文本整体的反讽、转喻,再到作者语气与重点,需从语句、段落联系至全篇,进而理解作者在特定情境下的心境与立场——即所谓“移情”。有时这些解读甚至需要绕过表层结构十几层,这些均有赖于研究者对全面史实的深入理解,超越现存文本与历史真实在概率上的失衡,才可能把握文本传递的真实信息。

二是史学领域若从技术角度划分,通往最终理解的路径可能涉及对历史现象的持续观察,以及比较分析,发现与既有认知的偏差和新知识生成的可能。学术史与历史学的演进

相关推荐