文學批評用數(shù)據(jù)“說話”的可能性
10年前,《紐約時報》刊文描述了大數(shù)據(jù)技術對社會生活諸多方面的影響,認為“大數(shù)據(jù)時代”已經(jīng)來臨,但并沒有引發(fā)大規(guī)模討論和預想的轟動效應,回應者寥寥無幾。這種平靜表明人們已經(jīng)適應和融入了大數(shù)據(jù)生活,不再感覺陌生和驚奇?!按髷?shù)據(jù)”已經(jīng)從一個全新的學理概念、政策制度和發(fā)展戰(zhàn)略,轉(zhuǎn)變?yōu)榇_定的生活常識。在全新的時代語境中,大數(shù)據(jù)技術也改變了文學創(chuàng)作,產(chǎn)生了文學新樣態(tài)及其相關數(shù)據(jù)。例如,游戲文學、界面文學和賽博格文學等。這些文學的寫作主體、敘述內(nèi)容、審美原則、傳播機制和讀者接受都發(fā)生了革新。可以說,大數(shù)據(jù)技術對文學生態(tài)產(chǎn)生了顛覆式影響。
利用計算機技術,以量化統(tǒng)計的方式研究文學,是否行得通
為了應對這些新變,文學批評需要及時調(diào)整批評方法。這也是文學批評的技術化轉(zhuǎn)向和文學計算興起的重要原因之一。傳統(tǒng)意義上,“文學數(shù)據(jù)”是指文學作品和文學研究文獻電子化后產(chǎn)生的數(shù)據(jù),具有體量小、易分析和好管理等特征,集中體現(xiàn)為各種類型的文學數(shù)據(jù)庫和文學研究數(shù)據(jù)庫。例如,魯迅文學作品及其研究資料電子化后形成的魯迅文學數(shù)據(jù)庫和魯迅研究數(shù)據(jù)庫。
而“文學大數(shù)據(jù)”是指文學作品和文學研究文獻在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)傳播過程中產(chǎn)生的文學數(shù)據(jù),具有體量大、動態(tài)化、類型多、提取難、價值密度低和不易管理等特征。例如,一部文學作品在微信、微博等社交網(wǎng)絡傳播后,會產(chǎn)生關于此作品的海量評價,除了文字評價,還包括圖片、音樂、鏈接、表情包、彈幕、點贊等多種數(shù)據(jù)。分析這些大數(shù)據(jù),可以獲取讀者的年齡、職業(yè)和地域,文學作品表達的思想情感是否與社會提倡的價值觀念相吻合,此部文學作品講述的故事與哪些中外文學作品相似,讀者是否喜歡這類文學作品等諸多內(nèi)容。這些海量數(shù)據(jù)的整理和分析單純依靠人工難以完成,需要相關計算技術的支撐。因此,文學計算應運而生。
簡單而言,文學計算是指利用計算機技術,以量化統(tǒng)計的方式研究文學,具有明顯的跨學科性。文學計算在古代文學研究中應用較為廣泛,尤其在唐詩和明清小說研究方面發(fā)力較深,涉及版本考證、作者辨?zhèn)魏腿宋锕δ芊治龅榷鄠€領域。例如,20世紀80年代陳大康、錢峰等人曾提出文學研究與計算機科學相結(jié)合的觀念,并以量化統(tǒng)計方法研究《紅樓夢》。通過統(tǒng)計詞頻、詞長和段落長度變化,考證《紅樓夢》作者,分析審美特征等。但受制于計算技術,只分析了《紅樓夢》一部作品。直至新世紀,隨著計算技術和通信技術的快速發(fā)展,以及文學計算理論的普及,文學計算才大范圍崛起。劉石、趙薇、王賀等一批學者深耕此領域,取得了開創(chuàng)性成果,推動了國內(nèi)文學計算的發(fā)展。
大數(shù)據(jù)介入文學批評,可能帶來思維上的變革
文學計算不僅是批評方法的轉(zhuǎn)向,而且是批評思維的變革。首先,從主觀理論建構到客觀數(shù)據(jù)實證。一般意義上,文學批評注重文學理論和審美建構,闡釋對象以單篇或同一類型的文學作品為主。帶有很強的個人主觀性,難免形成視域盲區(qū),理論的有效性經(jīng)常受到質(zhì)疑。例如,文學批評在建構現(xiàn)實主義文學理論時,經(jīng)常以巴爾扎克的《人間喜劇》、托爾斯泰的《戰(zhàn)爭與和平》等作品為例。以此得出的觀點可以適用西方19世紀現(xiàn)實主義文學,但對中國現(xiàn)實主義文學不一定適用?;蛘哒f,文學批評的理論和審美建構因缺乏大規(guī)模文學作品的支撐,提出的觀點只契合小部分作品,無法真正構建普遍適用于“世界文學”的理論。
計算技術提升了整理和分析大規(guī)模文學作品的能力。谷歌圖書在2010年已經(jīng)收集了全球1.3億冊圖書數(shù)據(jù),而且每年都在成倍增長。因而,文學批評不再局限于小部分文學作品分析,可以把批評對象延伸到世界文學作品,讓全球文學數(shù)據(jù)自己“說話”。在此基礎上,可以得出更為客觀和普遍有效的結(jié)論。
其次,從確證因果關系到呈現(xiàn)相關關系。確證因果關系是指批評者通過分析文學作品,證實文學作品與具體歷史和現(xiàn)實事件之間的因果聯(lián)系。這種批評思維對小部分文學作品有效,但面對大規(guī)模的文學作品則難以實踐。例如,文學批評在闡釋20世紀30年代鄉(xiāng)土小說時,致力于確證鄉(xiāng)土小說與日本侵華戰(zhàn)爭的因果關系。因此,解讀的重心就放在鄉(xiāng)土小說反抗日本殖民統(tǒng)治和表現(xiàn)強烈民族意識上。這種批評思維可以適用于蕭紅的《生死場》和蕭軍的《八月的鄉(xiāng)村》,卻無法用來解讀同時期沈從文的《邊城》和師陀的《果園城記》等作品。
而文學相關關系是指文學作品與歷史和現(xiàn)實事件之間的數(shù)值關系。當一部文學作品數(shù)值增加時,相關歷史社會和現(xiàn)實事件也隨之增加,意味著它們之間的相關關系強,反之則亦然。例如,在互聯(lián)網(wǎng)搜索“鄉(xiāng)土小說”時,出現(xiàn)的信息既包括魯迅、彭家煌等作家作品,又包括五四運動、封建專制文化等歷史事件和背景。當這些作家作品和歷史事件共同且持續(xù)出現(xiàn)在不同的“鄉(xiāng)土小說”詞條中時,它們之間的相關關系就強。也就是說,文學計算不再需要主觀確證文學與歷史和現(xiàn)實之間的因果聯(lián)系,只需通過分析文學數(shù)據(jù)之間的相關關系,就可以客觀呈現(xiàn)這種因果聯(lián)系,相對更客觀和不受主觀偏見的影響。
再次,從單向度的文學思維轉(zhuǎn)向多維度的跨文學思維。本質(zhì)上,文學批評始終在追問“文學是什么”的問題?;卮鸬慕嵌?、邏輯和結(jié)論都與文學的審美性和精神性相關。但這也忽略了文學之外的眾多因素。出現(xiàn)這種狀況的重要原因之一是在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)興起之前,沒有出現(xiàn)真正的文學大數(shù)據(jù)和缺乏分析文學大數(shù)據(jù)的工具。隨著這一困境的解決,非文學數(shù)據(jù)也可以參與回答“文學是什么”的問題。這樣,就可以突破文學的邊界,進入自然科學、社會科學和藝術學等其他領域來重新界定文學及其相關知識,構建新的文學批評闡釋框架和理論基礎,重建學科體系、學術體系和話語體系。
例如,文學批評可以借助神經(jīng)科學分析人物情感,利用數(shù)學建模分析人物社會網(wǎng)絡,運用自然語言科學分析文學敘述語言審美特性等。以此為研究者提供多維度、差異化的研究視角和材料,拓展文學批評邊界,提升重釋文學的能力。同樣,文學也可以進入其他學科,以自身獨特的人文性為其他學科注入精神和審美因素,實現(xiàn)文學批評的跨學科發(fā)展。
力求有效調(diào)和“人文文化”與“科學文化”之間的矛盾關系
文學批評的技術化有諸多優(yōu)勢,但也存在需要調(diào)整和修正的局限。文學計算的基本原理是依據(jù)計算模型分析文學數(shù)據(jù)是否符合計算規(guī)則,但無法判斷數(shù)據(jù)的真假和分析其中蘊含的主觀觀念。或者說,文學計算只負責回答與規(guī)則對應的文學數(shù)據(jù)“怎么樣”的問題,而無法闡述“為什么”的問題。例如,文學計算可以統(tǒng)計出在20世紀40年代有哪些作家到過上海、寫了哪些文學作品,并以可視地圖方式呈現(xiàn)出現(xiàn),卻無法回答為什么這些作家作品會在這個時間集中出現(xiàn)在上海,與上海有何種關系等問題。這樣就需要批評主體憑借自身的主觀智能找出其中的原因。
文學計算指涉的對象是文學數(shù)據(jù),而非文學數(shù)據(jù)背后的精神意義。例如,文學計算可以統(tǒng)計魯迅《秋夜》中有兩棵棗樹,但無法呈現(xiàn)兩顆棗樹蘊含的孤獨體驗。這也是文學計算備受詬病的致命缺陷。因此需要批評主體賦予文學數(shù)據(jù)以價值導向和精神內(nèi)涵。
文學計算始終秉持“非此即彼”的極化思維。符合規(guī)則的為“是”,反之為“否”,排除了規(guī)則之外的中間化和模糊化的文學數(shù)據(jù),使文學批評滑向判斷文學數(shù)據(jù)“真”和“假”的游戲。例如,如果文學計算設置“犧牲”為判定革命英雄人物的規(guī)則,那么符合此規(guī)則的為“是”,反之為“否”。但這一規(guī)則無法判定《風聲》等諜戰(zhàn)小說中類似阿炳這樣憑借特異天賦成為革命英雄的人物。
文學計算以文學數(shù)據(jù)的最大公約數(shù)為依據(jù)闡釋文學。但文學本身就是建立在個體對現(xiàn)實差異化理解和表述基礎上,充滿了變動和偶然,這也是文學的重要魅力。因此,正如學者張福貴所說,文學計算能否“從歷史的長線來對文學史現(xiàn)象和作家作品做出相對超越性的評價,是存有疑問和不無難度的”。
雖然文學批評的技術化轉(zhuǎn)向存在諸多問題,但這不是我們否認它的理由,應該辯證看待這種轉(zhuǎn)向,既要汲取它的合理性,也要尋找解決問題的路徑。事實上,這些問題都是“人文文化”與“科學文化”矛盾關系的體現(xiàn)。從20世紀五六十年代提出人文與科學沖突的命題至今,這種二元對立思維始終沒能有效調(diào)和。關于文學批評技術化的爭議也多與此有關。如果我們能擺脫這種極化思維,以文學大數(shù)據(jù)和文學計算作為驗證文學人文思想的基礎和方法,以人文思想豐富文學大數(shù)據(jù)和文學計算的精神價值,實現(xiàn)二者的對話和融通,那么文學批評技術化轉(zhuǎn)向就有無限美好的未來。
(作者:楊丹丹,系河南師范大學文學院副教授,本文系國家社會科學基金項目“人工智能寫作本體研究”〔20BZW175〕階段性研究成果)