用戶登錄投稿

中國作家協(xié)會主管

文學(xué)大數(shù)據(jù)與當(dāng)代文學(xué)研究范式轉(zhuǎn)型
來源:《當(dāng)代作家評論》 |  楊丹丹  2022年02月23日08:17

中國當(dāng)代文學(xué)研究范式轉(zhuǎn)型是一個常談常新的話題。從當(dāng)代文學(xué)發(fā)生之日起,學(xué)術(shù)界就面臨如何闡釋當(dāng)代文學(xué)的問題,其中就涉及文學(xué)研究的方法和范式等內(nèi)容。而且,隨著文學(xué)社會語境、研究對象和訴求的變化,文學(xué)研究范式轉(zhuǎn)型問題也越發(fā)突出和明顯,通常顯現(xiàn)在文學(xué)研究方法論爭中,通過論爭確立某一歷史階段通約有效的研究方法,并在長期實踐中形成主流文學(xué)研究范式。從這一角度看,當(dāng)代文學(xué)研究范式轉(zhuǎn)型與當(dāng)代文學(xué)演進(jìn)和當(dāng)代文學(xué)研究史變遷緊密關(guān)聯(lián)。

當(dāng)代文學(xué)與古代文學(xué)、近現(xiàn)代文學(xué)的本質(zhì)差異之一是它的“當(dāng)代”屬性?!爱?dāng)代”的繁復(fù)多變和時刻在場,使當(dāng)代文學(xué)研究需要直面最新的文學(xué)現(xiàn)場,成為“當(dāng)前文學(xué)思潮、作品和現(xiàn)象最‘理想’的‘批評者’”,并運用“認(rèn)同式”“討論式”批評(1)契合當(dāng)代文學(xué)的“當(dāng)代性”。這預(yù)設(shè)了當(dāng)代文學(xué)研究范式的不穩(wěn)定,沒有任何一種長久不變的研究范式能夠有效應(yīng)對不斷新變的文學(xué)現(xiàn)場。這也使當(dāng)代文學(xué)研究顯現(xiàn)出強(qiáng)烈的危機(jī)感。當(dāng)無法“對嶄新的文學(xué)實踐做出辨認(rèn)、預(yù)判,疾言厲色或為之鼓與呼”時,(2)勢必對已有研究范式做出修正和調(diào)整,甚至進(jìn)行顛覆和重構(gòu),尋找新的研究范式替代。只有如此,才能保證文學(xué)研究的有效闡釋力和公信力。因此,當(dāng)代文學(xué)研究本身就包含對自身轉(zhuǎn)型問題的持續(xù)探索。

從中國當(dāng)代文學(xué)研究史來看,大體形成了文學(xué)政治研究、文學(xué)審美研究、文學(xué)文化研究和文學(xué)社會研究幾種主流研究范式。它們與特定歷史語境和時代訴求密切相關(guān)。大致對應(yīng)20世紀(jì)50—70年代、80年代、90年代和2000年以來幾個歷史階段。每種研究范式在相應(yīng)的歷史階段都具有優(yōu)先于其他研究范式的闡釋權(quán)且處于流轉(zhuǎn)狀態(tài)。這說明任何一種文學(xué)研究范式都有其邊界和限度,當(dāng)新的社會語境、新的文學(xué)現(xiàn)象出現(xiàn)時,必然產(chǎn)生新的研究范式。或者說,文學(xué)研究范式轉(zhuǎn)型問題是當(dāng)代文學(xué)研究史自身生發(fā)的問題,一種新的文學(xué)研究范式的形成過程也是其他文學(xué)研究范式的式微過程。可以說,“學(xué)術(shù)范式的轉(zhuǎn)換和形成是一個相當(dāng)復(fù)雜的過程,一方面出自社會文化轉(zhuǎn)型的需要,另方面有學(xué)術(shù)本身的發(fā)展特點”。(3)

因此,想辨識清楚當(dāng)代文學(xué)研究范式轉(zhuǎn)型問題,就需要闡明與此相關(guān)的文學(xué)新語境和新現(xiàn)象,以及原有文學(xué)研究范式的限度和新的文學(xué)研究范式的適用性問題。在此意義上,我們需要解釋清楚文學(xué)研究在當(dāng)下發(fā)生了怎樣的新變化,文學(xué)研究方法和思維發(fā)生了怎樣的新轉(zhuǎn)變,出現(xiàn)了哪些新的文學(xué)研究實踐路徑,生產(chǎn)了哪些新知識等問題。

一、大數(shù)據(jù)時代與文學(xué)大數(shù)據(jù)

1980年,美國社會學(xué)家阿爾文·托夫勒在著作《第三次浪潮》中闡述了科技發(fā)展在農(nóng)業(yè)社會到工業(yè)社會轉(zhuǎn)型過程中起到的關(guān)鍵作用,并且預(yù)測電子科技進(jìn)步將引發(fā)“第三次浪潮文明”:人類將由工業(yè)社會進(jìn)入信息社會,“整個文明和制度、技術(shù)、文化都在變化的浪潮下日趨分裂”。(4)尤其是大數(shù)據(jù)技術(shù)在日常生活諸多方面的廣泛應(yīng)用,將推動大數(shù)據(jù)社會的形成。當(dāng)下,隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)的快速發(fā)展,阿爾文·托夫勒的預(yù)測開始變?yōu)楝F(xiàn)實,“根據(jù)國際權(quán)威機(jī)構(gòu)Statista的統(tǒng)計和預(yù)測,2020年全球數(shù)據(jù)產(chǎn)生量預(yù)計達(dá)到47ZB,而到2035年,這一數(shù)字將達(dá)到2142ZB,全球數(shù)據(jù)量即將迎來更大規(guī)模的爆發(fā)”。(5)

事實上,系統(tǒng)認(rèn)識和理解大數(shù)據(jù)最先從學(xué)術(shù)界開始?!蹲匀弧贰犊茖W(xué)》《ERCIM News》等業(yè)界頂尖期刊都曾開設(shè)“大數(shù)據(jù)專輯”,對數(shù)據(jù)的維護(hù)、再利用,數(shù)據(jù)的可解釋性和數(shù)據(jù)處理主體等問題進(jìn)行探討。雖然,學(xué)術(shù)界的討論主要集中在學(xué)理層面,但都表明一個事實:大數(shù)據(jù)可能成為引領(lǐng)未來社會發(fā)展的支配性力量。而且,隨著大數(shù)據(jù)理論的不斷成熟,大數(shù)據(jù)討論開始溢出學(xué)理層面,轉(zhuǎn)而在社會實踐應(yīng)用維度發(fā)力,進(jìn)而上升為國家發(fā)展戰(zhàn)略。中國、美國和歐盟等國家/地區(qū)紛紛制定了大數(shù)據(jù)發(fā)展政策。中國早在2014年就將“大數(shù)據(jù)”寫入政府工作報告,明確實施國家大數(shù)據(jù)戰(zhàn)略。更為重要的是,“一場由大數(shù)據(jù)帶來的技術(shù)革命”和“智能革命”(6)開始重塑現(xiàn)實世界,滲入日常生活的各個角落,“從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟(jì)、人文以及社會的其他各個領(lǐng)域”(7)都有大數(shù)據(jù)的魅影。人們可以直接感受到自己生活在一個被數(shù)字編織的數(shù)據(jù)網(wǎng)中。那么,在大數(shù)據(jù)時代,數(shù)據(jù)技術(shù)是如何改變文學(xué)的?產(chǎn)生的文學(xué)大數(shù)據(jù)呈現(xiàn)出哪些新的特征?文學(xué)研究方法出現(xiàn)哪些變化?

回答上述問題的前提是首先明確“文學(xué)大數(shù)據(jù)”的概念。目前為止,學(xué)術(shù)界對“大數(shù)據(jù)”的概念仍存在較大分歧,麥肯錫、維克托·邁爾·舍恩伯格和肯尼思·庫克耶等學(xué)者都曾界定過大數(shù)據(jù),但都沒有形成共識。(8)所以,筆者只能從現(xiàn)有概念中提取大數(shù)據(jù)的一些基本特征:數(shù)據(jù)規(guī)模大,數(shù)據(jù)來源、種類多,數(shù)據(jù)增長、處理速度快,數(shù)據(jù)價值密度低等。(9)這些特征決定了大數(shù)據(jù)的“大”不僅是數(shù)據(jù)數(shù)量的大,更是指數(shù)據(jù)的復(fù)雜多變,以及通過數(shù)據(jù)獲取新知識的能力。以此為標(biāo)準(zhǔn),可以為“文學(xué)大數(shù)據(jù)”暫時確立一個相對穩(wěn)固的概念:文學(xué)大數(shù)據(jù)與傳統(tǒng)意義上的文學(xué)數(shù)據(jù)不同,不是指文學(xué)作品和文學(xué)文獻(xiàn)電子化后產(chǎn)生的電子文本數(shù)據(jù),而是指文學(xué)作品在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)傳播過程中產(chǎn)生的與文學(xué)相關(guān)的數(shù)據(jù),包括日志、音頻、視頻、圖片、彈幕、點贊等結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化多種類型數(shù)據(jù)。這些數(shù)據(jù)數(shù)量巨大,來源、種類多樣,成碎片化分布,且處于實時更新狀態(tài),有價值和可利用的數(shù)據(jù)密度較低,需要利用計算技術(shù)分析這些數(shù)據(jù)。例如,余華的小說《文城》出版后,在微信、微博等社交媒體和豆瓣讀書、京東圖書等網(wǎng)絡(luò)購書平臺,以及抖音、快手等短視頻媒體中迅速傳播,產(chǎn)生了數(shù)量龐大的文學(xué)數(shù)據(jù),包括讀者截取的小說原文段落、長篇專業(yè)評論、簡短的即時感受文字、表達(dá)閱讀情緒的圖片、講述閱讀體會的視頻、購書推薦評語、銷售數(shù)字表格、小說影響力排行表和小說的知識圖譜等。從這些數(shù)據(jù)中可以分析出讀者對小說的總體評價、專業(yè)批評家與普通讀者的接受差異、讀者的地理信息、小說在不同地域的文化影響力、當(dāng)下社會情緒的走勢、讀者的審美變化和小說的未來發(fā)展趨勢等內(nèi)容。而且,不同類型數(shù)據(jù)之間的重組又可以產(chǎn)生新數(shù)據(jù)??梢哉f,當(dāng)《文城》進(jìn)入互聯(lián)網(wǎng)和社交網(wǎng)被數(shù)據(jù)化之后,就不再是一部單純的文學(xué)作品,轉(zhuǎn)而成為生產(chǎn)文學(xué)數(shù)據(jù)及其相關(guān)新知識的載體。

文學(xué)大數(shù)據(jù)既是紙媒文學(xué)在互聯(lián)網(wǎng)和社交網(wǎng)傳播的結(jié)果,又是依托網(wǎng)絡(luò)、利用數(shù)字技術(shù)生產(chǎn)數(shù)字化文學(xué)的產(chǎn)物。這些“數(shù)字文學(xué)”(10)在利用文學(xué)大數(shù)據(jù)的同時,又再次產(chǎn)生了文學(xué)大數(shù)據(jù)。人工智能文學(xué)、超文本文學(xué)、視覺文學(xué)和界面文學(xué)等“數(shù)字文學(xué)”的誕生不僅是新舊文學(xué)形態(tài)的更迭,而且是文學(xué)寫作生態(tài)的全方位變革。它的“非線性敘事、非穩(wěn)定結(jié)構(gòu)、讀者參與性以及多媒體特征被視為對傳統(tǒng)文學(xué)理論以及文學(xué)審美的挑戰(zhàn)”,同時,其特有的“編程功能、數(shù)字代碼、計算機(jī)算法等數(shù)字文學(xué)內(nèi)部運行機(jī)制被視為新美學(xué)基礎(chǔ)和美學(xué)特征”。(11)可以說,這些新的文學(xué)特性都與文學(xué)大數(shù)據(jù)緊密關(guān)聯(lián)。例如,超文本文學(xué)就超越了傳統(tǒng)語義文本的限制,把詞語、地理位置和個體信息等眾多主題元素按照多種組合方式重組,甚至“任何可以看見、可以聽見的都可以構(gòu)成文本的紋理”。(12)而且,寫作主體既可以是人,也可以是智能機(jī)器。進(jìn)一步而言,超文本形成的基礎(chǔ)是文學(xué)大數(shù)據(jù),通過分析和管理文學(xué)大數(shù)據(jù),把文學(xué)大數(shù)據(jù)存儲在各個文字節(jié)點上。然后,在這些文字節(jié)點之間確立相關(guān)關(guān)系,再以鏈接的方式把各個文字節(jié)點串聯(lián)起來,形成一種網(wǎng)狀結(jié)構(gòu)。同時,超文本在互聯(lián)網(wǎng)和社交網(wǎng)傳播過程又生產(chǎn)了新的文學(xué)數(shù)據(jù),并無限循環(huán)往復(fù)。林焱的小說《白毛女在1971》就是一部典型的超文本小說,作家在文本中設(shè)置了多個鏈接符號,這些鏈接符號與故事情節(jié)敘述密切相關(guān),讀者只有閱讀完這些鏈接網(wǎng)頁的內(nèi)容后,才能繼續(xù)閱讀小說剩余的內(nèi)容。(13)

對當(dāng)代文學(xué)研究而言,面對文學(xué)大數(shù)據(jù)及新的文學(xué)樣態(tài),需要認(rèn)真思考如何調(diào)整和重塑文學(xué)研究方法,與此新變相契合,進(jìn)而建構(gòu)新的研究范式。因此,“如何在設(shè)計算法、挖掘工具、可視化工具及存檔技術(shù)時凸顯價值、解釋和意義變得更加重要”。(14)

二、文學(xué)數(shù)據(jù)研究中“小數(shù)據(jù)”與“大數(shù)據(jù)”

為了應(yīng)對文學(xué)的數(shù)字化和數(shù)據(jù)化,文學(xué)研究引入了“計算”方法,把信息技術(shù)和計算機(jī)技術(shù)應(yīng)用到文學(xué)研究。文學(xué)計算的兩大核心是:文學(xué)數(shù)據(jù)和計算技術(shù)。尤其是計算技術(shù)至關(guān)重要,它決定了文學(xué)數(shù)據(jù)研究的上限。因為,文學(xué)數(shù)據(jù)研究“具有高度技術(shù)化的內(nèi)涵與本質(zhì),它必須依托數(shù)字系統(tǒng)建設(shè)、程序代碼編寫或者其他手段來實現(xiàn)研究過程或呈現(xiàn)研究結(jié)果”。(15)現(xiàn)階段,這些計算技術(shù)包括可視化與數(shù)據(jù)設(shè)計技術(shù),文本分析、聚合與數(shù)據(jù)挖掘技術(shù),地理信息系統(tǒng)技術(shù)和仿真技術(shù)等,這些技術(shù)的大規(guī)模開發(fā)和普遍應(yīng)用推進(jìn)了文學(xué)數(shù)據(jù)研究的深入發(fā)展。這也可以解釋為何在文學(xué)數(shù)據(jù)研究初期,大部分研究只能停留在單體文本詞語抽取、詞頻統(tǒng)計和語法分析上。因為文學(xué)數(shù)據(jù)量不夠,計算技術(shù)不先進(jìn),文學(xué)數(shù)據(jù)研究指涉的對象只能是小數(shù)據(jù)樣本和簡單計算分析。20世紀(jì)80年代,錢鋒、(16)陳大康、(17)丁寧、(18)、林興宅(19)等人曾提出文學(xué)與計算機(jī)科學(xué)、系統(tǒng)科學(xué)相結(jié)合的理論設(shè)想,利用數(shù)學(xué)建模和計算機(jī)自動計算的方法,對文學(xué)作品的文體特征、審美風(fēng)格和作者身份辨識進(jìn)行研究。但在具體實踐中,受制于文學(xué)數(shù)據(jù)庫和計算技術(shù),大部分研究仍然集中在作品修辭風(fēng)格的計量分析上,“通過建立語料庫,對文本語言的字符、段落、詞長、詞類、詞性以及高頻詞分布等特征項進(jìn)行統(tǒng)計,運用計算公式來計算平均段落長度、詞長變化、文本聚類等”。(20)例如,武漢大學(xué)語言自動處理研究組通過統(tǒng)計老舍的《駱駝祥子》的詞頻,來分析小說的審美特征;(21)劉賓運用數(shù)學(xué)建模技術(shù)分析《福樂智慧》,經(jīng)過電腦檢索、排序,編制成索引詞典的框架;(22)錢鋒、陳光磊通過比較巴金的《我們會見了彭德懷司令員》和倪海曙的《三輪摩托車》中的辭格、音律和章法,確認(rèn)巴金和倪海曙的小說語言風(fēng)格;(23)與此類似,王景丹通過統(tǒng)計曹禺等8位劇作家文本的句頻,確認(rèn)各自文體風(fēng)格;(24)吳禮權(quán)通過分析詞語、句式和修辭運用,總結(jié)“簡約”與“繁豐”審美風(fēng)格的基本特征。(25)從中不難看出,初始階段的文學(xué)數(shù)據(jù)研究以簡單統(tǒng)計文本修辭為主,很少使用復(fù)雜的計算模型和計算技術(shù)。

21世紀(jì)以來,隨著數(shù)字人文理論在國內(nèi)的傳播,以及眾多“關(guān)系型數(shù)據(jù)庫的建設(shè)、語言信息處理技術(shù)的發(fā)展和社會計量方法向人文領(lǐng)域的持續(xù)滲透”,(26)文學(xué)數(shù)據(jù)研究取得長足進(jìn)步。例如,羅男運用基于改進(jìn)的向量空間模型特征權(quán)重計算方法(TF-IDF)和潛在語義分析技術(shù)(LSI),分析15部金庸小說中的字、詞匯、句子和段落4個語法單位,以此探究金庸小說的語言風(fēng)格,并辨識《臥龍記》的真實作者;(27)張小宇在建立魯迅雜文語料庫、魯迅小說語料庫和魯迅同時期作家雜文語料庫基礎(chǔ)上,使用語料庫檢索工具AntConc,計算魯迅雜文的詞長、句長、單音節(jié)詞和雙音節(jié)詞等17個語言特征出現(xiàn)比例,并與同時代作家的雜文語言特征進(jìn)行比較,以此總結(jié)魯迅雜文的語言風(fēng)格;(28)余韻為了證明巴金前后期小說語言風(fēng)格的一致性,把巴金小說劃分為6個階段,并建立相應(yīng)的語料庫,在此基礎(chǔ)上,計算不同階段巴金小說的詞長分布,詞匯豐富度,共現(xiàn)詞、獨有詞、實詞和虛詞使用頻率;(29)與此類似,金迪對格非和余華小說語言風(fēng)格的研究,(30)時季對閻連科和劉震云小說語言風(fēng)格的研究,(31)以及王少康、(32)年洪東、(33)李慧(34)對現(xiàn)代作家身份識別和作品辨?zhèn)蔚难芯慷紝儆诖朔N研究類型。但上述文學(xué)數(shù)據(jù)研究仍沒有突破文體學(xué)、修辭學(xué)和語言學(xué)研究框架。

但我們也不能據(jù)此掩蓋一些學(xué)者在文學(xué)數(shù)據(jù)研究方面做出的開創(chuàng)性探索,尤其是在小說人物功能和社會網(wǎng)絡(luò)分析方面取得的突破。例如,吳蕙羽利用優(yōu)化后的Python技術(shù)、Pyecharts數(shù)據(jù)庫和Echarts數(shù)據(jù)可視化JS庫,分析陳忠實的《白鹿原》中的人物關(guān)系和社會網(wǎng)絡(luò),并涉及人物情感分析。(35)但吳蕙羽的研究重心在計算技術(shù),而非小說敘事,因而沒有得出與小說敘事相關(guān)的結(jié)論。相對于此,趙薇對李劼人的“《大波》三部曲”的社會網(wǎng)絡(luò)和人物功能分析更為深入和透徹。趙薇運用社會網(wǎng)絡(luò)分析(SNA)方法,利用數(shù)據(jù)挖掘、中心性計算和可視化技術(shù),分析《死水微瀾》《暴風(fēng)雨前》《大波》前后兩個版本5部小說中的人物關(guān)系和社會網(wǎng)絡(luò),“對加權(quán)網(wǎng)絡(luò)中最高中介中心性節(jié)點所提示的關(guān)鍵人物的敘事功能進(jìn)行了深入探討”,(36)認(rèn)為“小人物”具有重要敘事功能,承擔(dān)了講述重大歷史事件的責(zé)任。除此以外,通過分析文學(xué)研究數(shù)據(jù)庫,發(fā)現(xiàn)某一階段文學(xué)研究主題、(37)熱點、(38)發(fā)展趨勢和歷史軌跡,(39)以及學(xué)者影響力、(40)學(xué)科關(guān)聯(lián)(41)和學(xué)術(shù)刊物影響力(42)等內(nèi)容,成為文學(xué)數(shù)據(jù)研究的重要趨向。例如,丁帆、趙普光以當(dāng)代文學(xué)研究中的論題詞詞頻為考察中心,通過分析論題詞的頻率、集中程度和論題詞的顯隱等數(shù)據(jù),客觀呈現(xiàn)當(dāng)代文學(xué)研究70年發(fā)展軌跡。但文章沒有引入知識圖譜分析技術(shù),仍屬于傳統(tǒng)意義上的計量統(tǒng)計范疇。而謝靖、章鑫鑫在對CSSCI數(shù)據(jù)庫數(shù)據(jù)進(jìn)行清洗和格式轉(zhuǎn)化,以及設(shè)定頻次、中介中心度和聚類指標(biāo)等參數(shù)基礎(chǔ)上,利用CtiespaceⅢ軟件計算2000—2011年期間CSSCI收錄的中國文學(xué)研究期刊發(fā)文情況,形成文學(xué)研究期刊關(guān)鍵詞共現(xiàn)圖譜,立體呈現(xiàn)這一期間中國文學(xué)研究熱點、發(fā)展趨勢和學(xué)科知識圖譜。(43)而且,通過統(tǒng)計中國文學(xué)期刊引文數(shù)據(jù),分析中國文學(xué)圖書學(xué)術(shù)影響力。(44)王賀則通過比較《解放日報》數(shù)據(jù)庫的電子目錄、索引與紙質(zhì)版的差異,探討“數(shù)字人文”與傳統(tǒng)學(xué)術(shù)的關(guān)系。(45)

雖然文學(xué)數(shù)據(jù)研究在廣度和深度上都取得了一定程度的進(jìn)步,但還不是真正意義上的文學(xué)大數(shù)據(jù)研究:一方面,當(dāng)代文學(xué)人物關(guān)系和社會網(wǎng)絡(luò)研究、當(dāng)代文學(xué)關(guān)聯(lián)數(shù)據(jù)庫研究、當(dāng)代作家檔案數(shù)據(jù)研究、當(dāng)代文學(xué)學(xué)術(shù)地圖和知識譜系研究、基于共現(xiàn)分析的文本知識挖掘研究、當(dāng)代文學(xué)研究者的隱性合作關(guān)系研究等諸多方面仍然存在進(jìn)一步深挖的空間;另一方面,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)生產(chǎn)的文學(xué)大數(shù)據(jù)還沒得到充分利用,基本處于擱置狀態(tài)。例如,豆瓣讀書、微信、微博生產(chǎn)的文學(xué)數(shù)據(jù)及其關(guān)涉的人物情感和社會心態(tài)、文學(xué)的網(wǎng)絡(luò)主題模型、游戲文學(xué)的虛擬現(xiàn)實、界面文學(xué)的知識挖掘、新媒體文學(xué)的知識圖譜等眾多研究話題還沒有充分展開。之所以出現(xiàn)這種態(tài)勢,是因為現(xiàn)階段文學(xué)大數(shù)據(jù)研究存在一些困境和癥結(jié),為文學(xué)大數(shù)據(jù)研究從理論構(gòu)想進(jìn)入現(xiàn)實實踐從而產(chǎn)生真正價值設(shè)置了壁壘。這也是當(dāng)代文學(xué)研究范式轉(zhuǎn)型亟須解決的問題。

三、文學(xué)大數(shù)據(jù)研究的困境和癥結(jié)

當(dāng)代文學(xué)大數(shù)據(jù)研究仍處于起步階段,難以避免出現(xiàn)諸多困境,我們需要直面這些癥結(jié),尋找解決問題的方法和路徑,在此基礎(chǔ)上推進(jìn)當(dāng)代文學(xué)研究的發(fā)展?,F(xiàn)階段,當(dāng)代文學(xué)大數(shù)據(jù)研究面臨專題數(shù)據(jù)庫少、跨學(xué)科合作度低、研究方法認(rèn)同度低、研究范圍窄、研究學(xué)者少、專業(yè)學(xué)術(shù)期刊少、學(xué)術(shù)評價體系缺失、學(xué)科專業(yè)建設(shè)緩慢、課堂教學(xué)滯后和網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)薄弱等問題。

文學(xué)大數(shù)據(jù)研究的基礎(chǔ)是數(shù)據(jù),包括數(shù)字文學(xué)文本和文獻(xiàn)史料及其數(shù)據(jù)化后形成的各種文學(xué)專題數(shù)據(jù)庫,也包括文學(xué)文本在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)傳播產(chǎn)生的文學(xué)大數(shù)據(jù)。但大數(shù)據(jù)的海量、動態(tài)和價值密度低等特性使數(shù)據(jù)庫建設(shè)存在較大難度。比較便捷和高效的方式是利用數(shù)據(jù)挖掘、分析和顯示技術(shù)針對特定大數(shù)據(jù)進(jìn)行研究。因此,文學(xué)專題數(shù)據(jù)庫和文學(xué)研究專題數(shù)據(jù)庫建設(shè)尤為重要。但現(xiàn)實情況是,已建成的中國現(xiàn)當(dāng)代文學(xué)及其研究專題數(shù)據(jù)庫仍然很少,主要集中在“民國圖書數(shù)據(jù)庫”(46)“晚清和民國全文期刊數(shù)據(jù)庫”(47)“《申報》全文數(shù)據(jù)庫”(48)“《大公報》(1902—1949)數(shù)據(jù)庫”(49)“近代上海方志資料數(shù)據(jù)庫”(50)“民國文獻(xiàn)大全數(shù)據(jù)庫”(51)“解放前報刊題錄數(shù)據(jù)庫”(52)“民國圖片資源庫”(53)“民國時期文獻(xiàn)數(shù)據(jù)庫”(54)“大成故紙堆”(55)“典海民國圖書資源平臺”(56)“民國圖書數(shù)字化資源庫”(57)等民國文學(xué)數(shù)據(jù)庫上。而當(dāng)代作家作品及其研究文獻(xiàn)數(shù)據(jù)庫、當(dāng)代文學(xué)期刊數(shù)據(jù)庫和當(dāng)代文學(xué)史數(shù)據(jù)庫等與當(dāng)代文學(xué)研究直接相關(guān)的專題數(shù)據(jù)庫非常稀少。這一問題已得到學(xué)術(shù)界的重視,陸續(xù)啟動了“網(wǎng)絡(luò)文學(xué)文獻(xiàn)數(shù)據(jù)庫建設(shè)”“漢譯文學(xué)編年考錄及數(shù)據(jù)庫建設(shè)”“中國現(xiàn)代文學(xué)報刊作品系年及數(shù)據(jù)庫建設(shè)”“中國新詩傳播接受文獻(xiàn)集成、研究及數(shù)據(jù)庫建設(shè)”“抗戰(zhàn)大后方文學(xué)史料數(shù)據(jù)庫建設(shè)”“‘學(xué)衡派’年譜長編及文獻(xiàn)數(shù)據(jù)庫建設(shè)”“延安時期未刊文獻(xiàn)資料收集、整理與數(shù)據(jù)庫建設(shè)”(58)等項目。只有完成基礎(chǔ)性的專題數(shù)據(jù)建設(shè),才能為文學(xué)大數(shù)據(jù)研究提供支持。

文學(xué)大數(shù)據(jù)研究作為新興的研究范式,從大規(guī)模的理論引入研究實踐不過十幾年的時間,學(xué)術(shù)界對這種研究范式始終保持足夠的距離和警惕,這種研究范式還沒有形成共識。這種認(rèn)同情境來源于三個方面:第一,文學(xué)大數(shù)據(jù)研究運用的數(shù)據(jù)計量分析、實證性方法與文學(xué)的審美性、精神性特征相沖突,削減了文學(xué)的人文價值。人們擔(dān)心對“計算”方法的推崇,會使文學(xué)研究滑向技術(shù)中心主義,形成算法霸權(quán),成為技術(shù)的注腳,喪失自身的獨立性。因而,這種研究范式“對于文學(xué)研究而言,卻只能是一種手段和工具,研究者的才情、趣味、智性決定了研究的深度和走向”。(59)第二,文學(xué)大數(shù)據(jù)研究的根基是數(shù)據(jù)庫和計算技術(shù),只有不斷優(yōu)化和更新相關(guān)計算技術(shù),才能推進(jìn)文學(xué)大數(shù)據(jù)研究的深入發(fā)展。一旦計算技術(shù)更新緩慢或停滯不前,這種研究范式也將處于懸停狀態(tài)。因而人們對這種研究范式的長效性持懷疑態(tài)度,“是否能夠從歷史的長線來對文學(xué)史現(xiàn)象和作家作品做出相對超越性的評價,是存有疑問和不無難度的”。(60)第三,文學(xué)大數(shù)據(jù)研究需要研究者熟練掌握和運用計算技術(shù),而計算技術(shù)體系和理論結(jié)構(gòu)較為復(fù)雜,涉及數(shù)字化技術(shù)、數(shù)據(jù)管理技術(shù)和數(shù)據(jù)分析技術(shù)等多個層面,僅文本挖掘技術(shù)就涉及信息抽取、文本分類、文本聚類、關(guān)聯(lián)規(guī)則和模式發(fā)現(xiàn)等眾多方面,相關(guān)的計算軟件更是種類繁多。對人文學(xué)者而言,想要短期內(nèi)掌握計算技術(shù),且能夠熟練使用計算軟件,存在較大難度。而能夠獨立“運用計算方法解答、探討或是思索人文問題的研究者”(61)更是寥寥無幾。這就不難理解為何大部分文學(xué)大數(shù)據(jù)研究都集中在理論反思和論爭層面,很少拓展到計算技術(shù)分析層面。

文學(xué)大數(shù)據(jù)研究是一種跨學(xué)科研究方法,它與統(tǒng)計學(xué)、信息管理學(xué)和計算機(jī)科學(xué)等其他學(xué)科有直接關(guān)聯(lián)。同時,文學(xué)也以其獨特的人文特性反思文學(xué)大數(shù)據(jù)本身的價值和意義,實現(xiàn)文學(xué)與數(shù)據(jù)和計算之間的多重互動。在此意義上,文學(xué)大數(shù)據(jù)研究具有明顯的交叉學(xué)科研究特征,它“促使各人文學(xué)科突破學(xué)科邊界,加強(qiáng)不同學(xué)科理論與方法的交流與合作”。(62)這就決定了研究者需要進(jìn)行跨學(xué)科、跨專業(yè)的協(xié)同創(chuàng)新研究。但當(dāng)前文學(xué)大數(shù)據(jù)研究還沒有真正實現(xiàn)跨學(xué)科研究,文學(xué)研究者的關(guān)注點集中在文學(xué)大數(shù)據(jù)研究的人文反思上,其他學(xué)科的研究者聚焦在計算技術(shù)上,二者處于不同的研究向度,無法真正交融在一起。類似陳大康、錢鋒、劉石、趙薇等學(xué)者能夠?qū)崿F(xiàn)二者之間的融合,是因為他們本身具有跨學(xué)科背景和扎實的數(shù)學(xué)功底,能夠熟知計算原理,獨立構(gòu)建數(shù)學(xué)模型和使用計算工具。但大部分研究者仍在技術(shù)外圍摸索和徘徊。這種局面的形成與國內(nèi)數(shù)字人文專業(yè)設(shè)置和相關(guān)教學(xué)環(huán)節(jié)薄弱密切相關(guān)。目前,只有中國人民大學(xué)信息資源管理學(xué)院在圖書情報與檔案管理一級學(xué)科下,設(shè)立了數(shù)字人文二級學(xué)科。而根據(jù)國家數(shù)字人文組織聯(lián)盟統(tǒng)計,在2007—2014年期間,國外設(shè)置數(shù)字人文專業(yè)的高校多達(dá)180余所,(63)并形成了從本科到研究生完備的培養(yǎng)體系。(64)而且,國內(nèi)外高校在相關(guān)課程設(shè)置方面也有較大差距。截止到2020年,開設(shè)數(shù)字人文相關(guān)課程的美國高校就有41所,(65)包括斯坦福大學(xué)、耶魯大學(xué)和伊利諾伊大學(xué)香檳分校等世界知名高校。而國內(nèi)只有清華大學(xué)、北京大學(xué)、武漢大學(xué)、西安交通大學(xué)、汕頭大學(xué)、南京大學(xué)、上海師范大學(xué)等少數(shù)高校開設(shè)了數(shù)字人文課程。同時,在課程的數(shù)量、教學(xué)體系建設(shè)和實踐應(yīng)用方面,國內(nèi)外也存在較大差距。國內(nèi)數(shù)字人文研究中心和人文計算實驗室建設(shè)推進(jìn)緩慢,只有武漢大學(xué)、清華大學(xué)和上海師范大學(xué)等為數(shù)不多的高校成立了數(shù)字人文研究中心。而國外的數(shù)字人文研究中心和實驗室多達(dá)百余家,并且不斷輸出學(xué)術(shù)成果。(66)尤其是斯坦福文學(xué)實驗室、倫敦國王學(xué)院數(shù)字人文實驗室、耶魯大學(xué)數(shù)字人文實驗室和普林斯頓數(shù)字人文中心在世界范圍內(nèi)都產(chǎn)生了重要影響力。

雖然文學(xué)大數(shù)據(jù)研究還存在諸多困境,但不能就此否認(rèn)它的價值。除了為當(dāng)代文學(xué)研究提供新的研究技術(shù)和方法,也為文學(xué)研究共同體的形成提供了可能性和實踐路徑。謝剛、江震龍在《現(xiàn)代中國民族文學(xué)觀與共同體詩學(xué)建構(gòu)》一文中深入闡釋了民族文學(xué)共同體意識和共同體詩學(xué),認(rèn)為其實質(zhì)“是一與多、己與群、局部與整體、差異性與共同性的辯證統(tǒng)一”,(67)并體現(xiàn)為民族審美共同體意識、辯證的詩學(xué)特征、包容共生的文學(xué)倫理觀和以人民為中心的民族文藝本質(zhì)。謝剛、江震龍對共同體意識和共同體詩學(xué)的理論建構(gòu)深刻而透徹,既沒有完全模仿西方的共同體理論,也沒有拘泥于中國傳統(tǒng)的共同體觀念,而是在中西理論之間尋找到恰切的平衡點。或者說,是站在中國文學(xué)的立場上構(gòu)建世界文學(xué)的共同體意識和詩學(xué),因此具有很強(qiáng)的理論價值和實踐參考意義。按照謝剛、江震龍的邏輯推論,文學(xué)研究共同體的實質(zhì)也是“多”與“一”的辯證關(guān)系。而當(dāng)代文學(xué)研究沒能處理好這種辯證關(guān)系,走向了共同體的反面。當(dāng)下反全球化和逆全球化思潮在不同領(lǐng)域設(shè)置了構(gòu)建共同體的壁壘。或者說,共同體和反共同體在發(fā)生機(jī)制、運作模式和實踐路徑等方面遵循相同的原則和規(guī)律,二者之間的界限既涇渭分明又曖昧模糊。這種共同體危機(jī)意識和反共同體情態(tài)也在當(dāng)代文學(xué)研究中存在,以文學(xué)研究范式的斷裂、顛覆和重建為表征,具體體現(xiàn)為文學(xué)政治研究、文學(xué)社會研究、文學(xué)歷史研究、文學(xué)審美研究和文學(xué)技術(shù)研究幾種研究范式之間的矛盾及研究范式的內(nèi)部沖突?;诖?,當(dāng)代文學(xué)研究史可以看作文學(xué)研究共同體與反共同體的關(guān)系史。但關(guān)鍵問題不是幾種研究范式是如何斷裂的,而是如何繼承和轉(zhuǎn)換的。一種研究范式的興起如何從另一種消隱的研究范式中汲取有價值的資源。也就是說,文學(xué)大數(shù)據(jù)研究的興起并不全然意味著原有研究范式的失效,而是研究范式之間的整合和重組。文學(xué)大數(shù)據(jù)研究的實質(zhì)是從數(shù)據(jù)角度挖掘和呈現(xiàn)文學(xué)新變,但新變不是顛覆文學(xué)的審美性和精神性特質(zhì),而是以數(shù)據(jù)進(jìn)一步證實和豐富文學(xué)的審美性和精神性,并發(fā)現(xiàn)其中的新內(nèi)容、新樣態(tài)和新趨勢。文學(xué)研究應(yīng)在數(shù)據(jù)技術(shù)加持下變得更客觀、理性,更符合當(dāng)下對文學(xué)研究提出的要求。文學(xué)大數(shù)據(jù)研究建構(gòu)的技術(shù)化研究秩序不是劃出文學(xué)研究的固定邊界,而是提倡文學(xué)研究的敞開性,為人文與科技共同體搭建一條順暢通道。我們提倡的文學(xué)研究共同體意識,針對的不僅是反共同體觀念,而是以共同體意識為根基,接續(xù)和重建不同研究范式之間的內(nèi)在關(guān)聯(lián),“借以窺探某一歷史時刻的集體性是什么,它的需求是什么,它的矛盾性何在,它的問題何在等問題”,(68)尋找解決原有文學(xué)研究范式癥結(jié)的路徑,從而建立不同文學(xué)研究范式之間的結(jié)構(gòu)關(guān)系,因為“它們既有聯(lián)系又有差異,共同推進(jìn)文學(xué)創(chuàng)作和文學(xué)研究的發(fā)展”。(69)而且,一種新的文學(xué)研究范式的價值不僅體現(xiàn)在方法論層面,更體現(xiàn)在價值論層面。在不同研究范式之間尋求價值觀的最大公約數(shù),在此基礎(chǔ)上構(gòu)建當(dāng)今社會具有引領(lǐng)作用的價值觀,這是推進(jìn)當(dāng)代文學(xué)研究發(fā)展的重要前提條件之一。在此意義上,當(dāng)代文學(xué)研究范式轉(zhuǎn)型絕不是線性時間鏈條上的替代問題,而是不同研究范式在對話中的相互補(bǔ)充和再造。它既是當(dāng)下的又是歷史的也是未來的,但絕不是唯一的、霸權(quán)的和僵化的。