用戶登錄投稿

中國(guó)作家協(xié)會(huì)主管

文學(xué)數(shù)據(jù)有了“統(tǒng)一說(shuō)明書(shū)”!帶你輕松讀懂全國(guó)首個(gè)文學(xué)數(shù)據(jù)團(tuán)體標(biāo)準(zhǔn)
來(lái)源:中國(guó)作家網(wǎng) |   2025年04月29日10:30

當(dāng)文學(xué)遇見(jiàn)數(shù)據(jù),是無(wú)序生長(zhǎng)還是有序綻放?在數(shù)字技術(shù)重塑文化版圖的今天,文學(xué)創(chuàng)作的靈感碎片、研究領(lǐng)域的海量文獻(xiàn)等正以前所未有的速度轉(zhuǎn)化為數(shù)據(jù)洪流。近日,《文學(xué)數(shù)據(jù)管理與應(yīng)用總體要求》團(tuán)體標(biāo)準(zhǔn)(以下簡(jiǎn)稱(chēng)“文學(xué)數(shù)據(jù)團(tuán)體標(biāo)準(zhǔn)”)發(fā)布,相信不少讀者都在好奇這到底是什么。下面讓我們用6個(gè)Q&A走進(jìn)文學(xué)數(shù)據(jù)的新世界吧!

Q

這個(gè)“文學(xué)數(shù)據(jù)團(tuán)體標(biāo)準(zhǔn)”到底是啥?誰(shuí)制定的?

A

它是全國(guó)首個(gè)專(zhuān)門(mén)給“文學(xué)數(shù)據(jù)”定規(guī)矩的“操作指南”。

簡(jiǎn)單說(shuō),是由中國(guó)標(biāo)準(zhǔn)化協(xié)會(huì)牽頭,結(jié)合中國(guó)現(xiàn)代文學(xué)館、浙江文學(xué)館等“先行玩家”的經(jīng)驗(yàn),專(zhuān)門(mén)為文學(xué)數(shù)據(jù)管理量身定制的一套標(biāo)準(zhǔn)。就像圖書(shū)館要給圖書(shū)分類(lèi)、超市要統(tǒng)一商品條形碼,文學(xué)領(lǐng)域里的各種數(shù)據(jù)(比如作家檔案、作品手稿、文學(xué)活動(dòng)記錄等),以后都要按這套標(biāo)準(zhǔn)來(lái)“收集、整理、存儲(chǔ)、使用”,讓全國(guó)的文學(xué)數(shù)據(jù)能“說(shuō)同一種語(yǔ)言”。

Q

為什么以前沒(méi)有,現(xiàn)在突然需要這個(gè)標(biāo)準(zhǔn)了?

A

因?yàn)橐郧暗奈膶W(xué)數(shù)據(jù)管理太“亂”了!舉兩個(gè)例子:

1.數(shù)據(jù)“各玩各的”:比如記錄“魯迅的文學(xué)地圖”,有的館只記“代表作”,有的館記“手稿去向”“讀者評(píng)論”,字段不統(tǒng)一,全國(guó)數(shù)據(jù)像“方言”一樣互不認(rèn)識(shí),根本沒(méi)法“拼”成一張完整的“文學(xué)地圖”。

2.空有數(shù)據(jù)卻用不上:想做一個(gè)“魯迅的文學(xué)地圖”的項(xiàng)目,但各地?cái)?shù)據(jù)格式五花八門(mén),光收集數(shù)據(jù)就得花幾年,更別說(shuō)搞數(shù)字展陳、智能創(chuàng)作了。

3.不能讓AI一本正經(jīng)地胡說(shuō)八道。AI太猛了,但會(huì)出現(xiàn)“幻覺(jué)”,它說(shuō)的對(duì)錯(cuò)好壞都靠數(shù)據(jù)喂養(yǎng)。有標(biāo)準(zhǔn)才有高純度高質(zhì)量的數(shù)據(jù)。

現(xiàn)在有了標(biāo)準(zhǔn):就像給數(shù)據(jù)裝上“統(tǒng)一插頭”,不管是各地的文學(xué)館還是其他的文學(xué)平臺(tái),數(shù)據(jù)都能“即插即用”,效率飆升!

Q

誰(shuí)會(huì)用到這個(gè)“文學(xué)數(shù)據(jù)團(tuán)體標(biāo)準(zhǔn)”?和我有關(guān)系嗎?

A

當(dāng)然有關(guān)系!分三類(lèi)“用戶”:

1. “主角玩家”:各地文學(xué)館(比如中國(guó)現(xiàn)代文學(xué)館、地方文學(xué)館),以后建數(shù)據(jù)庫(kù)、做數(shù)字化項(xiàng)目,直接按標(biāo)準(zhǔn)“抄作業(yè)”;

2. “關(guān)聯(lián)玩家”:出版社、高校、文創(chuàng)公司,比如用標(biāo)準(zhǔn)數(shù)據(jù)做文學(xué)研究、開(kāi)發(fā)數(shù)字藏品;

3. “普通玩家”:你我這樣的文學(xué)愛(ài)好者!未來(lái)查資料、逛虛擬文學(xué)展、甚至用AI生成個(gè)性化書(shū)單,都離不開(kāi)這套標(biāo)準(zhǔn)打下的基礎(chǔ)~

Q

“文學(xué)數(shù)據(jù)團(tuán)體標(biāo)準(zhǔn)”里具體說(shuō)了啥?真的能“手把手教學(xué)”嗎?

A

放心,不是“天書(shū)”,而是分步驟完成的,挑幾個(gè)關(guān)鍵環(huán)節(jié)說(shuō)說(shuō):

1. 收集數(shù)據(jù):像“收快遞”一樣分門(mén)別類(lèi)

線上線下一起收:線上抓作品信息、媒體報(bào)道,線下掃手稿、古籍的圖片、音頻(比如魯迅手稿的高清掃描件)。

版權(quán)要規(guī)范:不能隨便拿別人的資料,得按規(guī)定獲取授權(quán),保護(hù)知識(shí)產(chǎn)權(quán)。

2. 整理數(shù)據(jù):給數(shù)據(jù)“貼標(biāo)簽、建檔案”

分類(lèi)像整理書(shū)架:可以根據(jù)文學(xué)數(shù)據(jù)的內(nèi)容和特點(diǎn)來(lái)分類(lèi),比如按數(shù)據(jù)對(duì)象分為作家、作品、文學(xué)地標(biāo)、活動(dòng)等,按數(shù)據(jù)門(mén)類(lèi)可以分為小說(shuō)、詩(shī)歌、散文、劇本、其他文學(xué)作品數(shù)據(jù);除了內(nèi)容特點(diǎn),還可以根據(jù)數(shù)據(jù)結(jié)構(gòu)來(lái)分類(lèi),分為結(jié)構(gòu)化數(shù)據(jù)(通常為表格形式)、半結(jié)構(gòu)化數(shù)據(jù)(常見(jiàn)的有html網(wǎng)頁(yè)和社交媒體數(shù)據(jù)等)和非結(jié)構(gòu)化數(shù)據(jù)(圖片、視頻,比如文學(xué)活動(dòng)現(xiàn)場(chǎng)錄像)存好。

3. 存儲(chǔ)數(shù)據(jù):給數(shù)據(jù)建“智能倉(cāng)庫(kù)”

不同數(shù)據(jù)住不同“房間”:結(jié)構(gòu)化數(shù)據(jù)(表格)存數(shù)據(jù)庫(kù),非結(jié)構(gòu)化數(shù)據(jù)(圖片視頻)存素材庫(kù),像圖書(shū)館分“工具書(shū)區(qū)”和“音像區(qū)”。

安全第一:定期備份,加密存儲(chǔ),防止數(shù)據(jù)丟失或泄露(比如讀者個(gè)人信息要重點(diǎn)保護(hù))。

4. 用數(shù)據(jù)“搞事情”:玩轉(zhuǎn)“文學(xué)+科技”

統(tǒng)計(jì)監(jiān)測(cè):實(shí)現(xiàn)數(shù)據(jù)的瀏覽、檢索、分析、統(tǒng)計(jì),并強(qiáng)化數(shù)據(jù)庫(kù)管理,進(jìn)行自動(dòng)化數(shù)據(jù)質(zhì)量監(jiān)控。

數(shù)字互動(dòng):利用文學(xué)數(shù)據(jù)進(jìn)行線上線下數(shù)字展陳(可結(jié)合3D建模、多媒體、數(shù)字人、AI 等技術(shù))和智能交互(包括進(jìn)行媒體宣傳、建立公眾服務(wù)平臺(tái)、利用數(shù)字人/AI建立文學(xué)智能體提供運(yùn)營(yíng)輔助和游客互動(dòng)服務(wù)等)。鼓勵(lì)文學(xué)場(chǎng)館間的數(shù)據(jù)共享和信息互聯(lián)。

研究開(kāi)發(fā):通過(guò)??薄Ⅻc(diǎn)校、考證等方式進(jìn)行研究,并鼓勵(lì)通過(guò)數(shù)據(jù)分析進(jìn)行能輔助創(chuàng)作,通過(guò)文學(xué)數(shù)據(jù)內(nèi)容提取、元素組合和現(xiàn)代科技結(jié)合等方式進(jìn)行文創(chuàng)產(chǎn)品開(kāi)發(fā)。

Q

對(duì)我這種普通讀者,具體有啥好處?

A

舉兩個(gè)“真香”場(chǎng)景:

1.查資料更爽了:以前查“張愛(ài)玲所有作品版本”要跑多個(gè)館的網(wǎng)站,以后全國(guó)文學(xué)數(shù)據(jù)互通,一鍵搜索就能看到她的手稿照片、初版封面、評(píng)論文章合集; 還可以利用數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能輔助等技術(shù)進(jìn)行研究;

2. 逛展像玩游戲:去文學(xué)館看展,掃碼就能觸發(fā)“AR特效”,和你喜歡的作家作品互動(dòng),參與感拉滿,真正地讓文學(xué)“活”在當(dāng)下!

Q

這一“破冰之舉”,到底“破”了什么冰?

A

兩大“破冰”意義:

1.填補(bǔ)全國(guó)空白:以前文學(xué)數(shù)據(jù)領(lǐng)域一直“沒(méi)規(guī)矩”,這個(gè)標(biāo)準(zhǔn)是全國(guó)首個(gè)覆蓋“數(shù)據(jù)采集→應(yīng)用”全流程的文件,相當(dāng)于給文學(xué)數(shù)字化鋪了第一條“高速公路”;

2.未來(lái)升級(jí)國(guó)標(biāo):團(tuán)體標(biāo)準(zhǔn)成熟后,可能被采納為“國(guó)家標(biāo)準(zhǔn)”,推動(dòng)整個(gè)行業(yè)從“零散管理”走向“智能互聯(lián)”。以后各地建設(shè)文學(xué)項(xiàng)目,可以直接按標(biāo)準(zhǔn)起步。

總之,這是一場(chǎng)讓“文學(xué)活起來(lái)”的改革!

以前,文學(xué)數(shù)據(jù)藏在各地場(chǎng)館的 “抽屜” 里;現(xiàn)在,有了統(tǒng)一標(biāo)準(zhǔn),它們能變成“共享資源庫(kù)”,被分析、被應(yīng)用、被創(chuàng)新。無(wú)論是保護(hù)經(jīng)典文獻(xiàn),還是用AI催生新創(chuàng)作,這個(gè)標(biāo)準(zhǔn)都在打基礎(chǔ)、搭橋梁。

你期待未來(lái)用這套標(biāo)準(zhǔn)“解鎖”哪些文學(xué)新體驗(yàn)?歡迎留言聊聊~