中國作家網(wǎng) > 文學報刊社 > 文藝報 > 正文
迄今為止中國最大的口頭文學遺產(chǎn)數(shù)據(jù)庫——中國口頭文學遺產(chǎn)數(shù)據(jù)庫近日正式亮相。該數(shù)據(jù)庫包含116.5萬篇(條)神話、傳說、史詩、歌謠、諺語、歇后語、謎語、民間說唱等,總字數(shù)達8.878億字,幾乎囊括了新中國成立以來我國口頭文學收集的原始資料,堪稱一部“民間四庫全書”。
自新中國成立以來,中國民間文藝家協(xié)會分別在上世紀50年代、80年代以及本世紀初,組織過三次大規(guī)模民間口頭文學的搜集和整理。這三次搜集活動耗時三四十年,先后組織了200萬人次在全國2800多個縣進行口頭文學的普查、記錄工作,獲得了巨量的民間文學原始資料。不過,這幾次搜集行動最終只出版了省級口頭文學集成著作,絕大多數(shù)縣級傳說、故事等雖然被采集回來,卻沒有機會公開出版。未能出版的原始記錄,大部分還以手抄本、油印本、鉛印本等方式保存著。
為了將這部分沉睡的資源喚醒,2010年12月30日,在作家、民間文藝家馮驥才的倡議下,中國民間文藝家協(xié)會發(fā)起了中國口頭文學數(shù)字化工程。該工程由中國民協(xié)與漢王公司合作,將這些原始資料中的圖片、文字全部數(shù)字化,并掃描每一頁記錄的原始頁面,匯成一個數(shù)據(jù)庫。數(shù)據(jù)還提供按地區(qū)、按故事主題等多種檢索方式,方便使用者利用這些資源。例如輸入“女媧補天”會得到1160多篇不同地域的人們對它的不同講述。
民間文藝家、數(shù)據(jù)庫專家劉錫誠介紹,數(shù)據(jù)庫的主體是上世紀80年代至上世紀末20年間搜集到的口頭文學資料。他表示:“20世紀最后20年是隨時處在流變之中的,民間口頭文學也像滔滔逝水隨著時代、社會的變遷而嬗變。以數(shù)字化方式較完整全面地保存這20年的中國民間口頭文學,就留下了這一風云激蕩的時間段里民間文化的活態(tài)樣相!
目前,數(shù)據(jù)庫完成了一期建設,未來將繼續(xù)數(shù)據(jù)庫的知識加工工作,進行更加詳細的分類。此外,該數(shù)據(jù)庫目前還只有光盤版,不能無償在互聯(lián)網(wǎng)上供人查詢和下載,工程領導小組正在研究如何讓該數(shù)據(jù)庫為研究者提供服務。(李 洋)