用戶登錄投稿

中國(guó)作家協(xié)會(huì)主管

人工智能的文學(xué)創(chuàng)作:實(shí)踐與問題
來源:中國(guó)社會(huì)科學(xué)報(bào) |  余靜遠(yuǎn)  2023年03月17日11:29
關(guān)鍵詞:人工智能

在阿蘭·圖靈(Alan Mathison Turing,1912—1954)、馬文·明斯基(Marvin Lee Minsky,1927—2016)和唐納德·米奇(Donald Michie,1923—2007)等先驅(qū)者的推動(dòng)下,人工智能產(chǎn)業(yè)已經(jīng)開花結(jié)果,成為今天席卷全球的人工智能革命。人工智能正在對(duì)人類的核心領(lǐng)域形成挑戰(zhàn),因?yàn)樗沂玖巳祟悘氖碌脑S多工作同樣可以由機(jī)器出色地完成,甚至完成得更好。在文學(xué)領(lǐng)域,人工智能也引發(fā)了一場(chǎng)大地震,最新一代的ChatGPT展示出了不弱于人類的想象力和創(chuàng)造力,甚至能應(yīng)人類要求,以極快的速度創(chuàng)作出高水準(zhǔn)的文學(xué)作品。這不禁讓人想起德彪西的名言:藝術(shù)作品創(chuàng)造規(guī)則;規(guī)則不創(chuàng)造藝術(shù)作品。那么,人工智能是如何影響文學(xué)創(chuàng)作的?它思考和創(chuàng)作的密碼是什么?它能與莎士比亞競(jìng)爭(zhēng)嗎?

人工智能寫作的代碼

通過與藝術(shù)互動(dòng),了解平凡和偉大的文學(xué)作品的區(qū)別,機(jī)器能不能學(xué)會(huì)文學(xué)創(chuàng)作,像我們?yōu)楹⒆訉懝适履菢泳哂袆?chuàng)造性,是作家和科學(xué)家一直在探索的課題。

1953年,羅爾德·達(dá)爾(Roald Dahl,1916—1990)在短篇故事集《出人意料的故事》(Tales of the Unexpected)中,講述了一個(gè)“偉大的自動(dòng)語法師”的故事。主人公阿道夫·克尼普是一個(gè)計(jì)算機(jī)天才,但一直渴望成為一名作家。然而,他的努力毫無成效。后來他有了一個(gè)靈感:語言遵循語法規(guī)則,在原則上基本上是數(shù)學(xué)的。有了這樣的認(rèn)識(shí),他開始著手創(chuàng)造一個(gè)巨大的機(jī)器——偉大的自動(dòng)語法分析器,這個(gè)機(jī)器能夠在15分鐘內(nèi)根據(jù)在世作家的作品寫出有獲獎(jiǎng)潛質(zhì)的小說。有了這臺(tái)機(jī)器,克尼普大獲成功,并成立了一家出版公司,作為這種新的大規(guī)模生產(chǎn)文學(xué)作品的合法機(jī)構(gòu)。他統(tǒng)治出版業(yè)的最后一步是收購(gòu)真正的作者,并付錢讓他們不再寫作。故事的結(jié)尾處,敘述者透露,“在用英語出版的所有小說和故事中,有一半以上是由阿道夫·克尼普在大型自動(dòng)語法儀上創(chuàng)作的”。

用算法生成文學(xué)作品并不新鮮。最早為計(jì)算機(jī)編寫的程序之一就是為了寫情書而開發(fā)的。在布萊切利公園破解了英格瑪密碼后,阿蘭·圖靈前往曼徹斯特大學(xué),將他的想法付諸實(shí)踐,制造出多用途計(jì)算機(jī)的物理版本。在他的指導(dǎo)下,英國(guó)皇家學(xué)會(huì)計(jì)算實(shí)驗(yàn)室很快就生產(chǎn)出了世界上第一臺(tái)商業(yè)化的通用電子計(jì)算機(jī)費(fèi)蘭蒂·馬克1號(hào),這臺(tái)計(jì)算機(jī)具有浪漫的一面,只要隨機(jī)輸入單詞,它就能生成情書。20世紀(jì)60年代,法國(guó)一些作家和數(shù)學(xué)家一起使用算法來生成新的寫作文本,這個(gè)團(tuán)體自稱為烏利波(Oulipo),意思是潛在文學(xué)工作室(Ouvroir de littérature potentielle),創(chuàng)始人之一雷蒙德·奎諾(Raymond Queneau)認(rèn)為,約束是創(chuàng)作的重要組成部分,盲目服從每一個(gè)沖動(dòng)的靈感,實(shí)際上是一種奴役,而通過對(duì)寫作施加準(zhǔn)數(shù)學(xué)約束,可以實(shí)現(xiàn)一種新的自由。該團(tuán)體的早期項(xiàng)目集中在詩歌上。任何寫過詩的人都知道,對(duì)詩歌的約束往往會(huì)將其推向新的表達(dá)方式。

正如烏利波運(yùn)動(dòng)所表明的那樣,詩歌創(chuàng)作特別適合算法的方式。詩歌形式的約束性提供了一個(gè)模板,算法可以嘗試以一種有意義的方式來填充。例如,選中俳句或十四行詩的模式后,算法的任務(wù)就是選擇與模式相匹配的詞,同時(shí)想出某種形式的總體一致性。如果用押韻的模式來寫詩,押韻的詞語數(shù)據(jù)庫就非常有用。這就是20世紀(jì)80年代由未來學(xué)家雷·庫茲韋爾(Ray Kurzweil)創(chuàng)建的控制論詩人(cybernetic poet)背后的代碼原理。庫茲韋爾以雪萊和T. S.艾略特等有成就的詩人的作品來訓(xùn)練控制論詩人。這首控制論詩人的俳句,就是根據(jù)濟(jì)慈的詩歌寫成的:“你打碎了我的靈魂。/永恒的汁液。/我嘴唇的精神?!边€有一首融合了雪萊《西風(fēng)頌》和艾略特《普魯弗洛克的情歌》風(fēng)格的詩:“秋天女士的存在。/你,從那天起,不得不關(guān)心/現(xiàn)在教我們徹底的渺小和創(chuàng)造。/然后推測(cè)?/還有這個(gè),還有我。/還有那未曾說出的話語,那未曾讀過的景象在海灣里的位置。/還有米開朗琪羅的后代?!痹趲炱濏f爾進(jìn)行的圖靈測(cè)試中,控制論詩人創(chuàng)作的詩大多數(shù)時(shí)候都能騙過人類裁判,冒充人類寫的詩。

算法不僅在創(chuàng)作詩歌方面表現(xiàn)良好,在創(chuàng)作小說方面也有所嘗試。烏利波團(tuán)隊(duì)成員約翰·萊斯庫爾(Jean Lescure)首先產(chǎn)生了將算法應(yīng)用于現(xiàn)有文學(xué)作品的想法。這一想法為全國(guó)小說創(chuàng)作月(National Novel Writing Month)的編碼員所實(shí)現(xiàn)。他們邀請(qǐng)新銳作家在一個(gè)月內(nèi)敲出5萬字來。軟件開發(fā)人員和藝術(shù)家達(dá)柳斯·卡茲米(Darius Kazmi)當(dāng)即決定,與其費(fèi)盡心思每天寫出1667個(gè)字,不如在這個(gè)月里編寫出可以生成5萬字小說的代碼。卡茲米于2013年發(fā)布在社交平臺(tái)上的這一想法,開啟了一年一度的文學(xué)黑客馬拉松。許多參加全國(guó)小說創(chuàng)作月的編碼者都通過打亂現(xiàn)有文本來創(chuàng)作新的文本,如通過推特過濾《傲慢與偏見》(Pride and Prejudice);通過科幻算法解釋《白鯨》(Moby Dick);通過代碼對(duì)古斯塔夫斯·欣曼·米勒(Gustavus Hindman Miller)的《一萬個(gè)夢(mèng)》(Ten Thousand Dreams)進(jìn)行解釋和重新排序。但引起人們注意的是一部名為《探索者》(The Seeker)的作品。這部小說記錄了一個(gè)算法通過閱讀wikiHow上的不同文章,來了解人類如何運(yùn)作的過程。該算法有一個(gè)元代碼:工作、掃描、想象、重復(fù)。在工作模式下,它搜索有關(guān)人類活動(dòng)的概念;在掃描模式下,它從工作期間遇到的種子概念中搜索純文本“記憶”;然后,它使用在掃描模式中沒有識(shí)別的概念來想象種子概念周圍的“非視覺”。《探索者》記錄了該算法在探索wikiHow數(shù)據(jù)庫時(shí)從無知到理解的發(fā)現(xiàn)之旅。它查閱的第一個(gè)頁面是“如何讓一個(gè)女孩約你出去”。從這次掃描中發(fā)現(xiàn)了“傷害”這個(gè)詞,在“想象”模式下,它產(chǎn)生了一個(gè)關(guān)于“傷害”的超現(xiàn)實(shí)翻版。這就是算法生成文學(xué)作品的最終目標(biāo):讓我們了解一種新興的意識(shí)(如果它真的出現(xiàn)的話),以及它與我們?nèi)祟惖囊庾R(shí)有什么不同。因此,目前至少可以保守地估計(jì),人工智能離創(chuàng)作偉大的文學(xué)作品還有一定距離,但在創(chuàng)作詩歌、暢銷商業(yè)書籍方面已經(jīng)相當(dāng)成熟了。

人工智能寫作的升級(jí):風(fēng)格和自由

上述多數(shù)例子都依賴于自上而下的編程模式:按照一套明確的規(guī)則隨機(jī)填寫的詩歌模板;將經(jīng)典文本轉(zhuǎn)化為新作品的代碼;通過編程將數(shù)據(jù)轉(zhuǎn)化為故事的算法。這些程序其實(shí)并不允許有太多的自由。機(jī)器學(xué)習(xí)正在改變這一點(diǎn)。現(xiàn)在,算法有可能把一個(gè)作者的整個(gè)作品拿出來,學(xué)習(xí)他們的寫作方式。通過建立一個(gè)關(guān)于作者如何用詞的概率圖,算法可以生成某個(gè)文本的延續(xù)。這就是預(yù)測(cè)性文本的工作方式。

這種利用機(jī)器學(xué)習(xí)來創(chuàng)作文學(xué)作品的想法得到了一個(gè)自稱為Botnik的團(tuán)體的實(shí)踐。這個(gè)團(tuán)體由作家杰米·布魯(Jamie Brew)和《紐約客》的前漫畫編輯鮑勃·曼考夫(Bob Mankoff)于2016年創(chuàng)立,現(xiàn)在是一個(gè)開放的作家社區(qū)。該團(tuán)體根據(jù)對(duì)過去對(duì)話的數(shù)學(xué)分析,將《宋飛正傳》(Seinfeld)的劇本制作出了新的劇集,甚至還將七卷本的《哈利·波特》進(jìn)行了改寫實(shí)驗(yàn)。這種算法的做法是:在已存在的文本基礎(chǔ)上,提供18個(gè)詞供你選擇。這給了創(chuàng)作者極大的自由,可以任意發(fā)揮自己的想象力。因?yàn)檫@種算法在創(chuàng)建文本時(shí)仍需人類的參與,而且它也只能在捕捉作家風(fēng)格的基礎(chǔ)上做出局部的改變,因此,它暫時(shí)還無法取代小說的人類創(chuàng)作者。

講故事的算法Scheherazade-IF成立于2012年,由馬克·里德爾和他在佐治亞理工學(xué)院的同事共同開發(fā)。它的目標(biāo)是在可能的故事迷宮中引導(dǎo)出一條更連貫的路徑。該算法的名字來自《一千零一夜》中的蘇丹新娘謝赫拉莎德(Scheherazade),她通過夜以繼日地想出新的故事來吸引和分散殺人的丈夫的注意力,從而挽救了自己的生命;IF則代表“互動(dòng)小說”(interactive fiction)。另一個(gè)在生成童話方面取得成功的算法是PropperWryte。它的童話算法是根據(jù)結(jié)構(gòu)主義者弗拉基米爾·普羅普(Vladimir Propp)在1928年確定的俄羅斯民間故事31種敘事原型來進(jìn)行訓(xùn)練的。

ChatGPT創(chuàng)作功能和人工智能的缺陷

2022年,美國(guó)人工智能研究公司OpenAI開發(fā)了聊天機(jī)器人ChatGPT,代表著生成性人工智能的最新發(fā)展。它通過聊天(對(duì)話)的方式進(jìn)行工作,即用戶只需在ChatGPT界面上輸入指令,可以是一個(gè)問題,一個(gè)任務(wù),或者是隨意的聊天。ChatGPT系統(tǒng)分析輸入的指令,使用機(jī)器學(xué)習(xí)算法來生成回應(yīng),然后以文本的形式返回給用戶,用戶可再次輸入文本,ChatGPT系統(tǒng)再次進(jìn)行分析和回應(yīng),這個(gè)過程可一直持續(xù)到對(duì)話結(jié)束。正是基于以上這些特性,ChatGPT的出現(xiàn)讓很多人擔(dān)憂文字生產(chǎn)者即將被淘汰。ChatGPT能寫詩,也能創(chuàng)作小說、劇本、隨筆、評(píng)論等,雖然創(chuàng)作出來的作品稍顯程序化,但大體上還是能滿足創(chuàng)作規(guī)范和要求的。

近日,筆者專門請(qǐng)?jiān)谟?guó)高校任教的朋友幫忙測(cè)試了ChatGPT的創(chuàng)作功能。例一:對(duì)ChatGPT輸入指令:以春、江、花、月、夜這五種事物,創(chuàng)作一首七言律詩。結(jié)果如下:“春風(fēng)婉轉(zhuǎn)吹江岸,花開盛放映月寒。夜色漸深思悠遠(yuǎn),水流漣漪夢(mèng)逍遙?!贝嗽婋m然難以和唐代詩人張若虛的名篇《春江花月夜》相媲美,但至少在形式和韻味上體現(xiàn)出了唐詩的特色。例二:對(duì)ChatGPT輸入指令:請(qǐng)寫一段莎士比亞風(fēng)格的獨(dú)白。結(jié)果如下:“生命是如此短暫,我不知道自己還能留在這個(gè)世界上多久。也許,我應(yīng)該像一只孤鳥一樣,飛往遠(yuǎn)方,去尋找自己的歸宿。但是,我害怕孤獨(dú),我害怕被遺棄,我害怕面對(duì)那個(gè)孤獨(dú)的夜晚。啊,人生如夢(mèng),一切都是虛幻,卻又那么真實(shí)。我不知道該如何面對(duì)這個(gè)世界,但我知道,我必須繼續(xù)前行,即使一切都已經(jīng)毀滅?!边@是不是有點(diǎn)莎士比亞的味道?

不過,ChatGPT的創(chuàng)作也有缺陷,如對(duì)數(shù)據(jù)資源的依賴、創(chuàng)造虛假信息、有立場(chǎng)偏見等。而且ChatGPT人機(jī)交互的模式也決定了人是主動(dòng)提問的一方,而機(jī)器只是生成答案;機(jī)器也許可以模仿人類的自然語言,卻無法生成人類的自我和意識(shí)。自我和意識(shí)的概念與人類的創(chuàng)造力密不可分。沒有自我和意識(shí),就沒有創(chuàng)造力。就是說,在機(jī)器變得有意識(shí)之前,它只是一種擴(kuò)展人類創(chuàng)造力的工具。人工智能是否最終變得有意識(shí),真正具有創(chuàng)造性?它的意識(shí)會(huì)和我們的意識(shí)一樣嗎?這些都是需要我們思考的問題。

或許,人類的命運(yùn)將取決于它與有意識(shí)的機(jī)器的相互理解。但是,正如維特根斯坦所說,如果一只獅子能說話,我們可能不會(huì)理解它,這同樣適用于機(jī)器。如果它們變得有意識(shí),人類也不太可能理解。最終,將是它們的繪畫、音樂、小說等創(chuàng)造性的產(chǎn)出,甚至是它們的數(shù)學(xué),讓我們有機(jī)會(huì)破解機(jī)器的密碼、感受到機(jī)器的感覺。

目前,機(jī)器的所有創(chuàng)造力都是由人類代碼發(fā)起和驅(qū)動(dòng)的。除了我們讓它們做的事情,沒有看到機(jī)器主動(dòng)地表達(dá)自己。人類用來想象和創(chuàng)新的創(chuàng)造力是人工智能永遠(yuǎn)無法觸及的能力。而且,我們還需要看到,目前人類創(chuàng)造算法的動(dòng)力,在大多數(shù)情況下不是由擴(kuò)展藝術(shù)創(chuàng)作的愿望,而是由產(chǎn)業(yè)和公司的利潤(rùn)所推動(dòng)。關(guān)于人工智能有大量的炒作,對(duì)其功能也有夸張夸大的成分。

(作者系《世界文學(xué)》編輯)