用戶登錄投稿

中國(guó)作家協(xié)會(huì)主管

AI創(chuàng)作出百萬字小說,“人人皆能寫長(zhǎng)篇”不再是夢(mèng) ——華東師范大學(xué)教授王峰談《天命使徒》
來源:光明日?qǐng)?bào) | 劉江偉  2024年07月06日09:32

編者按:

2024年6月22日,本版刊發(fā)一組文章,在理論層面從不同維度探討了人工智能(AI)寫作帶給網(wǎng)絡(luò)文學(xué)的影響。事實(shí)上,國(guó)內(nèi)已有成功使用人工智能創(chuàng)作網(wǎng)絡(luò)小說的實(shí)踐:《天命使徒》長(zhǎng)達(dá)100萬字,使人工智能創(chuàng)作長(zhǎng)篇文學(xué)成為現(xiàn)實(shí);《機(jī)憶之地》匿名參加科幻文學(xué)大賽,在評(píng)委不知情的情況下獲二等獎(jiǎng)。本期繼續(xù)圍繞人工智能寫作與網(wǎng)絡(luò)文學(xué)的話題進(jìn)行討論,兩篇人工智能小說的創(chuàng)作談表達(dá)了未來人工智能網(wǎng)絡(luò)文學(xué)創(chuàng)作的豐富前景,而青年評(píng)論家康春華則從兩篇小說的文本出發(fā),指出了人工智能小說創(chuàng)作所面臨的難以逾越的難關(guān)和障礙。

人工智能在短篇文學(xué)尤其是詩歌創(chuàng)作上有所建樹,但超長(zhǎng)文本創(chuàng)作一直未能實(shí)現(xiàn)。這幾年人工智能技術(shù)突飛猛進(jìn)地迭代,人工智能文學(xué)創(chuàng)作也在不斷打開新的可能。

近日,華東師范大學(xué)教授王峰團(tuán)隊(duì)取得一項(xiàng)重大突破——他們成功創(chuàng)作出一部百萬字的人工智能小說《天命使徒》,標(biāo)志著人工智能在長(zhǎng)篇文學(xué)創(chuàng)作方面邁出重要一步。

《天命使徒》采用“國(guó)內(nèi)人工智能大語言模型(以下簡(jiǎn)稱“大模型”)+提示詞工程+人工后期潤(rùn)色”的方式完成,整部小說超過110萬字。一個(gè)勤奮的網(wǎng)絡(luò)作家寫作如此篇幅的小說大約需要一年,而人工智能機(jī)寫僅用了一個(gè)半月。王峰團(tuán)隊(duì)的下一個(gè)目標(biāo)是將這一時(shí)間縮短為兩至三周。

“文學(xué)正經(jīng)歷著飛速的變化。我們?cè)跁诚胛磥淼臅r(shí)候,很可能也正在見證某些奇跡的發(fā)生。”王峰如是表達(dá)著人工智能網(wǎng)絡(luò)文學(xué)創(chuàng)作的前景。

記者:《天命使徒》講了什么樣的故事?它是怎樣被創(chuàng)作出來的?

王峰:《天命使徒》描寫了修仙者周青不斷發(fā)現(xiàn)自我,在黑暗和光明兩極間搖擺,最后犧牲自我,不再做孤獨(dú)的守護(hù)者,而要做一個(gè)與所愛之人共享平凡日常的普通人的故事。人工智能小說,不是全部脫離人,而是人機(jī)協(xié)作,整體結(jié)構(gòu)由人決定,細(xì)節(jié)描寫由人工智能完成,這是一種新的創(chuàng)意寫作方式。在創(chuàng)作時(shí),我們首先對(duì)網(wǎng)絡(luò)小說的結(jié)構(gòu)進(jìn)行了深入研究,分析情節(jié)脈絡(luò),撰寫大量提示詞,然后在人工智能大模型中批量生成內(nèi)容,形成整體線索連貫的長(zhǎng)篇小說。后期通過人工介入,對(duì)大模型生成的小說進(jìn)行修改,刪除重復(fù)、累贅的部分,為情節(jié)跳躍的部分撰寫連接語句,最終打磨成型。

記者:小說呈現(xiàn)了什么樣的風(fēng)格,是否實(shí)現(xiàn)了預(yù)期效果?

王峰:小說整體線索能夠保持一致,語言具備了一定的文學(xué)性,比如開頭這樣寫道:“他緊張地握緊了手中的武器,指尖在冰冷的金屬中尋找一絲安慰。他的心跳如同在狂風(fēng)中的鼓點(diǎn),敲擊著他的胸膛。儀式即將開始,他需要做的,就是走向山谷中心的火光處?!钡?,在細(xì)節(jié)方面還存在大量跳躍和重復(fù)之處,需要人工修改。比如,大模型對(duì)每個(gè)提示詞的生成內(nèi)容都是有始有終的,會(huì)為每次生成內(nèi)容添加一個(gè)結(jié)尾,我們稱之為“光明的尾巴”,這個(gè)就需要后期調(diào)整。在語言上,人工智能小說表現(xiàn)出一種愣呼呼的風(fēng)格,不少大模型生成的作品都是論文腔,我們只能不斷微調(diào)本地大模型來提升表達(dá)水平。下一步我們會(huì)訓(xùn)練出一個(gè)專注于文學(xué)(小說)創(chuàng)作的大模型,讓“人人皆可寫作長(zhǎng)篇”成為可能。

記者:人工智能會(huì)根據(jù)提示詞順利生成適合的內(nèi)容嗎?創(chuàng)作過程中做了哪些調(diào)整?

王峰:提示詞被業(yè)界親切地稱為“耳語者”,要提供情節(jié)、環(huán)境、人物情緒及事件等信息。一開始,我們希望大模型能夠生成符合我們期望的文本結(jié)果,但現(xiàn)實(shí)是大模型的生成結(jié)果往往顯得有些“失控”。我們努力進(jìn)行控制,但很快發(fā)現(xiàn),幾乎所有的控制都無法完成任務(wù)。提示詞長(zhǎng)了不行,短了也不行。將提示詞輸入大模型時(shí),每次生成的內(nèi)容都不一樣,如果重復(fù)輸入六七次,所生成的內(nèi)容就開始重復(fù)出現(xiàn)了,這讓我們感到有些手足無措。后來我們領(lǐng)悟到:既然無法完全控制大模型的輸出,何苦一味追求符合自己完美構(gòu)想的結(jié)果呢?這或許正是大模型本身的特點(diǎn)?!笆Э亍辈皇撬娜秉c(diǎn),而是它的變量,試圖讓它按照我們的期望產(chǎn)生完美的文本結(jié)果幾乎是不可能的。所以,我們不斷調(diào)整提示詞內(nèi)容,只為小說提供一個(gè)大致走向,使情節(jié)保持連續(xù)性,而具體故事細(xì)節(jié)就交給了大模型。

記者:為什么說超長(zhǎng)文本輸出仍是人工智能的局限?未來的人工智能小說創(chuàng)作將是什么樣的圖景?

王峰:目前,人工智能創(chuàng)作仍是一問一答的形式,無法實(shí)現(xiàn)持續(xù)輸出,我們要源源不斷提供提示詞。對(duì)每個(gè)提示詞,國(guó)內(nèi)大模型平均會(huì)生成500字的內(nèi)容,所以創(chuàng)作100萬字的小說,就要提供2000個(gè)提示詞。其實(shí),大模型的長(zhǎng)文本處理能力主要體現(xiàn)在其閱讀理解能力上,它首先要理解我們的創(chuàng)作意圖,然后生成連貫性的語句。

技術(shù)是快速迭代的,隨著更多大模型的研發(fā)應(yīng)用,超長(zhǎng)文本輸出和人工智能閱讀理解能力將不是問題。舉個(gè)例子說,我大約在三年前開始組建團(tuán)隊(duì),探索智能寫作的方法。當(dāng)時(shí),邀請(qǐng)了計(jì)算機(jī)、文學(xué)、語言、哲學(xué)、古籍、數(shù)學(xué)、地理等多個(gè)領(lǐng)域的研究者共同探討,基于當(dāng)時(shí)的大模型技術(shù)制定了創(chuàng)作方案。但是,2022年底,國(guó)外某個(gè)大模型的換代升級(jí)給我們先前的設(shè)計(jì)帶來巨大沖擊,曾經(jīng)的很多問題不再是問題。眼下人工智能技術(shù)如龍卷風(fēng)般迭代,我相信現(xiàn)在的很多困惑和難題將來都會(huì)迎刃而解。

目前,人工智能在文藝創(chuàng)作上主要影響網(wǎng)絡(luò)文學(xué),因?yàn)榫W(wǎng)絡(luò)文學(xué)寫作模式化、類型化比較強(qiáng),寫作者可以借助大模型的幫助進(jìn)行各個(gè)部分的細(xì)節(jié)寫作,比如人物生成、物品生成、人物關(guān)系圖譜生成、段落寫作等。這些功能都已經(jīng)實(shí)現(xiàn),只是質(zhì)量還不高,留有相當(dāng)大的探索空間。

記者:很多人擔(dān)心人工智能創(chuàng)作的版權(quán)問題。您怎么看待這個(gè)問題?

王峰:關(guān)于人工智能創(chuàng)作的版權(quán)問題,業(yè)界正在探討。我個(gè)人理解大致可分為兩個(gè)方面:一是訓(xùn)練語料的問題,二是生成產(chǎn)品的歸屬問題。前者目前是最主要的瓶頸,首先我們需要獲得公開語料,并對(duì)其進(jìn)行進(jìn)一步加工,這在研究范圍內(nèi)是允許的。如果進(jìn)行商業(yè)化運(yùn)作,就存在備案等問題,我認(rèn)為一定要尋找大模型發(fā)展與語料權(quán)利保護(hù)的平衡點(diǎn)。至于后一個(gè)問題,生成的產(chǎn)品著作權(quán)到底是部分歸智能平臺(tái)部分歸個(gè)人,還是全部歸個(gè)人,要看具體的約定。這些都是未來智能寫作無法避開的問題,需要研究者和實(shí)踐者共同探討。