用戶登錄投稿

中國作家協(xié)會主管

AI創(chuàng)作出百萬字小說,“人人皆能寫長篇”不再是夢 ——華東師范大學教授王峰談《天命使徒》
來源:光明日報 | 劉江偉  2024年07月06日09:32

編者按:

2024年6月22日,本版刊發(fā)一組文章,在理論層面從不同維度探討了人工智能(AI)寫作帶給網(wǎng)絡文學的影響。事實上,國內(nèi)已有成功使用人工智能創(chuàng)作網(wǎng)絡小說的實踐:《天命使徒》長達100萬字,使人工智能創(chuàng)作長篇文學成為現(xiàn)實;《機憶之地》匿名參加科幻文學大賽,在評委不知情的情況下獲二等獎。本期繼續(xù)圍繞人工智能寫作與網(wǎng)絡文學的話題進行討論,兩篇人工智能小說的創(chuàng)作談表達了未來人工智能網(wǎng)絡文學創(chuàng)作的豐富前景,而青年評論家康春華則從兩篇小說的文本出發(fā),指出了人工智能小說創(chuàng)作所面臨的難以逾越的難關和障礙。

人工智能在短篇文學尤其是詩歌創(chuàng)作上有所建樹,但超長文本創(chuàng)作一直未能實現(xiàn)。這幾年人工智能技術突飛猛進地迭代,人工智能文學創(chuàng)作也在不斷打開新的可能。

近日,華東師范大學教授王峰團隊取得一項重大突破——他們成功創(chuàng)作出一部百萬字的人工智能小說《天命使徒》,標志著人工智能在長篇文學創(chuàng)作方面邁出重要一步。

《天命使徒》采用“國內(nèi)人工智能大語言模型(以下簡稱“大模型”)+提示詞工程+人工后期潤色”的方式完成,整部小說超過110萬字。一個勤奮的網(wǎng)絡作家寫作如此篇幅的小說大約需要一年,而人工智能機寫僅用了一個半月。王峰團隊的下一個目標是將這一時間縮短為兩至三周。

“文學正經(jīng)歷著飛速的變化。我們在暢想未來的時候,很可能也正在見證某些奇跡的發(fā)生?!蓖醴迦缡潜磉_著人工智能網(wǎng)絡文學創(chuàng)作的前景。

記者:《天命使徒》講了什么樣的故事?它是怎樣被創(chuàng)作出來的?

王峰:《天命使徒》描寫了修仙者周青不斷發(fā)現(xiàn)自我,在黑暗和光明兩極間搖擺,最后犧牲自我,不再做孤獨的守護者,而要做一個與所愛之人共享平凡日常的普通人的故事。人工智能小說,不是全部脫離人,而是人機協(xié)作,整體結構由人決定,細節(jié)描寫由人工智能完成,這是一種新的創(chuàng)意寫作方式。在創(chuàng)作時,我們首先對網(wǎng)絡小說的結構進行了深入研究,分析情節(jié)脈絡,撰寫大量提示詞,然后在人工智能大模型中批量生成內(nèi)容,形成整體線索連貫的長篇小說。后期通過人工介入,對大模型生成的小說進行修改,刪除重復、累贅的部分,為情節(jié)跳躍的部分撰寫連接語句,最終打磨成型。

記者:小說呈現(xiàn)了什么樣的風格,是否實現(xiàn)了預期效果?

王峰:小說整體線索能夠保持一致,語言具備了一定的文學性,比如開頭這樣寫道:“他緊張地握緊了手中的武器,指尖在冰冷的金屬中尋找一絲安慰。他的心跳如同在狂風中的鼓點,敲擊著他的胸膛。儀式即將開始,他需要做的,就是走向山谷中心的火光處?!钡牵诩毠?jié)方面還存在大量跳躍和重復之處,需要人工修改。比如,大模型對每個提示詞的生成內(nèi)容都是有始有終的,會為每次生成內(nèi)容添加一個結尾,我們稱之為“光明的尾巴”,這個就需要后期調整。在語言上,人工智能小說表現(xiàn)出一種愣呼呼的風格,不少大模型生成的作品都是論文腔,我們只能不斷微調本地大模型來提升表達水平。下一步我們會訓練出一個專注于文學(小說)創(chuàng)作的大模型,讓“人人皆可寫作長篇”成為可能。

記者:人工智能會根據(jù)提示詞順利生成適合的內(nèi)容嗎?創(chuàng)作過程中做了哪些調整?

王峰:提示詞被業(yè)界親切地稱為“耳語者”,要提供情節(jié)、環(huán)境、人物情緒及事件等信息。一開始,我們希望大模型能夠生成符合我們期望的文本結果,但現(xiàn)實是大模型的生成結果往往顯得有些“失控”。我們努力進行控制,但很快發(fā)現(xiàn),幾乎所有的控制都無法完成任務。提示詞長了不行,短了也不行。將提示詞輸入大模型時,每次生成的內(nèi)容都不一樣,如果重復輸入六七次,所生成的內(nèi)容就開始重復出現(xiàn)了,這讓我們感到有些手足無措。后來我們領悟到:既然無法完全控制大模型的輸出,何苦一味追求符合自己完美構想的結果呢?這或許正是大模型本身的特點。“失控”不是它的缺點,而是它的變量,試圖讓它按照我們的期望產(chǎn)生完美的文本結果幾乎是不可能的。所以,我們不斷調整提示詞內(nèi)容,只為小說提供一個大致走向,使情節(jié)保持連續(xù)性,而具體故事細節(jié)就交給了大模型。

記者:為什么說超長文本輸出仍是人工智能的局限?未來的人工智能小說創(chuàng)作將是什么樣的圖景?

王峰:目前,人工智能創(chuàng)作仍是一問一答的形式,無法實現(xiàn)持續(xù)輸出,我們要源源不斷提供提示詞。對每個提示詞,國內(nèi)大模型平均會生成500字的內(nèi)容,所以創(chuàng)作100萬字的小說,就要提供2000個提示詞。其實,大模型的長文本處理能力主要體現(xiàn)在其閱讀理解能力上,它首先要理解我們的創(chuàng)作意圖,然后生成連貫性的語句。

技術是快速迭代的,隨著更多大模型的研發(fā)應用,超長文本輸出和人工智能閱讀理解能力將不是問題。舉個例子說,我大約在三年前開始組建團隊,探索智能寫作的方法。當時,邀請了計算機、文學、語言、哲學、古籍、數(shù)學、地理等多個領域的研究者共同探討,基于當時的大模型技術制定了創(chuàng)作方案。但是,2022年底,國外某個大模型的換代升級給我們先前的設計帶來巨大沖擊,曾經(jīng)的很多問題不再是問題。眼下人工智能技術如龍卷風般迭代,我相信現(xiàn)在的很多困惑和難題將來都會迎刃而解。

目前,人工智能在文藝創(chuàng)作上主要影響網(wǎng)絡文學,因為網(wǎng)絡文學寫作模式化、類型化比較強,寫作者可以借助大模型的幫助進行各個部分的細節(jié)寫作,比如人物生成、物品生成、人物關系圖譜生成、段落寫作等。這些功能都已經(jīng)實現(xiàn),只是質量還不高,留有相當大的探索空間。

記者:很多人擔心人工智能創(chuàng)作的版權問題。您怎么看待這個問題?

王峰:關于人工智能創(chuàng)作的版權問題,業(yè)界正在探討。我個人理解大致可分為兩個方面:一是訓練語料的問題,二是生成產(chǎn)品的歸屬問題。前者目前是最主要的瓶頸,首先我們需要獲得公開語料,并對其進行進一步加工,這在研究范圍內(nèi)是允許的。如果進行商業(yè)化運作,就存在備案等問題,我認為一定要尋找大模型發(fā)展與語料權利保護的平衡點。至于后一個問題,生成的產(chǎn)品著作權到底是部分歸智能平臺部分歸個人,還是全部歸個人,要看具體的約定。這些都是未來智能寫作無法避開的問題,需要研究者和實踐者共同探討。