用戶登錄投稿

中國作家協(xié)會主管

AI藝術(shù)的前世今生
來源:光明日報 | 馬立新  2023年04月06日08:09
關(guān)鍵詞:AI藝術(shù) 算法

羅比·巴拉特《風(fēng)景畫》 資料圖片

湯姆·懷特《落日余暉》 資料圖片

最近,全球刮起一股強(qiáng)勁的AI藝術(shù)風(fēng)潮。究竟什么是AI藝術(shù)?它是如何來到這個世界的?又面臨著怎樣的機(jī)遇與挑戰(zhàn)?

1、AI藝術(shù)關(guān)鍵詞

AI藝術(shù)是指借助于人工智能技術(shù)(artificial intelligence,簡稱AI)生成的藝術(shù)作品。它的范圍很廣,包括AI自主生成的作品和人機(jī)合作創(chuàng)作的作品,這些作品目前已經(jīng)涵蓋繪畫、音樂、詩歌、電影、舞蹈、雕塑等領(lǐng)域。要了解這種新興、新型的數(shù)字藝術(shù),首先需要了解機(jī)器學(xué)習(xí)、算法、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、生成對抗網(wǎng)絡(luò)和創(chuàng)新對抗網(wǎng)絡(luò)這幾個重要概念。

人類借助于感官和經(jīng)驗來獲取知識,而機(jī)器學(xué)習(xí)是指計算機(jī)系統(tǒng)學(xué)習(xí)勝任某一專門任務(wù)的路徑:一種是通過與具體任務(wù)完成情況相關(guān)的獎懲機(jī)制來實現(xiàn),這種機(jī)制稱為強(qiáng)化學(xué)習(xí);一種是通過飼喂大量標(biāo)記數(shù)據(jù),首先掌握其中的邏輯,進(jìn)而實現(xiàn)對相關(guān)信息或事物的再現(xiàn),這種機(jī)制稱為監(jiān)護(hù)學(xué)習(xí)。例如飼喂一組猴子圖像讓計算機(jī)學(xué)習(xí)識別猴子,當(dāng)我們將一張照片放在它前面的時候,計算機(jī)能精確地判斷這張照片是否與猴子有關(guān)。

算法即一個按步驟執(zhí)行的指令序列。它可以簡單到幾行代碼,也可能復(fù)雜得像一個百度搜索結(jié)果那樣,需要上百萬行才能顯示完全。這些指令告訴計算機(jī)做什么,如何解決問題,怎樣運算,如何在屏幕上展示事物等。

神經(jīng)元是傳遞和處理感覺信息的人腦細(xì)胞。神經(jīng)網(wǎng)絡(luò)則是特指一種計算機(jī)算法,它模仿人腦方式處理各種信息,包括多層互相聯(lián)結(jié)的神經(jīng)元。神經(jīng)網(wǎng)絡(luò)算法不同于常規(guī)計算機(jī)編程算法,后者是編程者設(shè)計好的一系列供計算機(jī)執(zhí)行的程序,而前者則是一種計算機(jī)自我決策的運算機(jī)制,它不需要人類的任何指令。如卷積神經(jīng)網(wǎng)絡(luò)就是一種能夠自主識別圖像上的某一特征或模式的神經(jīng)網(wǎng)絡(luò)。

深度學(xué)習(xí)指的是包含多層聯(lián)結(jié)神經(jīng)元的神經(jīng)網(wǎng)絡(luò)。它就像人腦一樣,包含的神經(jīng)元層級越多,學(xué)習(xí)能力就越強(qiáng)。

生成對抗網(wǎng)絡(luò)(GAN)指兩個神經(jīng)網(wǎng)絡(luò)通過互相競爭,逐步實現(xiàn)一個可預(yù)期的結(jié)果,其中一個神經(jīng)網(wǎng)絡(luò)試圖生成與訓(xùn)練數(shù)據(jù)不一樣的結(jié)果(通常被稱為創(chuàng)造神經(jīng)網(wǎng)絡(luò)),比如一張不同于訓(xùn)練圖像的新照片;另一個神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)識別創(chuàng)造神經(jīng)網(wǎng)絡(luò)生成的與訓(xùn)練數(shù)據(jù)差異很大的結(jié)果(通常被稱為識別神經(jīng)網(wǎng)絡(luò)),比如創(chuàng)造神經(jīng)網(wǎng)絡(luò)預(yù)期是生成一張關(guān)于狗的新照片,如果輸出了一張貌似房子的圖像,識別神經(jīng)網(wǎng)絡(luò)就將其篩選出來,并反饋給創(chuàng)造神經(jīng)網(wǎng)絡(luò),從而確保其朝著預(yù)期的創(chuàng)作目標(biāo)前進(jìn)。

創(chuàng)新對抗網(wǎng)絡(luò)(CAN)以生成對抗網(wǎng)絡(luò)為基本框架,但將一定的隨機(jī)性嵌入到創(chuàng)造神經(jīng)網(wǎng)絡(luò)的結(jié)果中,再對這些結(jié)果加入適當(dāng)?shù)拿缹W(xué)判斷訓(xùn)練機(jī)制,以期生成更為新穎和震撼的藝術(shù)作品。這顯然是模仿人類創(chuàng)造性的一種方式,目的是生成突破現(xiàn)有藝術(shù)風(fēng)格和模式的藝術(shù)作品。

2、從貝葉斯推理到AI藝術(shù)

當(dāng)我們談?wù)揂I藝術(shù)淵藪的時候,就必須首先從AI的歷史談起。AI發(fā)生的先決條件是獲得學(xué)習(xí)和決策的能力,特別是在信息不充分的情況下做出決策的能力。為此,托馬斯·貝葉斯于1763年開發(fā)了一個使用算數(shù)方法推算事物發(fā)生概率的框架,這就是著名的貝葉斯推理,它成為機(jī)器學(xué)習(xí)的基本邏輯,這是AI藝術(shù)進(jìn)程中最早的一塊里程碑。

1842年,數(shù)學(xué)家阿達(dá)·洛夫萊斯發(fā)表了第一個可執(zhí)行的算法。洛夫萊斯算法預(yù)見到計算機(jī)除了運算,還能解決其他復(fù)雜的問題,這是一個革命性的預(yù)見。百年之后,即1942年,圖靈為智能機(jī)器的創(chuàng)造設(shè)計了測試指標(biāo),即著名的圖靈測驗,這是一種劃時代的思想。1943年,麥卡洛克和皮茨聯(lián)合發(fā)表了《人類神經(jīng)活動中意識的邏輯運算》,為計算機(jī)模仿人腦構(gòu)建神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)鋪平了道路。1950年,科幻作家艾薩克·阿西莫夫創(chuàng)作了關(guān)于智能機(jī)器的一系列短篇小說,提出了著名的機(jī)器人三定律,他的這些頗具前瞻性的思想激發(fā)了整整一代機(jī)器人學(xué)家。在1956年的達(dá)特茅斯大學(xué)夏季會議上,約翰·麥卡錫正式構(gòu)建了“人工智能(AI)”概念。當(dāng)時關(guān)于AI編程機(jī)制存在兩條路徑:一條是自上而下的,即用控制人類行為的規(guī)則預(yù)先為計算機(jī)編程;另一條主張自下而上,即模仿人類神經(jīng)網(wǎng)絡(luò)機(jī)制。麥卡錫和資深計算機(jī)學(xué)家明斯基傾向于前者,并略占上風(fēng)。1959年,阿瑟·塞繆爾提出了“機(jī)器學(xué)習(xí)”的概念,根據(jù)這一概念,他預(yù)測一個會學(xué)習(xí)的跳棋機(jī)器人有可能戰(zhàn)勝它的編程者,這一預(yù)言被后來的超級計算機(jī)“深藍(lán)”戰(zhàn)勝國際象棋冠軍卡斯帕羅夫所證實。

對于AI藝術(shù)來說,1973年值得永遠(yuǎn)銘記。這一年,加州大學(xué)教授兼畫家哈羅德·科恩在威尼斯雙年展上展示他與自己的計算機(jī)程序“艾倫”(AARON)合作創(chuàng)作的一幅繪畫,這標(biāo)志著AI藝術(shù)的正式誕生。

鑒于AI研發(fā)進(jìn)展緩慢,羅德尼·布魯克斯認(rèn)為很可能過去采用的自上而下的研發(fā)路徑是錯誤的,他受到人類神經(jīng)科學(xué)進(jìn)展的啟發(fā),1990年發(fā)表了著名論文《大象不下棋》,認(rèn)為視覺功能并不需要中央神經(jīng)系統(tǒng)控制。他的這一構(gòu)想也將一度不被看好的神經(jīng)網(wǎng)絡(luò)推向前臺,并極大地推動了包括AI藝術(shù)在內(nèi)的各個人工智能領(lǐng)域的進(jìn)展。

2008年9月,一款語音識別APP出現(xiàn)在蘋果手機(jī)上,它的語音識別正確率達(dá)到了92%以上,這是AI藝術(shù)發(fā)展中所取得的另一個里程碑式的躍進(jìn),它為多模態(tài)大語言模型機(jī)器人的研發(fā)創(chuàng)造了條件。當(dāng)學(xué)界和業(yè)界都在熱衷于開發(fā)優(yōu)質(zhì)算法的時候,在AI領(lǐng)域嶄露頭角的華人科學(xué)家李飛飛清醒地認(rèn)識到,再好的算法如果沒有大量真實數(shù)據(jù)的支撐都不可能做出準(zhǔn)確的決策,于是她提出了一個史無前例的想法——構(gòu)建圖像數(shù)據(jù)庫,將整個世界都復(fù)現(xiàn)出來。她將自己領(lǐng)銜開發(fā)的這個開源性質(zhì)的巨型圖像數(shù)據(jù)庫定義為ImageNet。自此以后,這個數(shù)據(jù)庫成為一線AI科學(xué)家競相檢驗算法精度的平臺,它極大地加速了AI藝術(shù)的發(fā)展。

在2010年上海世界博覽會上,一款跳舞機(jī)器人出現(xiàn)在人們的視野中,其翩翩舞姿引起眾人駐足觀看。2013年,英國金斯密斯學(xué)院教授西蒙·科爾頓開發(fā)了一款名為“傻子畫師”的繪畫程序,該程序能夠從報紙上自主提取關(guān)鍵詞,并生成與該關(guān)鍵詞相關(guān)的圖像,顯現(xiàn)出超越圖靈測驗的創(chuàng)造性、靈巧性和想象力。2014年,即圖靈測驗發(fā)表72年之后,聊天機(jī)器人“尤金·古茨曼”最終通過了所有測試。2015年1月,莫德文采夫的藝術(shù)創(chuàng)作機(jī)器人“深夢”正式上線,自此之后,“深夢”成為很多AI藝術(shù)家放飛藝術(shù)想象的絕佳平臺。波普藝術(shù)家泰琳·薩頓上線“深夢”,于2017年創(chuàng)作了首張AI音樂專輯《我是AI》。一年之后,法國著名的藝術(shù)家三人聯(lián)盟機(jī)構(gòu)“Obvious”利用神經(jīng)網(wǎng)絡(luò)算法生成的藝術(shù)作品《埃德蒙德·貝拉米肖像》高價拍賣成功,創(chuàng)造了AI藝術(shù)的新紀(jì)元。

3、AI藝術(shù)家先驅(qū)及其創(chuàng)作主題

數(shù)字技術(shù)的快速發(fā)展不僅深刻地塑造著當(dāng)下的經(jīng)濟(jì)業(yè)態(tài),也推動數(shù)字藝術(shù)從奇觀美學(xué)和互動美學(xué)時代迭代進(jìn)入到AI美學(xué)新時代,并催生出一批在AI藝術(shù)領(lǐng)域勇于探索和創(chuàng)新的藝術(shù)家。

馬里奧·克林格曼就是活躍在這一領(lǐng)域的一位先驅(qū)人物??肆指衤?970年出生于德國慕尼黑。他沒有任何藝術(shù)和計算機(jī)科學(xué)學(xué)術(shù)背景,但他天生就對計算機(jī)和藝術(shù)感興趣。13歲的時候,他有了第一臺計算機(jī),自此開始,他無師自通,迷上了編程。高中畢業(yè)后,他進(jìn)入了廣告行業(yè)。1991到1992年期間,克林格曼獲得一個到總部在倫敦的廣告公司實習(xí)的機(jī)會,在那里,他第一次接觸到蘋果電腦和專業(yè)繪圖軟件Photoshop3.0,一個成為AI藝術(shù)家的夢想由此誕生了。2004年,他使用JAVA語言編程創(chuàng)作了《垛狀模糊》。這是他最早的“計算機(jī)生成藝術(shù)”。2010年他編寫了一款名為“蜘蛛絲畫板”的小程序,并試著用它創(chuàng)作了一幅同名繪畫。讓他始料未及的是這個小程序竟然迅速獲得了一大批擁躉。從2014年年底開始,他對各種算法、數(shù)據(jù)可視化處理和機(jī)器學(xué)習(xí)技術(shù)開展了廣泛的探索,創(chuàng)作了多幅極富創(chuàng)意的作品。2017年以來,他又將最新的生成對抗網(wǎng)絡(luò)引入到自己的藝術(shù)實踐中,創(chuàng)作了大量以人臉和肖像為標(biāo)志性形象的AI藝術(shù)作品?!爱?dāng)你面對一個人的面部的時候,能夠解讀出極其豐富的信息?!彼麑τ谌诵缘倪@種獨特理解成為他AI作品的一個核心主題,而人臉也成為他開展藝術(shù)實踐的肥沃土壤。

在將AI技術(shù)與舞蹈藝術(shù)融合方面,韋恩·麥克格雷格是一位始終走在前列的舞蹈家。他的《實時檔案》項目利用AI模型復(fù)現(xiàn)了他長達(dá)25年之久的舞蹈作品,借此在舞者和他的作品之間建構(gòu)了一個現(xiàn)場對話。AI模型對麥克格雷格的舞蹈風(fēng)格,從精致的細(xì)微動作到復(fù)雜的移位動作都能精準(zhǔn)捕捉到。舞者能夠從中獲得靈感,受到啟發(fā),從而創(chuàng)造出新的舞蹈動作。這正是麥克格雷格對AI技術(shù)最感興趣的一點,他認(rèn)為持續(xù)地創(chuàng)造新穎別致的動作是舞蹈藝術(shù)的靈魂,而AI技術(shù)能夠幫助他實現(xiàn)這個目標(biāo)。

莎拉·梅約哈斯是一位橫跨電影、攝影、虛擬現(xiàn)實、表演和雕塑等多個學(xué)科領(lǐng)域的AI藝術(shù)家。她最引人矚目的AI藝術(shù)作品是《云朵》。為呈現(xiàn)這一作品,她在貝爾實驗室原址上主辦了一場大型表演。16個攝影師拍攝了多達(dá)10萬張不同角度的玫瑰花瓣照片,構(gòu)成了一個大型數(shù)據(jù)庫。這些信息旨在構(gòu)建一個AI算法,用于生成獨樹一幟的花瓣圖像?!对贫洹返牟哒钩蔀橐淮嗡伎己笕祟惉F(xiàn)實和未來人類勞動處境的絕佳機(jī)會。梅約哈斯以AI技術(shù)為武器,以藝術(shù)策展為媒介,將AI藝術(shù)探索與人類所面臨的重大現(xiàn)實主題緊密結(jié)合,引起了業(yè)界和學(xué)界的廣泛關(guān)注。

羅比·巴拉特是一顆正在AI藝術(shù)領(lǐng)域冉冉升起的新星,也是一位AI藝術(shù)奇才。他只有19歲,卻以自己對于神經(jīng)網(wǎng)絡(luò)的深刻理解與創(chuàng)造性應(yīng)用,開拓了AI藝術(shù)和傳統(tǒng)藝術(shù)的視野。他與法國畫家羅南·巴羅特和加萊里·沃森三人(即上文提及的著名法國三人藝術(shù)聯(lián)盟Obvious)共同創(chuàng)作的頗具印象主義風(fēng)格的《埃德蒙德·貝拉米肖像》,創(chuàng)造了43.25萬美元的拍賣高價,此舉也將AI藝術(shù)推向世界舞臺。這一系列頗具創(chuàng)意的AI藝術(shù)探索也讓這位年輕人步入資深A(yù)I藝術(shù)家的行列。

在當(dāng)下AI藝術(shù)創(chuàng)作領(lǐng)域,湯姆·懷特以其對于人工智能和機(jī)器感知的深度研究和廣泛探索而聞名。他的一系列AI藝術(shù)實驗都聚焦于機(jī)器凝視問題上——AI是如何觀察、如何理解和如何表達(dá)外部世界的?隨著機(jī)器感知越來越多地滲入我們的日常生活之中,這個新世界正在變成我們不得不面對的一個主導(dǎo)領(lǐng)域,懷特正是用他的AI作品來透視和反思這種現(xiàn)象的。為此,他創(chuàng)作了大量抽象作品,AI能夠?qū)@些作品做出正確的分類。然后,他再賦予算法如同我們一樣的自然語言能力,如此一來,我們就能夠知道AI所理解的世界。懷特的這些探索深化了我們對于AI世界的理解。

4、AI的自主創(chuàng)作

AI藝術(shù)在發(fā)展中最常遭遇的一個挑戰(zhàn)就是,如何從其生成的巨量作品中挑選出相對而言最有趣味的作品,并將其引向普通社會大眾。對于幾乎所有AI藝術(shù)家來說,策展成為他們應(yīng)對這一挑戰(zhàn)的關(guān)鍵一招。

AI藝術(shù)家也時常陷入這樣的兩難選擇:作為藝術(shù)家的他,總是不自覺地遵從自己的口味來選擇作品,而作為策展人的他,又總要考慮盡可能向觀眾展示AI藝術(shù)的全貌。究竟應(yīng)該如何協(xié)調(diào)這種兩難關(guān)系?一般來說,作為一個策展人,他的理想是把他的AI模型放在現(xiàn)場,讓它持續(xù)地生成圖像,并訓(xùn)練這臺AI模型自己做出選擇;一旦AI模型從中做出了選擇,它就會自動消失。如此一來,這臺AI模型本身就是藝術(shù)作品,而其中選出的那些圖像不過是它所創(chuàng)造的一些稍縱即逝的視覺印象。不過,現(xiàn)在的策展還不允許一個藝術(shù)家如此超然,因為就目前的AI模型來看,如果只將它放在展覽現(xiàn)場,那么觀眾所面對的大多是噪聲,而且在此情況下生成的圖像大部分都是無趣的。

現(xiàn)實是殘酷的。如果AI藝術(shù)能夠繁榮發(fā)展,它就必須走向大眾。因此,在高雅與通俗之間保持一定的平衡就是AI藝術(shù)的不二選擇,既不能離世俗太遠(yuǎn),也不能離它太近。這是大多數(shù)AI藝術(shù)家的看法。

基于深度學(xué)習(xí)的AI能否最終實現(xiàn)完全意義上的自主創(chuàng)作?這是當(dāng)下所有關(guān)注AI藝術(shù)的人普遍關(guān)心的問題。比如,對于上文提及的賦予AI模型一定的策展能力和對作品的自我選擇能力,這難道不是某種AI自主性或主體性的彰顯嗎?很多活躍在AI藝術(shù)一線的藝術(shù)家都在試圖通過自身的藝術(shù)實踐來回應(yīng)這個問題??肆指衤J(rèn)為,這個問題從某種程度上可以從人類的傳宗接代邏輯來理解。我們生孩子是保障人類自身的繁衍和不朽。我們賦予AI一定的策展和選擇功能,本質(zhì)上也可以視為一種確保人類不朽的方式。例如,我們無法將自己上傳到計算機(jī)上,但我們可以創(chuàng)造某種事物,讓它能夠持續(xù)生產(chǎn)我們想要的某種東西,哪怕我們已經(jīng)離世也不受影響。某種意義上,賦能AI模型一定的策展能力就是一種讓藝術(shù)家持續(xù)延長藝術(shù)生命的方式。

另一方面,通過賦予AI一定的策展和選擇能力,我們可以看看它究竟能夠做些什么,又是如何去做的。從AI自身的角度看,它或許會因為這些能力而獲得一定的獨立性和自主性??肆指衤?018年創(chuàng)作的AI藝術(shù)《靈魂出竅》,就顯現(xiàn)出一抹自主性的陽光。在該程序中,他引入了一個神經(jīng)脈沖機(jī)制,它可以通過隨機(jī)改變、刪除或交換被訓(xùn)練的生成對抗網(wǎng)絡(luò)的成分,而引起神經(jīng)網(wǎng)絡(luò)對于輸入信息的誤讀,并因為這種誤讀而創(chuàng)造出某種富有新意的藝術(shù)形象。

另一個頗受爭議的問題是,AI能否對自己的藝術(shù)作品做出評價?大多數(shù)AI藝術(shù)家都對此持樂觀態(tài)度。從純粹技術(shù)角度看,AI總會在某一天達(dá)到自我改進(jìn)和提升算力、自我評價作品質(zhì)量的程度,但這也同時意味著,它將駛?cè)胍粋€我們再也看不到的區(qū)域;它可以理解宇宙,也可以創(chuàng)作一個屬于自己的宇宙,但它也必須創(chuàng)造某種方式讓人類理解它的這些行為。當(dāng)然,它或許也會在某一天,因為我們跟不上它的速度,而最終對我們失去興趣,但至少目前還不可能發(fā)生這些情況。為解決這些問題,AI科學(xué)家們正在研發(fā)某種人腦與機(jī)器直接聯(lián)結(jié)的界面或機(jī)制,以實現(xiàn)對AI理解的理解。

總的來說,活躍在AI創(chuàng)作一線的藝術(shù)家都對AI藝術(shù)的未來充滿信心。他們堅信,隨著人工智能、深度學(xué)習(xí)、計算機(jī)算力算法和數(shù)據(jù)分析技術(shù)的快速發(fā)展,特別是隨著多模態(tài)大語言模型的突破性進(jìn)展,在不久的將來,AI藝術(shù)家能夠創(chuàng)作出較之人類藝術(shù)家更有趣的藝術(shù)作品。而對于AI算力的快速提升可能引發(fā)的某些安全風(fēng)險,我們也應(yīng)提前做好各種應(yīng)對準(zhǔn)備。

(作者:馬立新,系山東師范大學(xué)美術(shù)學(xué)院教授,數(shù)字藝術(shù)哲學(xué)研究中心主任,博士生導(dǎo)師)