用戶登錄投稿

中國作家協(xié)會(huì)主管

當(dāng)AI入侵藝術(shù)創(chuàng)作的操作系統(tǒng)
來源:文匯報(bào) | 花暉  2024年07月10日08:47

AI作圖(作者提供)

AI作圖(作者提供)

“人工智能已入侵人類文明的操作系統(tǒng)。”這是《人類簡史》作者尤瓦爾·赫拉利對于AI迭代之迅猛而發(fā)出的感嘆及憂慮。赫氏素來以演化生物學(xué)的角度闡釋人類歷史,當(dāng)過往的“AI威脅論”集中于智慧機(jī)器奴役或滅絕人類,赫氏則認(rèn)為今天的AI具備了操縱及生成語言的非凡能力,出現(xiàn)“會(huì)講故事的計(jì)算機(jī)”無疑將成為人類史的一個(gè)拐點(diǎn)。

考察AI藝術(shù)創(chuàng)作領(lǐng)域,這種“入侵操作系統(tǒng)”的狀態(tài)已初現(xiàn)端倪且迅速蔓延,那么機(jī)器語言將如何影響人類的創(chuàng)作思維及美學(xué)表達(dá)?在人機(jī)交互的系統(tǒng)框架中,各自又將扮演怎樣的角色?

詞元生萬物是語言的進(jìn)化還是退化

赫拉利認(rèn)為語言是人類文明的基本要素,而正是通過改變語言表達(dá)的習(xí)慣與構(gòu)成,AI得以“操縱”人類觀察及思考的方式。換言之,“硅基生命”正嘗試從根本上瓦解并重塑最頂端碳基生命的文明累積系統(tǒng)。

赫氏的一系列觀點(diǎn)顯然將AI視為入侵物種而懷有“敵意”,但由語言這個(gè)極為重要的符號系統(tǒng)出發(fā),思考AI與人類文明的現(xiàn)時(shí)及未來關(guān)系,確是一條新穎而有效的路徑。

不妨由“提示詞”開始我們的討論。

但凡對AIGC稍有接觸,便不會(huì)對文生圖、文生視頻感到陌生。想象一下在文本框內(nèi)輸入蒙娜麗莎、立體主義兩則提示,AI送出的極大可能是畢加索版的神秘微笑,你當(dāng)然還能額外獲得波普版、水墨版乃至黏土版。文本驅(qū)動(dòng)是AI創(chuàng)作的最基本形式,由此看來,AI對人類最直觀的“操縱”在于那些連續(xù)的、高度依賴上下文的語義表達(dá),由斷裂、跳躍的語素、詞、熟語等語言單位直接完成了,且完成的形式在情境的邏輯性、完整性上日趨合理,并越來越清晰地展現(xiàn)出一種機(jī)器創(chuàng)意。這就導(dǎo)致一個(gè)悲喜難辨的結(jié)果:當(dāng)我們將語義表達(dá)的概念拓展至藝術(shù)創(chuàng)作,過往那些引以為豪的豐富經(jīng)驗(yàn)、刻苦訓(xùn)練、入微觀察、情緒峰值,都在體量盡可能縮小的音義結(jié)合體面前,顯得性價(jià)比很低。隨著提示詞工程師成為職場新寵、9塊9的AIGC課程充斥網(wǎng)絡(luò),人工智能顯然帶來了“6·18”般的創(chuàng)作狂歡。

那么回到語言的討論范疇,基于提示詞的“操作系統(tǒng)”究竟是一種進(jìn)化還是退化?

在AIGC的語言模型中,“詞元”這一翻譯代表著機(jī)器以數(shù)字形式來讀懂人類詞句的最小語義單位。提示詞中的長文本經(jīng)由“分詞”步驟拆解為詞元,并通過嵌入、位置編碼等一系列處理,由物理世界的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為機(jī)器可理解的結(jié)構(gòu)化向量,圖片、視頻等多模態(tài)輸入的最終目的地也便是多維向量。

暫不展開復(fù)雜的技術(shù)機(jī)理,而用螞蟻搬家的故事來理解一下詞元的無窮力量。一只螞蟻承載負(fù)重、兜兜轉(zhuǎn)轉(zhuǎn)大半天回到蟻穴,而當(dāng)成千上百集體遷移時(shí),卻能驚人地依據(jù)地形選擇出最便捷、最合理的行進(jìn)路線,路遇急流亦會(huì)抱作一團(tuán)滾入河中,通過犧牲少數(shù)邊緣個(gè)體而獲得蟻群的勝利。這種整體大于部分之和的智能爆發(fā)被理論生物學(xué)家貝塔朗菲稱為“涌現(xiàn)”,而一旦突破聚合的奇點(diǎn),宇宙起源與生命演化都在涌現(xiàn)之列。

詞元就像一只螞蟻,當(dāng)我們投喂足夠多的語料給大語言模型后,由表及里涌現(xiàn)而出的是AI對于提示詞中潛藏的藝術(shù)風(fēng)格及情感傾向,產(chǎn)生了識(shí)別、理解以及“想象”——假設(shè)我們意欲為“一鍵生成”添加一些擬人的色彩。同時(shí)于規(guī)模法則之下,隨著模型尺度急劇增大,其計(jì)算精準(zhǔn)度呈現(xiàn)出昂然上揚(yáng)的冪律曲線。正如OpenAI從未將Sora簡單地等同于視頻模型,而是野心勃勃地稱其為“世界模擬器”,當(dāng)你察覺到墨鏡女郎鏡片上的反光時(shí),囈境與現(xiàn)實(shí)間的界線似乎并不那么重要了。

表面上看,多模態(tài)提示詞代表著創(chuàng)作界面的全然改頭換面,而背后的詞元生萬物,體現(xiàn)出機(jī)器對藝術(shù)世界新一階段的理解與掌握,更是人類在新一階段對藝術(shù)思維的形成與表達(dá)、創(chuàng)作工藝的更新與再造產(chǎn)生了顛覆舊知的認(rèn)識(shí)與行動(dòng)。

一個(gè)有趣的例子是前不久全球首部AI長片《我們的終結(jié)者2重制版》上映,故事背景設(shè)定為ChatGPT一統(tǒng)天下的未來世界,OpenAI派遣機(jī)器人穿越時(shí)空刺殺人類反抗軍領(lǐng)袖山姆·奧特曼,也即是現(xiàn)實(shí)中OpenAI的創(chuàng)始人,整體情節(jié)與經(jīng)典科幻片《終結(jié)者2》形成了呼應(yīng)。撇開影片中部分影像細(xì)節(jié)的不到位,其制作本身便掀開了電影工業(yè)的新篇章。項(xiàng)目啟動(dòng)于好萊塢編劇大罷工之際,在傳統(tǒng)電影技術(shù)崗位缺失的前提下,50名AI藝術(shù)家利用ChatGPT、Midjourney、Runway等五花八門的AI工具,完成了50個(gè)彰顯個(gè)人風(fēng)格及工具特性的影像片段,整部長片由此“拼湊”而成。這樣的“草臺(tái)班子”在3個(gè)月內(nèi)完成了編劇、導(dǎo)演、場記、美術(shù)、配樂等所有標(biāo)準(zhǔn)工業(yè)流程,證明了AI在降低使用門檻的同時(shí),帶來了跨學(xué)科、跨門類的通用智慧。

若將語言范疇由藝術(shù)創(chuàng)作的技法與規(guī)律,再度拓展至認(rèn)識(shí)宇宙世界的運(yùn)行真理,這種通用智慧則更令人驚嘆。Deep Mind旗下的AlphaFold于數(shù)年前,已預(yù)測出100萬個(gè)物種超過2億個(gè)蛋白質(zhì)的結(jié)構(gòu),幾近涵蓋地球上所有的已知蛋白質(zhì),而今天的AlphaFold 3已將預(yù)測范圍擴(kuò)展到了更為廣泛的生物分子。顯然AI在各個(gè)領(lǐng)域?qū)τ趲椭祟愓J(rèn)識(shí)自身,發(fā)揮著日益積極的作用,那么人類又該如何可持續(xù)性地與AI相處?

從逆向圖靈測試到人文的勝利

近日一位AI獨(dú)立開發(fā)者設(shè)計(jì)了一項(xiàng)別出心裁的游戲,將亞里士多德、莫扎特、達(dá)·芬奇、克利奧帕特拉、成吉思汗五位“角色”設(shè)置于AI世界的一節(jié)車廂中,其中只有一位是人類,其它幾位均為GPT、Claude、Gemini等頭部引擎驅(qū)動(dòng)的AI玩家,五人間通過互相問答,并以投票形式?jīng)Q出誰是混入的異類。人類扮演的角色最終被四位AI玩家中的三位以缺乏領(lǐng)導(dǎo)力與戰(zhàn)略思維為由,判定為非我族類。

若熟知70多年前的圖靈測試,此次由機(jī)器檢驗(yàn)人類的反向?qū)嶒?yàn)便顯得格外有趣且有深意。在愈來愈緊密的人機(jī)系統(tǒng)中,如何與AI相處,便成了一個(gè)需要回答的問題。

在現(xiàn)時(shí)的答案中,過往的“工具論”顯然不合時(shí)宜,AI不再是輔助導(dǎo)演完成分鏡、幫設(shè)計(jì)師生成草圖的簡單機(jī)器,一種相互補(bǔ)充與激勵(lì)的“友伴論”是良好的起點(diǎn),正如跳躍的提示詞,將由AI填補(bǔ)創(chuàng)作的空間。

又一個(gè)值得一提的案例是由商湯科技、上海人工智能實(shí)驗(yàn)室參與研發(fā)的首個(gè)人體動(dòng)捕大模型SMPLer-X。得益于450萬個(gè)實(shí)例的數(shù)據(jù)訓(xùn)練,樣本視頻中人體姿態(tài)的多樣性、局部動(dòng)作的復(fù)雜性,都能被快速且高質(zhì)量地識(shí)別并提取出來,這意味著CG制作展現(xiàn)出了一種嶄新的未來。

由1937年《白雪公主和七個(gè)小矮人》、1941年《鐵扇公主》啟用轉(zhuǎn)描技術(shù)算起,逐幀摹繪、慣性測量、光學(xué)動(dòng)捕等一系列方法都離不開巨大的人力物力,而AI生成式動(dòng)捕擺脫一切傳感器,由攝像頭、手機(jī)乃至網(wǎng)絡(luò)視頻中直接采集獲取動(dòng)作數(shù)據(jù),在大幅削減成本的同時(shí),著實(shí)降低了制作人員的工作難度與強(qiáng)度。

在這樣的創(chuàng)作友伴關(guān)系中,藝術(shù)家們理應(yīng)受到鼓舞,去嘗試過往不曾有過的想象、去攀登過往不曾達(dá)到的峰頂。頂尖AI科學(xué)家李飛飛宣稱AI的勝利不能僅僅是科學(xué)的勝利,而必須是人文的勝利,這意味著AI需要成為“遵循優(yōu)良的學(xué)術(shù)傳統(tǒng),愿意協(xié)作,尊重他人的意見與專業(yè)的機(jī)器”,這亦為人類文明的操作系統(tǒng)筑起了一道倚重AI革新且可持續(xù)發(fā)展的防火墻。

(作者為上海交通大學(xué)媒體與傳播學(xué)院副教授)