用戶(hù)登錄投稿

中國(guó)作家協(xié)會(huì)主管

機(jī)器寫(xiě)詩(shī)只是人工智能寫(xiě)作的過(guò)渡階段
來(lái)源:光明日?qǐng)?bào) | 朱恬驊  2024年09月28日09:27

自新一代人工智能問(wèn)世以來(lái),人工智能在文本生成上取得的進(jìn)展有目共睹,可以按照人們的要求,完成包括糾正語(yǔ)法錯(cuò)誤、摘編文章觀點(diǎn)、編制廣告文案等多種多樣的任務(wù)。用人工智能完成故事大綱、背景設(shè)定、人物形象等一系列工作,并在此基礎(chǔ)上生成出具體的情節(jié)文本,則是對(duì)這些功能的綜合應(yīng)用。近期,國(guó)內(nèi)首部由人工智能創(chuàng)作而成的百萬(wàn)字長(zhǎng)篇小說(shuō)發(fā)布,有關(guān)文學(xué)與人工智能的話題再度引發(fā)文學(xué)創(chuàng)作與研究領(lǐng)域的廣泛關(guān)注。

這并不是人們第一次感受到“機(jī)器”對(duì)于文學(xué)的沖擊。2017年,伴隨“小冰”的《陽(yáng)光失了玻璃窗》出版,“駱夢(mèng)”“風(fēng)的指尖”等一批在網(wǎng)絡(luò)平臺(tái)活躍的“詩(shī)人”,被揭曉為“小冰”的“馬甲”。同一年,清華大學(xué)的“九歌”系統(tǒng)發(fā)布并在電視舞臺(tái)亮相,其產(chǎn)生的文本具有古典詩(shī)歌的形式,能夠遵守格律和用韻的要求,同樣讓人難辨真假。但在當(dāng)今圍繞人工智能與文學(xué)的討論中,詩(shī)歌仿佛離場(chǎng)了。取而代之的是一個(gè)技術(shù)名詞位居話題的中央,那就是“語(yǔ)言大模型”。通過(guò)將模型內(nèi)部參數(shù)的規(guī)模提升到十億、百億的數(shù)量級(jí),并在人類(lèi)窮其一生也無(wú)法讀完的海量文本上進(jìn)行訓(xùn)練,大模型獲得了模仿人類(lèi)生成各種文本的能力。無(wú)論是生成詩(shī)歌還是小說(shuō),又或是各類(lèi)應(yīng)用文,都只是其通用性的體現(xiàn)。

如今,無(wú)論是否為技術(shù)專(zhuān)家,人們將更多注意力放在大模型如何獲得這種按需“定制”文本的能力,又如何才能對(duì)它的生成能力施加進(jìn)一步的控制。而詩(shī)歌生成本身似已不再構(gòu)成技術(shù)發(fā)展中的一項(xiàng)主要挑戰(zhàn),人工智能寫(xiě)詩(shī)也隨之失去了當(dāng)年的話題性。在這樣的境況下,不禁有必要懷疑:機(jī)器寫(xiě)詩(shī)還有未來(lái)可言嗎?

探求機(jī)器寫(xiě)詩(shī)的未來(lái),也許我們應(yīng)當(dāng)首先回顧機(jī)器寫(xiě)詩(shī)的歷史。1845年,英國(guó)一位出身工匠家族的生意人約翰·克拉克,用回收再利用的齒輪、皮帶、木條,拼裝出一臺(tái)名為“尤里卡”的詩(shī)歌機(jī)器。他將寫(xiě)有字母的木條安裝在傳動(dòng)裝置上,轉(zhuǎn)動(dòng)機(jī)器把手,“尤里卡”就能逐個(gè)字母拼寫(xiě)出一句由6個(gè)單詞組成的拉丁文詩(shī)行,其格律符合“六步格”要求。

“尤里卡”迅速成為當(dāng)時(shí)社會(huì)熱點(diǎn)并進(jìn)入公共話題領(lǐng)域。彼時(shí),撰寫(xiě)拉丁文詩(shī)歌一直是大學(xué)必考科目。學(xué)生們疲于記誦各種陳詞濫調(diào),將作詩(shī)削減為機(jī)械化的應(yīng)試技巧??死怂圃斓臋C(jī)器無(wú)疑是對(duì)這種應(yīng)試寫(xiě)詩(shī)的諷刺——不合時(shí)宜的應(yīng)試要求,將人異化為一種受“死規(guī)矩”束縛的“寫(xiě)詩(shī)機(jī)器”,限制了他們學(xué)習(xí)和推動(dòng)現(xiàn)代學(xué)科所需要的創(chuàng)造力。所以,早期的機(jī)器寫(xiě)詩(shī)反而是為了批判寫(xiě)詩(shī)的機(jī)械化。

在語(yǔ)言大模型出現(xiàn)之前,機(jī)器寫(xiě)詩(shī)一直是技術(shù)專(zhuān)家進(jìn)行文本實(shí)驗(yàn)的工具。1952年,英國(guó)計(jì)算機(jī)專(zhuān)家克里斯多夫·斯特雷奇編寫(xiě)了最早的文本生成程序,以檢驗(yàn)使用計(jì)算機(jī)操作文本信息的可行性。七年之后,德國(guó)工程師魯茲從卡夫卡的小說(shuō)《城堡》中分別選擇了16個(gè)名詞和形容詞,編制了計(jì)算機(jī)程序?qū)⑵浒此姆N句式加以組合,產(chǎn)生出大量隨機(jī)排列的句子。由于這些句子排列規(guī)整,并因句式上的重復(fù),而獲得別具一格的韻律感,這一題為《隨機(jī)文本》的作品被視為最早由計(jì)算機(jī)生成的詩(shī)歌。

在談?wù)撟约旱淖髌窌r(shí),魯茲指出,他的目的在于表明計(jì)算機(jī)能夠應(yīng)用于數(shù)學(xué)以外的領(lǐng)域,并將“計(jì)算”的概念拓展到字詞和邏輯推理上。為此,他應(yīng)用了計(jì)算機(jī)中的隨機(jī)生成器,來(lái)做出決策、生成文本,并指出未來(lái)的研究方向應(yīng)在于引入概率統(tǒng)計(jì)的結(jié)果,來(lái)使字詞的組合更有意義。后世的發(fā)展也確如魯茲所料,一些新的數(shù)學(xué)模型得以提出,并在詩(shī)歌形式的文本生成中展露身姿。即便今天的語(yǔ)言大模型在原理上已與當(dāng)年基于模板和規(guī)則的方式大相徑庭,在對(duì)語(yǔ)言材料進(jìn)行統(tǒng)計(jì)分析這一點(diǎn)上,仍然殊途同歸。

在人工智能的技術(shù)發(fā)展歷程中,詩(shī)歌生成具有特殊地位,不僅因?yàn)樗砹俗钤缡褂糜?jì)算機(jī)進(jìn)行文本生成的嘗試,而且還在于它獨(dú)特的象征意義:利用千百年來(lái)詩(shī)歌的崇高精神地位,機(jī)器寫(xiě)詩(shī)吸引了人們關(guān)注并支持人工智能領(lǐng)域的整體發(fā)展;借助詩(shī)歌體裁對(duì)詞句非日常用法的寬容,詩(shī)歌生成方面的探索描繪了通用文本生成的技術(shù)圖景。其背后的預(yù)期是,既然能夠用計(jì)算機(jī)生成某些“詩(shī)作”,那么未來(lái)也完全有可能生成新聞、報(bào)告,抑或小說(shuō)、散文,產(chǎn)生社會(huì)與經(jīng)濟(jì)價(jià)值。

現(xiàn)在,當(dāng)初許諾的“未來(lái)”已經(jīng)到來(lái)。語(yǔ)言大模型以一種通用的方式,實(shí)現(xiàn)了不同體裁文本的生成,其中詩(shī)歌已然不具有當(dāng)初的特殊地位。要獲得一首機(jī)器生成的“詩(shī)”,人們只需將自己的需求按照大模型所能接受的格式寫(xiě)成文本,這與讓機(jī)器生成其他形式的文本完全一致。大模型應(yīng)用的普及讓專(zhuān)門(mén)化的詩(shī)歌生成反而成為邊緣。技術(shù)地位上的沉寂,只是使“機(jī)器寫(xiě)詩(shī)”蒙上陰影的一個(gè)方面。由機(jī)器產(chǎn)生的詩(shī)歌自進(jìn)入公眾視野以來(lái),就受到詩(shī)人、作家和批評(píng)家們近乎一致的反對(duì)。一位當(dāng)代著名詩(shī)人批評(píng)說(shuō),機(jī)器生成的“詩(shī)”只是“一些碎片的無(wú)機(jī)組合”,是“拙劣的”、玩弄“修辭智性”而已。

機(jī)器寫(xiě)詩(shī)這項(xiàng)古老的事業(yè),誕生于對(duì)“人的機(jī)械化”加以批評(píng)的社會(huì)思潮中。然而三百余年來(lái),從木制的機(jī)械齒輪到迅速更新迭代的人工智能,產(chǎn)生“機(jī)器寫(xiě)詩(shī)”的文化境況已發(fā)生改變,連同詩(shī)歌生成技術(shù)地位的下降,以及技術(shù)的復(fù)雜性與詩(shī)歌的先鋒性之間聯(lián)系的“失靈”,使機(jī)器寫(xiě)詩(shī)很難再有未來(lái)可言。

(作者:朱恬驊,系上海社科院文學(xué)研究所助理研究員)