© Bert Glinn/Magnum Photos
利维坦按:
在算法能够迅速拼接句子、模仿风格的时代,人工智能似乎已经学会了“写作”。它可以生成优雅的段落、像样的叙述,甚至看起来颇有文学腔调。但当写作转向回忆录——那种由记忆、羞惭、执念与时间沉淀而成的私人书写——机器的流畅忽然显得空洞。真正的问题不在于AI能否排列词语,而在于它是否曾经生活过,是否拥有只能由身体、失去与自我反思铸成的那种记忆重量。
在网易云音乐 搜索 【利维坦歌单】,跟上不迷路
创造性写作曾经是人类的专属特权:写得好也好,写得差也罢,但无论如何,人们都默认一个共识——书写人类经验这件事值得付出时间和精力的。
这是一种至关重要的人类行为,以至于诗歌成为计算机先驱艾伦·图灵最初测试的关键组成部分:图灵测试旨在判断一个对一系列问题作出反应的未知对象是人类还是机器冒名顶替者。图灵测试常常被简化为人类与机器两块领地之间的一道单一分界线。通过测试,人工智能便可以踱步跨线,来到我们这一边,环顾四周,决定如何对待我们。但首先,它得通过测试。
在发表于《心灵》(Mind)杂志的论文《计算机器与智能》(Computing Machinery and Intelligence,1950)中,图灵明确了他的目标:“考虑这样一个问题,‘机器能思考吗?’”以典型的人类方式,他立刻对问题进行了重新表述——而且颇费笔墨——最终提出了“模仿游戏”,其原型是一种早于互联网、早于电视的客厅娱乐。
© Manhattan Rare Book Company
图灵心目中的原始游戏设置是:一名猜测者坐在“热座”上,向一名男子(X)和一名女子(Y)提问,两人分别在两个房间里,彼此既看不见也听不到。猜测者必须根据他们的书面回答判断谁是男人、谁是女人。X试图误导猜测者,如果猜错了,X就赢;如果猜对了,Y就赢。试试吧,很有意思。
在这个语境下,图灵拟定测试中的第一个问题并不像乍看之下那样令人意外:“请X告诉我他或她的头发有多长。”接着,图灵同样礼貌地提出第二个问题:“请给我写一首以福斯桥(Forth Bridge)为主题的十四行诗。”两个问题下来,人类与机器思维之间那条备受争议的边界,已经在向文学和艺术索要答案了。
图灵在1950年代设想的X(那个试图误导的参与者)回答说:“这个问题我可答不上来。我从来就写不了诗。”为了想象出这个回答,在他游戏的第二阶段里,图灵那颗复杂的大脑正在扮演这样一个角色:X由一台机器扮演,隐藏在视线之外,敲击键盘输入答案,假装自己是一个男人(在最初版本中,X是个男人假装成女人,后来版本中,图灵将X设定为机器,Y是人类,X要假装成人类。编者注)。我知道,这听起来有点绕;如果这个测试很简单,连空气炸锅都能通过。
图灵并不是在暗示机器不能写诗。在模仿游戏那套盘根错节的逻辑中,X的计算是:在1950年,普通人并不写诗——这是一种常识性假设,每一台冒充人类的计算机都应该知道(也就是说,机器如果真要装成人类,就必须知道什么时候该“装不会”。编者注)。连同其他一些来自20世纪中期的偏见,图灵的论文还不够谨慎地提及了种族、宗教以及美国宪法。他将无法把计算机视为有感知能力的人,比作“穆斯林认为女性没有灵魂”的观点。图灵就这样贸然闯入,他的思考方式,并不像我们今天这样计算。
(图灵在问的不是“你会不会写诗”,而是:你知不知道一个“普通人”在当时“会不会写诗”?1950年的常识是:普通人通常不会写诗。所以如果X回答: “当然,我可以写一首完美十四行诗”,反而会显得“不像人类”。编者注)
而他设想的2026年的未来计算机也做不到这一点。今天的任何一款大型语言模型(LLM),比如ChatGPT或Claude,都能立刻写出一首以福斯桥为主题的十四行诗。我输入了图灵测试里的那个问题,Claude 4立刻给出了14行诗句,其中甚至为了韵律而使用了缩写词“mathemat’cal”。这首诗言之成理,形式上也是一首十四行诗,而且只花了几秒钟。
无论这是否算作思考,图灵都预感到他所划定的边界将会遭到艺术界的抵制。在他的论文中,他与当时一位杰出的神经科学家、皇家学会的杰弗里·杰斐逊(Geoffrey Jefferson)爵士展开了辩论。杰斐逊认为,“只有当机器能够根据自身感受到的思想和情感,而非偶然的符号组合,创作出一首十四行诗或一首协奏曲时,我们才能认同机器等同于大脑——也就是说,机器不仅能够创作,而且知道自己创作了。”杰斐逊在1949年于皇家外科医学院发表的李斯特演讲中指出,将无数猴子在打字机上的工作机械化(即无限猴子定理。编者注)并不算真正的思考。
如今,在艺术领域,我们很难再像杰斐逊那样充满自信。人工智能的进步刺痛了艺术家的虚荣心——如果机器几乎可以瞬间复制出人类艺术家的作品,那么这些作品就谈不上多么特别了。这很刺痛人。我们原本希望伟大的艺术家能够弘扬并捍卫我们物种独一无二的精神,但正如早期摄影术所引发的焦虑一样,被妖魔化的人工智能正威胁着要窃取我们的灵魂。机器艺术侵蚀着我们所能做、所能创造、所能成为的一切,它侵入了神圣的领域。富有创造力的艺术家本应是独一无二的、不可模仿的。
---
图灵的“模仿游戏”论文发表于1936年,也就是爱荷华大学首次作家研讨会召开14年后。图灵或许并不了解,在剑桥大学国王学院接受数学教育的他,早已在看似毫不相关的创意写作领域,在大西洋彼岸发展出了机器学习的雏形。在爱荷华之前,灵感女神已经出现;在爱荷华之后,一种与当今大型语言模型(LLM)运作方式颇为相似的文学内容创作方法已经出现。
首先,要弄清楚有效写作的标准是什么。然后,制定一套流程,引导有抱负的写作者逐步模仿出理想的作品。爱荷华大学以及此后所有创意写作硕士项目都广泛验证了这样一个前提:一套可学习的规则可以生成至少勉强合格的文学作品。很少有前途可期的编剧不知道希德·菲尔德(Syd Field)的“三幕剧本结构”,或克里斯托弗·沃格勒(Christopher Vogler)的“英雄之旅”——这些“秘籍”承诺给出戏剧、场景、冲突与对白的最佳排列顺序。就像大型语言模型被设计成“思考”一样,这些模板本身就是一种逆向工程:先研究《大白鲨》或《证人》这些电影的机制是如何让作品发光的,然后找出可转移的组成部分,再重新组装,以期在未来实现类似的艺术成功。
© 豆瓣电影
对计算机程序员而言,把逆向工程作为机器学习机制,被称为“反向传播”。在马克斯·S·贝内特(Max S Bennett)的《智能简史》(A Brief History of Intelligence,2023)中,他展示了这种方法如何助力图像识别、自然语言处理、语音识别以及自动驾驶汽车的发展。监督型编码人员事先确定所需的答案,然后回过头去微调输入响应,直到人工神经网络得出预设的解决方案。
要是写作也这么简单就好了。根据Data USA的数据,美国每年有多达4000名学生获得创意写作硕士学位。尽管如此,没有人指望会有同样数量的“伟大的美国小说”诞生。许多满怀希望的写作生涯,起点其实都带着ChatGPT所邀请的那种提示心态:我想写一部像去年夏天震撼了我的那本书一样的畅销书。或者,对于那些更有冒险精神的人来说:想写一些新颖但又贴近生活的作品,一部兼具文学性和叙事张力的小说/回忆录混合体,就像李·查德和安妮·厄诺的结合体。谢谢。我会等的。不过,我可没那么有耐心。
© The Evergreen State College
显然,当把最终结果与最初意图相比较时,反向传播的方法无论对创意写作课程还是对大型语言模型而言,都是有缺陷的。回到图灵所引用的杰斐逊:当作品由错误的“思想与情感”所驱动时,成品就会被削弱——不论是学生写作者的盲目野心,还是计算机的盲目服从。还需要某种额外的东西,而这种神秘的魔法成分,至少自1580年起就一直在英语书面文本中被争论不休——那一年,菲利普·西德尼 (Philip Sidney)在《为诗辩护》(An Apology for Poetry)中试图捕捉卓越创意写作的本质。他的结论是:好的写作既能教人知识,又能令人愉悦。它以一种比神学、历史或哲学更易接近的形式,提供了如何好好生活的指南。创造性写作,是特殊的。
菲利普·西德尼在《为诗辩护》。© University of Glasgow Library/Flickr
事实上,正因为如此特殊,至今仍无人能够把英语文学系的研究成果——文学何以奏效——拆解到足够细微的层面,从而重新表述为可供大型语言模型执行的指令。创意写作学生也做不到。其他艺术门类在这一领域所做的努力,同样不怎么令人鼓舞。ArtEmis是一个大规模数据集,旨在记录并进而预测人们对视觉艺术作品的情绪反应。该计划将6500多名参与者的情绪标注,与他们对所见内容的文字解释进行匹配,并希望借助这些数据,通过反向传播来促成能够激发同等情绪反应的艺术作品的创作。
人们似乎普遍认为:如果一台机器能够创造出一幅视觉图像,并生成一组可控的情绪感受,那么艺术就算被成功创造了。听起来似乎有道理,唯独忽略了一个事实:人类的情绪反应向来反复无常。ArtEmis的流程在好莱坞早已有类似的先例,但如果焦点小组真的能可靠地服务于艺术领域,那么电影院里早该座无虚席、佳作不断了。
值得注意的是,美国编剧工会在2023年的罢工行动中,为剧本创作争取到了重要的保护,明确禁止用AI取代人类编剧。但这并未明显提升优秀艺术电影的产量。人类编剧仍然在拍出平庸的电影。即便没有任何AI的介入,我们依旧在画着乏善可陈的画布,写着令人过目即忘的小说。
---
糟糕的艺术,是人类非常热衷去做的事情,而且数量庞大。它已成为我们的一部分;当灵感枯竭时,我们便依赖那些与我们已经编入大型语言模型的方法并无二致的手段。
正如图灵所预言的那样,“数字计算机……确实可以非常接近地模仿人类计算者的行为”,而在制造失败的艺术作品方面,我们已经把所有花招都教给了人工智能。无论源自阁楼还是英伟达芯片,未能成功的创意写作,都是通过选择那些在公共领域出版材料中被识别为常常共同出现的语言单元来“写作”的。熟悉的词语组合被拼凑成几乎令人信服的句子,这种陈腐的语言运用方式过去被称为陈词滥调。大语言模型是陈词滥调的机器,它们被训练成利用人类顽固的弱点——以最小的努力创造最大的内容。
这也解释了英国出版业最重要的行业杂志《书商》(The Bookseller)在2025年6月的一个标题:“AI‘很可能’在2030年前产出畅销书”。该标题指的是尼尔森(Nielsen)公司菲利普·斯通(Philip Stone)在一次会议上的发言,该公司负责汇编英国图书销售数据。我认为他关于那本畅销书的判断是对的,因为大语言模型会率先攻占类型写作——警匪、间谍惊悚、言情小说——这些小说会沿用已被证明受欢迎的经典模式。人工智能急于取悦读者,而且它还拥有一个优势——而令人惊讶的是,很少有人类作家具备这一点——它能够毫无羞愧地批量生产衍生性作品。
幸运的是,对于其他人来说,人工智能能够提供符合规则和以结果为导向的叙事,这种无穷无尽的能力带来了一个意想不到的好处:人工智能将成为证明并非所有写作都具有相同价值的工具。
为了摆脱陈词滥调的束缚,读者们期盼着有机的联想、大胆的推测和出人意料的推论。为然而,对一台在问题提出之前就已被喂入答案的AI来说,“惊喜”依然是一个难以企及的概念。
埃达·洛夫莱斯(1815-1852)。© wikipedia
查尔斯·巴贝奇的分析机,又称差分机。© ThoughtCo
早在1842年,埃达·洛夫莱斯(Ada Lovelace,即诗人拜伦唯一的婚生子女。编者注)在评论最早的计算机之一——查尔斯·巴贝奇的分析机——时,就提出了对机器思维的这一反对意见(作为历史背景,爱荷华第一次创意写作聚会——虽属非正式——发生在1897年)。洛夫莱斯指出:“分析机毫无任何自发创作的企图。它只能做我们知道如何命令它去做的事情。”她的斜体字强调了与人类思维之间的对比:至少对艺术家而言,原创性是一种被珍视的价值。
视觉艺术比文学更能延续现代主义“推陈出新”的理念。例如,特纳奖每年颁发给英国最优秀的当代艺术展览,其评选标准就体现了一种观念:如果作品不够新颖,就不能称之为艺术。对视觉艺术家而言,形式上的好奇心本就是工作的一部分——他们探索新的创作方式,以期启发新的观看视角。相较之下,而写作则更倾向于沿用熟悉的模式,这也解释了为何英国会设立专门的戈德史密斯小说奖(Goldsmiths Prize,又译金匠奖。编者注),旨在“拓展小说形式的可能性”。因为大多数其他获奖小说并没有做到这一点。
尽管新技术开辟了广阔的视野,但写作界却一直不愿去探索新的阅读方式。把书籍整体搬到Kindle或Audible上,不过是简单的数字化搬运而已,这种安于现状的做法,使得文学界很容易被人工智能熟练地重复利用熟悉的素材,也提高了那本即将出现的AI生成畅销书的概率。作家们,或者更准确地说,是他们的出版商,似乎已经忘记了创作难度的重要性,也失去了对形式大胆作品所能带来的惊人回报的好奇心。如今,很少有书稿作者敢于向主流出版社承诺创作一本与众不同的书。
洛夫莱斯在思考机器如何思考时,立刻就识别出了原创性的重要性。或者,用诗人玛丽安·摩尔(Marianne Moore)的一首诗来说:
这些事物之所以重要,并不是因为
它们可以被赋予高深的内涵,而是因为它们
有用;……
无论在艺术还是科学领域,原创性都能推动人类进步。任何新颖而真实的发现都能拓展现实的范畴。因此,仅仅假装原创的艺术作品,并不会给我们带来任何有意义的东西。
---
图灵测试本质上是一项关于说谎的测试。一台机器能否采用一种明显属于人类的策略,假装成它并非之物?通过图灵测试,需要一次欺骗行为,这让被欺骗的人类审问者暴露在关于冒充与伪装的原始恐惧之中。艺术理应透过这种谎言看到真相,而那些值得捍卫的原创作品之所以非同寻常,正是因为杰斐逊所说的那种“被感受到的思想与情感”的强度与真实性,使它们存在于一个永恒的现在时。作家托妮·莫里森(Toni Morrison,美国著名非洲裔女性作家,其主要作品包括包括《最蓝的眼睛》、《秀拉》、《宠儿》等。其获得过许多文学奖项,包括美国国家图书奖、国家图书评论奖、普利策奖,以及1993年的诺贝尔文学奖。编者注)所做的事情,就属于此。
而人工智能所做的,则是概率性的。大语言模型对最可能的词序列的计算,恰恰是创造伟大写作最不可能的方式。任何在情感投入上超越统计概率、真正创造新作品的人,都更有可能与读者产生共鸣——不论这种亲和力如何表现出来。正如格雷格·巴克斯特(Greg Baxter)在其回忆录《为死亡做准备》(A Preparation for Death,2010)中写道的那样:“如果文学是一场勇敢者与平庸者之间的街头斗殴,我带来的是我所知道的最狠的帮派:纯粹的杀手,疯子。”巴克斯特的文学匪帮不会向“最可能的下一个词”下跪。他珍视他的“纯粹的杀手,疯子”;而图灵设想中的计算机则被给予“必须正确且按顺序服从”的指令。
我并不怀疑大语言模型可以被要求去模仿越界,但一旦服从这一指令,它们就显得荒谬虚伪,成为艺术的敌人——即便它们在先进的当代形式中似乎更能应对图灵对英国文学的挑战。例如在2026年,ChatGPT和Claude轻松完成了1950年的图灵测试挑战:解释莎士比亚在第十八首十四行诗中的创作选择。为什么是“夏日”,而不是“春日”?很简单(只要问它们,它们就会告诉你答案)。现在大语言模型可以轻松应对图灵最初的大部分问题,如果它们都写不出像莎士比亚那样的十四行诗,那我也写不出来。但这并不意味着我不会思考,图灵也对计算机作出了同样合理的宽容。它们也被允许有自身的局限,而他对机器智能的态度,遵循了狄德罗关于鹦鹉的逻辑:如果理解的幻象足以令人信服,那它就等同于理解(狄德罗说,“要是他们找到一只什么都能回答的鹦鹉,我会毫不犹豫地认为它是有智慧的生物。”编者注)。机器一直在伪装,直到它们真正理解为止。
或者用图灵自己的话来说:“上帝赋予了每个人不朽的灵魂,但没有赋予任何其他动物或机器。因此,任何动物或机器都无法思考。我无法接受这种说法。”图灵为了1950年代的语境而引入了上帝,但他拒绝了人类“必然优于”其他造物(无论是人造的还是自然的)这一想法。他赞同德谟克利特和托马斯·霍布斯等唯物主义哲学家的观点,认为心灵——不论它究竟是什么——完全存在于大脑的物理结构之中。AI也是一种物理结构,因此图灵判断:AI不能做的事情,只是“暂时”做不到而已。
费伯与费伯出版社在作家莎拉·霍尔(Sarah Hall)小说封面上标注了“人类撰写”,以示对人工智能的抵制。© The Bookseller
既然如此,作家和艺术家应当如何回应当下的这一局面?我们可以在小说的封皮上贴上“人类撰写”的标签,正如英国费伯与费伯出版社(Faber and Faber)最近所尝试的那样。视觉艺术家也可以贴上“由人类智慧创作”或“非AI制作”的标识,也许话题标签能在某种程度上让AI保持距离,直到某位划时代的天才横空出世,以真正原创的风格与内容捍卫人类的荣誉。人工智能,你等着瞧吧!看看你还有多长的路要追赶。
与此同时,我们其他人可以更积极主动地抵制人工智能的侵蚀,捍卫并鼓励人类独立创作艺术的雄心,无论成功与否。艺术是对人类存在的肯定,是传递和接收关于相遇与联结的信息。一个内在生命可以触及另一个,而为了达到最佳效果,需要培育一种任何大语言模型都无法模仿的创造性过程。马塞尔·杜尚把艺术称为“缺失的环节,而非已经存在的环节”,这一洞见在21世纪尤其重要,它直接驳斥了模仿性的语言模型创作模式——这种模式深陷于反馈循环,不断重复着既有的序列。对于ChatGPT而言,内心世界之间那种触电般的碰撞并非易事,而这种碰撞在回忆录中最为容易实现。每个人记忆中的一切都只属于他们自己,那是未经数字化处理的真实人类经验宝库。
---
据图灵的传记作者安德鲁·霍奇斯(Andrew Hodges)记载,当图灵陷入沉思时,常常会抓挠他那偏分的头发,并用嘴发出一种“咂唧”的声音。在他构思图灵测试前后,他脑中回响着怀疑的声音,告诉他计算机永远不可能“善良、机智、美丽、友好”。他未来的机器大脑不会“有主动性、幽默感、能分辨是非、会犯错、坠入爱河、喜欢草莓加奶油”,等等。图灵是在拿这些能力与他所记得的亲身生活经验作比较。人工智能做不到的,就是回忆。
以这一想法为起点,我最近发起了“通用图灵机”(Universal Turing Machine)项目,这是一个关于写作与阅读新方式的人类提案。“通用图灵机”是一个可扩展的在线网格,由8x8个方格组成,类似于棋盘。我们邀请作家认领一个网格,并在每个方格中填入1000个单词的记忆。读者可以在不同的记忆和声音之间随机穿梭,在杜尚所指出的“艺术即鸿沟”的空间中扮演同样积极的角色。我计划每年两次在已有内容上铺设新的方格,逐步扩大这一集体实验性回忆录的规模,放大人类存在的多样性,创造一部忠于生活经验的主观百科全书。
© universalturingmachine
通用图灵机的形式,旨在鼓励把写作视为一种思考方式——而这正是艺术(观看、聆听、写作、阅读)一直以来所提供的。能够感知自身被记忆的过程,堪称我们所能进行的最艰深、最巧妙的思考之一,也正因如此,为了进行他的测试,图灵才会对文学作品如此着迷。人工智能目前还无法将写作作为一种独立的思考、阅读或记忆方式,而通过阅读所有书籍来学习写作也无济于事。正如回忆录无法通过完全回忆而变得更好一样。
要亲眼见证人类艺术性选择的奇迹,可以看看法国实验作家乔治·佩雷克(Georges Perec)的小说《消失》(La Disparition,1969)。这本书完全不包含字母“e”,这种系统性约束,大语言模型可以瞬间复制。然而,计算机大脑无法做到的是,它无法将佩雷克的生活经历融入其中。法语字母“e”的发音与“eux”相似,意为“他们”。佩雷克的父亲在战争中阵亡,他的母亲被纳粹从巴黎驱逐到奥斯维辛集中营。他们二人从儿子的生活中消失,也从他的小说中消失。因此,这部小说并非消失,而是以一种胜利的艺术重构的方式,凸显了他们扭曲的缺席。
在《计算机器与智能》的结尾,图灵出人意料地提到,“至少在心灵感应方面,统计证据是压倒性的”,并且“如果承认心灵感应,我们就必须把测试收紧”。作家与读者、艺术家与观众之间的交流,是我们最接近心灵感应的时刻——在心灵之间传递与接收信息。图灵意识到,他的机器很难达到人类这种精细的程度,虽然并非每个人都能通过艺术发现心灵感应,但任何有过草莓奶油体验的人都可以尝试一下。努力本身就值得肯定,而像“通用图灵机”这样的项目正鼓励这种尝试:欢迎人类贡献者,无需测试。
或者更准确地说,通过写作来重新编排记忆——以这种独特的人类方式去思考——本身就是一种抵抗。它重新诠释了图灵测试,使之偏向于他最初模仿游戏中Y所扮演的角色:Y的目标是讲述真相,而不是试图误导他人。X无法替你拥有记忆;无法替你假装,也无法因此成功;而对自我的认知始终是认知主权的体现。在书写自我的过程中,Y成为了令人信服的人类。Y获胜。人类与机器思维之间的边界依旧清晰,并因一个无法、也不愿被外包的自我而得到强化。
文/Richard Beard
译/tamiya2
校对/tim
原文/aeon.co/essays/sure-ai-can-do-writing-but-memoir-not-so-much
本文基于创作共享协议(BY-NC),由tamiya2在利维坦发布
文章仅为作者观点,未必代表利维坦立场
,不迷路