AI与地理
当 我打算对“哈利·波特版巴黎世家”引起的又一波人工智能热潮说点什么时,它几乎要被玩坏了,也开始让人觉得有点儿尴尬。不过对我来说,这件事本身仍是个重要的事件。实际上,它的讨论热度已持续了一个多月:三月中旬,一个名叫DemonFlyingFox的YouTube网友发布了一个视频,其中,由人工智能生成的各种《哈利·波特》角色都穿起了巴黎世家的服装。在这段视频里,人工智能生成的人物既新奇,又有点“可爱的傻气”,二者结合到一起所产生的诡异观感为它引来了几百万的浏览量。随后,一批渴望蹭热度的内容制作者争相进行“巴黎世家”系列的各种二创,比如“星球大战版巴黎世家”“指环王版巴黎世家”“怪物史莱克版巴黎世家”“世界总统版巴黎世家”等等,连DemonFlyingFox本人也制作了两个后续视频,但点击率和关注度都越来越低。我最初是通过一个叫PromptJungle的up主的视频才第一次了解到这些东西的,PromptJungle制作了一个“手把手教学指南”,他说任何人都可以通过现在市面上的这些人工智能工具来轻松制作属于他们自己的“哈利·波特版巴黎世家”视频:首先使用ChatGPT编写提示,然后将提示输入Midjourney让它渲染图像,再用Eleven Audio合成人物声音,还可以用D-ID赋予你的视频如“有声绘画”一般的氛围,等等。在PromptJungle的教程中,我觉得最有趣、最有象征意义的步骤其实是第一步。它让你去和ChatGPT对话,比如,你可以给ChatGPT这样的指令(prompt):“告诉我10个最受欢迎的哈利·波特人物,只要名字就好。”换句话说,这里的假设是,使用者可以完全不了解他/她所使用的题材中那些最基本的东西。即,在PromptJungle教程的第一步里,使用者最关心的问题可能并不是“我要怎样才能参与到这个由我喜欢的东西引发的热潮”,而是“我要怎样才能在这个我一无所知的事情上分一杯羹”。显然,现在的各种生成式人工智能工具的爆炸式流行打开了令人惊叹的、新的创造可能性,但它也在相当程度上扩大了“反创造性”的边界:翻版、跟风、随大流都变得愈发简单,人们甚至可以更随便地“劫持”一些原创的想法。鉴于当今社会创造力稀有和数字经济发展颇为残酷的现实,在我看来,后者将更多决定这些人工智能工具将对文化产生何种影响。“指令艺术家”的崛起面对创造性劳动可能退化的不安,以及这些人工智能工具“把整个线上图像世界和每位艺术家的知识产权作为免费资源,来训练自己的算法并致力于营利”的现实,有些人总是会平淡地向你保证,“没什么好怕的,人工智能也能创造很酷、很有创造力的东西!”这种说法昭示的是,发出“指令”就能被吹捧为“热门新技能”,而这些指令本身也成为了市场中可被流通的新商品。一些爱幻想的投机者开始推销“人工智能指令圣经”(A.I. Prompt Bible),他们宣称能让“没有受过艺术训练的人也成为艺术家”,通过他们的秘籍中1000个由专业人士研究出来的指令(只需37美元),不需要任何掌握技术就可以生成令人惊叹的艺术品——你需要做的,只是复制和粘贴其中的文本而已。让我们来看看这些由专业人士研究出来的指令是什么样的:“女神,丝绸般的黑发,背后有光环,完美的特征,对称的脸,光滑的皮肤,脸部肖像,特写,维多利亚式,优雅的构图,逼真,黑暗的幻想风格,高质量,动漫,锐利的焦点,超现实主义,数字艺术,动漫艺术,32K,极端细节化”而以下是你能通过这个指令收获的图像。使用“人工智能指令圣经”生成的样图这个网站还承诺“人工智能生成艺术有很多营利机会”,比如你可以将你的这张“黑暗女神”图像卖给网络图片库,或者将它印刷在物品上,甚至还有可能出名!“准备好改造你的社交媒体,开始发布原创内容了吗?算法将奖励你!”而翻看了这个网站上的一些“杰作”之后,我不得不说,它们看起来就像是任何人工智能工具都可以随机生成的东西。根据我自己使用Midjourney的经验,要获取类似质量的图像,所涉及的“技能”大概只有输入“化小丑妆的埃隆·马斯克”这一步。“人工智能指令圣经”网页截图很清楚的一点是,如果一项技能的传播如此简单,简单到“你所要做的只有复制和粘贴一些文本”而已,那么它也不可能是一项具有持久价值的技能。把销售指令作为一项业务,就像是把教人如何在Netflix上找东西作为一项业务——对于大多数普通用户来说,这根本不是必要的,而且当它是必要的时候,其实也不是那么难查——“精通Midjourney和DALL-E”可能就像“精通Word和Excel”一样,完全不是什么了不起的技能。对反创造性的激励说完“人工智能指令圣经”的无能,接下来让我们来探讨一下PromptBase,这也是一个受到炒作的平台,为有抱负的“指令工程师”(prompt engineers)提供帮助(该网站说它是一种“新的技术,擅长制作人工智能模型,产生稳定输出所需的文本提示”)。在PromptBase上,只要花几美元,你就可以购买指令,可用于任何创作中。这些指令包罗万象,从“童话动物书插图”到“指尖的高质量小动物”,从“有曲线的迪斯尼公主”到“面向成人的迪斯尼公主”。PromptBase的服务条款很明确:“我们市场上的所有指令,知识产权都归各自创造者所有。”PromptBase上的指令销售界面这个免责声明非常有趣,因为他们站内流行的许多指令,其实都包含了对一些创作者或多或少的“借鉴”,比如中国插画师WLOP(王凌)、马来西亚插画师Lim Heng Swee、法国插画家Tom Haugomat,以及德国画家Michael Hutter。这些名字我都不是很熟,而这可能也不是一个巧合——因为如果你要生成诸如“乔治亚·欧姬芙”或“萨尔瓦多·达利”风格所需的关键词是显而易见的,因此不会有多少人需要有关他们的指令,在这里,相对不为人熟知的艺术家才更受欢迎。“指令经济”的存在是为了捕捉艺术家标志性的风格,并将其重新加工成一个通用的外观——但并不需要艺术家本人。从Elinor Carrick在《Medium》上发表的关于她销售指令的经验来看,我认为使用在世艺术家的名字作为关键词是有分歧的行为。如果这在PromptBase市场上是普遍存在的,那它就相当于一个捷径——艺术家本人花了几个小时甚至几个月的时间,精心制作出风格独特的作品。但这种指令的存在却将把这种创作的过程无情压制,把劳动步骤极大简化——这无疑是对反创造性的激励。指令的不可持续性去年9月,美国科技网站The Verge把设计师Justin Reckling形容为“指令工程师”领域的明星。“Block Cities”是他最为人熟知的“代表作”,这个指令可以帮助使用者生成模拟城市式的等距砖块。九个月过去了,它目前仍是PromptBase上最畅销的指令之一。但是,由于现在人们可以使用图像来激发生成其他图像,所以你哪怕不需要购买Reckling的指令,也能够把一个与街区或城市相关的图像链接放到Midjourney中,再让它生成一些相当有用的东西,而它生成图像的时间甚至比你把信用卡信息输入PromptBase里都更短。(顺嘴一提,我确实买了Justin Reckling那个售价2.99美元的指令。)使用“Block Cities”指令在Midjourney生成的图像当时,Reckling估计他需要卖出5到10个特定的指令,才能基本上与其付出的劳动相抵。但这种“创作”要想可持续产生价值,实际上可能非常困难,因为这些工具首先是建立在对互联网上的内容进行抓取、再加工和抽象化的基础之上。大部分利润将归于生成者,而“大量的营利机会”则主要是为了让你付钱给他们。关于这种新兴“指令经济”的讨论已从销售普通指令转向了销售“超级指令”(super prompts),根据彭博社的说法,“这是一种可长达数百字的指令,迫使人工智能深入研究其数据集”。因此,制作这种很长的“超级指令”所需的劳动量正在上升。Reckling告诉The Verge,他对自己的知识产权“不太担心”,只要有足够多的人付钱给他,他还是愿意透露自己的指令。但他也补充说:“我认为我们的社会应该提供一些保障措施,如全民基本收入,以帮助那些在温饱线上挣扎的创意领域从业者。随着自动化持续影响不同的职业,这将变得越来越重要。”狭隘的看法在“哈利·波特版巴黎世家”的事情上,我的讨论似乎有点滞后了,但我仍想做我自己的、对艺术行业能有些参考意义的备忘录,也是为了确保我能明白自己在谈论什么。所以,我把主题放在了活跃在上世纪中叶的艺术评论家克莱门特·格林伯格(Clement Greenberg)身上。而对于时尚这个我知之甚少的领域,我选择了Ed Hardy这个品牌,它是世纪初的土潮风格代表。(也说不定会因怀旧情绪在未来的某天重新火起来?)在对ChatGPT下指令的步骤中,我觉得最有意思的部分是,ChatGPT告诉我使用Ed Hardy这个品牌并不合适。Ben Davis与ChatGPT的对话截图然而,通过一些努力,我还是继续向前推进,将格林伯格的思考融入他所拥护的一些画家(汉斯·霍夫曼、巴内特·纽曼、威廉·德库宁、琼·米切尔、克莱福德·斯蒂尔、格雷斯·哈蒂根、马克·罗斯科、海伦·弗兰肯塔勒、杰克逊·波洛克和李·克拉斯纳)身上——然后让他成功地成为了“时装模特”,通过Midjourney的渲染穿上了Ed Hardy的服装。而我从这个过程中学到了什么?我意识到,要想用这些工具做出半吊子的效果确实很容易,但若想做出真正有趣的效果,则会很麻烦且费时。比如说,要完全捕捉人的面部特征就很困难。使用Midjourney制作的,以艺术评论家克莱门特·格林伯格的脸为模型的一张世纪初风格Ed Hardy宣传图所以,这些人工智能工具对艺术和社会究竟能提供什么样的价值,最好还是让AI版格林伯格来说话吧。文丨Ben Davis 联系Artnet中国:xinxi@artnet.com 大家还在读