1 引言

如今,人工智能(Artificial Intelligence,AI)这个词语已经渗透在了社会生活的各个层面。2017年,世界围棋冠军柯洁不敌人工智能围棋系统AlphaGo,引起了社会的轩然大波。自此,越来越多的寻常百姓也都加入了对人工智能的讨论之中:还有哪些人类活动是人工智能做不到的?人工智能会取代人类吗?我们应如何与人工智能相处?

截至目前,人工智能技术已经在计算机视觉(如人脸识别)、自然语言处理(如机器翻译、智能对话系统)、语音处理(如语音输入法)、推荐系统(如商品推荐)等多个领域大放异彩。除此之外,也有越来越多的研究人员旨在用人工智能的方法去创作艺术作品。目前,人工智能创作已经在音乐、绘画、诗歌等领域取得了不小的突破。

在音乐方面,加州大学圣克鲁兹分校的音乐学教授David Cope就一直致力于古典音乐的智能创作,甚至在2015年还推出一张唱片:《计算机谱曲的古典音乐》(Classical Music Composed by Computer),其中充满对巴赫、莫扎特、贝多芬等音乐家模仿的作品。对于流行音乐,微软团队也推出了“小冰乐队”的自动编曲框架,其能够自动生成旋律并即兴编曲 [1]。

David Cope 教授的唱片:COPE, D.: Computer Music (Experiments in Musical Intelligence)

在绘画领域,2016年,一种名为“Image Style Transfer(图像风格转换)”的人工智能模型问世,它可以将任何一副图片转换成梵高、莫奈等绘画大师的艺术风格(如图1)[2]。进一步地,也有人工智能模型可以直接生成艺术绘画作品(如图2)[3]。

1

图1:左上角的图像A在人工智能模型的处理下,分别转换成了威廉·透纳(图像B)、梵高(图像C)、爱德华·蒙克(图像D)等画家的风格.

2

图2 :人工智能模型生成的绘画作品.

除绘画与音乐之外,人工智能还可以自动生成诗歌等文学作品,例如:清华大学的研究人员开发了“九歌”人工智能诗歌写作系统,它能够根据用户输入的关键词生成对应的古代诗歌(如图3)。

3

图3 :“九歌”人工智能诗歌写作系统:输入关键词“雪山飞遥”后,系统自动创作出的五言绝句.

人工智能在艺术创作上的应用,在给人们带来惊喜的同时,也不由地令人产生思考与疑问:人工智能的创作物属于艺术作品吗?人工智能模型(或程序)可以被称作艺术家吗?人工智能模型真的能够“理解”艺术,并“知道”自己在如何进行创作吗?以及,我们是否能够创造出具有情感和意识的智能体,使其能够和人类一样感受艺术、洞察艺术家呢?

2 人工智能艺术的哲学内涵

在厘清“人工智能的艺术创作”这个问题之前,我们首先来分别阐述人工智能和艺术这二者的定义及其联系。

关于“人工智能”的定义有很多种,以《人工智能:一种现代方法》的作者的界定,人工智能需要具有四种模式:像人一样思考、理性地思考、像人一样行动、理性地行动。其区分了思考与行动,因此,我们也可以把“人工智能”看作机器对人的思维行为的模拟活动。

关于“艺术”的定义,据维基百科:“艺术是指凭借技巧、意愿、想象力、经验等综合人为因素的融合与平衡,以创作隐含美学的器物、环境、影像、动作或声音的表达模式,也指和他人分享美的感觉或有深意的情感与意识的人类用以表达既有感知且将个人或群体体验沉淀与展现的过程。”[4] 可以看出,艺术作品的先决条件是需要蕴含“美”;其次,艺术是一种社会活动,是一种“社会的表现”,艺术作品是艺术家与观众,以及观众与观众之间的情感交流纽带。

到目前为止,几乎所有的人工智能模型都只是在模拟人的行为(即“看起来”像人),而无法模拟人的思维(即拥有自我意识),也可被称作“弱人工智能”。无论是AlphaGo、小冰乐队,还是九歌作诗系统,这些人工智能模型都是从大量的数据中训练、建模而来,其智能属于认识论中的经验主义。而人工智能若要真正变得“智能”,其必须能够模拟人的思维(即所谓“强人工智能”),如抽象逻辑思维、形象思维、灵感(顿悟)思维。其中,代表人类情感、意识、创造性的形象与灵感思维,正是与艺术创作密切相关的对象。

南开大学哲学院的陶锋老师曾提出“人工智能美学(the Aesthetics of Artificial Intelligence)”的概念:“人工智能美学研究的是在人工智能技术发展过程中所出现的与美学有关的一些问题,其主要内容包括人工智能对人类感性(包括情感)和艺术的模拟、人工智能艺术的风格与鉴赏、人工智能视野下人类情感和艺术本质问题等,其方法主要是哲学美学的,并需要结合诸多跨学科如脑科学、神经科学、生物进化等理论以及人工智能领域最新进展来研究。”[5] 在他看来,人工智能要想完成真正智能的艺术创作,其需要对人类的两方面作出模拟:其一是对人类艺术行为的模拟;其二,则是对人类在艺术活动中表现出的情感行为的模拟。

由此观之,现如今的人工智能技术,无论多么“智能”,也都只是在模拟人类的艺术行为,如:让人工智能创作的画作、音乐、诗歌等产物更像人类作品,所谓系统A比系统B更智能,也不过是系统A的创作物可能“更像”人类的创作(顺带一提:这里所谓的“更像”,也很难存在客观统一的量化标准。现如今的评价指标,多为受试者的主观感受)。而人类艺术行为中另一个重要的环节,即艺术作为社会行为的创造性、意向性、情感性,则还远远无法被现在的人工智能系统所模拟。

因此,本文接下来就将探讨人工智能若要进行“真正”的艺术创作,其必须满足的条件或必须完成的任务。

3 人工智能如何进行真正的艺术创作

在本文中我们依循陶锋老师的定义——人工智能要想完成真正智能的艺术创作,其需要对人类的两方面作出模拟:其一是对人类艺术行为的模拟,其二则是对人类在艺术活动中表现出的情感行为的模拟。

对于人类艺术行为的模拟,我们不需作更多讨论,现如今的小冰乐队、九歌作诗系统等所具有的“智能”,就可被看作是对人类艺术行为的模拟。随着机器学习、深度学习等技术日新月异,通过基于海量数据的学习方法,我们相信人工智能系统将对人类艺术行为模仿得越来越“逼真”。下面,我们将着重探讨人工智能如何模拟人类在艺术活动中的情感行为。

3.1 人工智能如何模拟艺术中的情感

对于人类在艺术活动中的情感行为,大致可分为三个方面:(1)艺术作品如何表现艺术家的情感(艺术家 -> 艺术作品);(2)观众如何感受艺术作品的情感(艺术作品 -> 观众);(3)观众之间的情感交流(观众 <-> 观众)。对于人工智能系统来说,一旦其有所输出,即创作出作品,那么后两项情感行为就可以被相继完成了(例如:在计算机创作出一首曲子之后,我们个人能够聆听它,也能够与他人探讨这首作品)。那么,问题的关键就在于人工智能(体)的创作物,如何能够表现人工智能(体)的情感。

自然地,何为情感?或者说,何为我们人类可以理解的情感?这里应首先明确一点,现代科学理论或许可以从解剖学、脑科学等方面对人类情感的物质基础作出一定的解释,但还无法确切地阐明“情感是如何产生的”、“不同的情感究竟是由什么物质决定的”。因此,对于情感的模拟,暂时还无法采用演绎法的形式(即:从人的内在感官反应机制去模拟情感行为),而只能采用经验归纳(即:对人类表现出的情感特征进行形式化建模),从外部设计情感行为。

现有的情感计算(Affective Computing)领域,已经能够对人类外部的情感特征,如面部表情、心跳速率、皮肤温度等生理特征进行建模,且能够用定量的方法描述艺术作品中体现出创作者情感的痕迹(如绘画作品中的线条、色彩,文学作品中的文本等)。除此之外,一些学者还认为可以用形式化的符号语言来表达情感。例如,我们可以将情感建模为多种动机的激发、生成、妨碍或识别,从而用符号语言来表示情感。

综上所述:一方面,目前已经存在一些可以对人类情感进行形式化表示的方法,这为人工智能模拟人类情感行为带来了可能,未来的人工智能系统或许能够在某种程度上生成情感、在创作物中表现出情感;另一方面,对于人类情感产生机制的认知仍处在较浅显的阶段,随着脑科学、神经科学等多学科的共同发展,或许我们能够在将来设计出更好的形式化建模情感的人工智能系统。

3.2 人工智能的艺术创作是否具有自我意识

通过以上的论证,我们看到人工智能系统有可能完成艺术创作的两方面的任务:其一,从行为上看,其创作内容能够模拟人类创作的艺术品;其二,人工智能系统的创作物能够在一定程度上表现出系统的情感活动。那么,我们可以说这样的人工智能已经完成了真正的艺术创作吗?

或许还不够。或者说,即使人工智能的创作物从外在表现上看已与人类无异,但对于人类而言,我们仍然“觉得”这样的系统不够智能——就像蜜蜂会无意识地在空中摆出漂亮的轨迹,玫瑰会无意识地开放夺目的花朵,这些行为也许在人类欣赏起来是“美”的,但我们并不认为蜜蜂、玫瑰就是艺术家——也就是说,我们希望对真正的艺术创作而言,其创作者确实拥有情感,而非仅仅表现出情感;我们希望创作者拥有自我意识,能够确切地知道自己在从事艺术活动,而非仅仅无意识地模拟艺术行为(尽管这种艺术行为中可能已存在情感显现)。从这一点来看,我们又回到了所有通用人工智能系统都在面临的一般哲学问题:人工智能系统是否拥有,或是否能够拥有自我意识呢?

探讨人工智能的自我意识,就不得不提大名鼎鼎的图灵测试:“如果一个人(代号C)使用测试对象皆理解的语言去询问两个他不能看见的对象任意一串问题。对象为:一个是正常思维的人(代号B)、一个是机器(代号A)。如果经过若干询问以后,C不能得出实质的区别来分辨A与B的不同,则此机器A通过图灵测试。”[6] 而能够通过图灵测试的机器,就被认为其能够有意识地进行思考。

但图灵测试也广受争议,例如约翰·希尔勒就提出“中文屋”实验进行反驳:“一个对中文一窍不通,只会说英语的人被关在一间只有一个开口的封闭房间中。房间里有一本用英文写成的手册,指示该如何处理收到的汉语讯息及如何以汉语相应地回复。房外的人不断向房间内递进用中文写成的问题。房内的人便按照手册的说明,查找到合适的指示,将相应的中文字符组合成对问题的解答,并将答案递出房间。”[7] 约翰·希尔勒认为,尽管房里的人能够以假乱真,让房外的人以为他确确实实在说汉语,但实际上他却压根不懂汉语。在上述过程中,房外人的角色相当于程序员,房中人相当于计算机,而手册则相当于计算机程序:每当房外人给出一个输入,房内的人便依照手册给出一个答复(输出)。而正如房中人不可能通过手册理解中文一样,计算机也不可能通过程序来获得理解力。既然计算机没有理解能力,所谓“计算机便拥有智能”便更无从谈起了。

尽管图灵在提出测试的时候就已经设想过类似的反驳,也作出了相应的辩护:就算对于某个人而言,我们也只能从行为上判断他是否有意识,因为如果想要从动机上判断,他人是无法确定此人有没有意识的,除了他自己。因此,由行为动机去定义意识只会陷入“唯我论”。但是,在很多哲学家看来,图灵所批评的“唯我论”正是人类认识和事物存在的起点。

也许归根结底,哲学家、心理学家们关于自我意识的争论,都源于现代科学还不能对人类意识的物质基础、产生机制与运作规律作出确切的解释。既然我们连人类自身的“意识”都无法探讨明晰,那么对机器的“意识”存在争议也就在所难免。

4 结语

由此观之,目前的人工智能系统所进行的艺术创作,只是在作品的外在呈现上对人类的艺术行为进行模拟,随着情感计算等技术的不断发展,人工智能系统或许也能够逐渐模拟出人类的情感行为。但即便如此,人工智能的艺术创作也不能被称之为智能体的有意识创作,而更类似于动植物的无意识展示。期待生命科学、认知科学、脑科学、心理学等多个学科的共同发展,能够让我们早日明晰人类的情感、思维、意识等机制的运作规律,从而得以在此基础上再继续探讨人工智能的意识问题。

可能需要说明的是,对于人工智能艺术创作系统的设计、分析与探讨,其最终目的依然在于理解人类本身,我们旨在通过对人类艺术活动的模拟,来探究艺术的本质、艺术家的思维与情感的本质,我们希望融合多个学科的方法,来更立体地思考何以为美、何以为人。

参考文献

[1] Zhu H, Liu Q, Yuan N J, et al. XiaoIce Band: A Melody and Arrangement Generation Framework for Pop Music[C]. Knowledge Discovery and Data Mining, 2018: 2837-2846.

[2] Gatys L A, Ecker A S, Bethge M, et al. Image Style Transfer Using Convolutional Neural Networks[C]. Computer Vision and Pattern Recognition, 2016: 2414-2423.

[3] Elgammal A, Liu B, Elhoseiny M, et al. CAN: Creative Adversarial Networks, Generating “Art” by Learning About Styles and Deviating from Style Norms[J]. arXiv: Artificial Intelligence, 2017.

[4] 维基百科,“艺术”词条:https://zh.wikipedia.org/wiki/%E8%89%BA%E6%9C%AF.

[5] 陶锋. 人工智能美学如何可能[J]. 文艺争鸣, 2018, 5: 80-85.

[6] 维基百科,“图灵测试”词条:https://zh.wikipedia.org/wiki/%E5%9B%BE%E7%81%B5%E6%B5%8B%E8%AF%95.

[7] 维基百科,“中文房间”词条:https://zh.wikipedia.org/wiki/%E4%B8%AD%E6%96%87%E6%88%BF%E9%97%B4.