什么是生成式人工智能?人工智能的演变

生成式 AI 是任何一种使用算法来生成、操作或合成数据的自动化过程的总称,通常以图像或人类可读文本的形式出现。之所以称为生成式,是因为 AI 创造了以前不存在的东西。这就是它与判别式 AI 的不同之处,判别式 AI 会区分不同类型的输入。换句话说,有辨别力的人工智能试图回答这样的问题:“这张图片是画兔子还是狮子?”而生成式 AI 会响应诸如“给我画一张狮子和兔子坐在一起的照片”之类的提示。
本文向您介绍生成式 AI 及其在 ChatGPT 和 DALL-E 等流行模型中的用途。我们还将考虑该技术的局限性,包括为什么“太多的手指”已成为人工生成艺术的死胡同。
生成式 AI 已经存在多年,可以说自 1966 年麻省理工学院开发了 ELIZA 以来,ELIZA 是一种模拟与治疗师交谈的聊天机器人。但是随着新的生成式 AI 系统的发布,多年来在 AI 和机器学习方面的工作最近取得了成果.您几乎肯定听说过 ChatGPT,这是一种基于文本的 AI 聊天机器人,可以生成非常像人类的散文。 DALL-E 和 Stable Diffusion 也因其根据文本提示创建生动逼真的图像的能力而备受关注。我们经常将这些系统和其他类似的系统称为模型,因为它们代表了一种尝试,即基于有关现实世界的信息子集(有时是一个非常大的信息子集)来模拟或建模现实世界的某些方面。
这些系统的输出是如此不可思议,以至于许多人都在问关于意识本质的哲学问题——并担心生成人工智能对人类工作的经济影响。但是,尽管所有这些人工智能创造无疑都是大新闻,但可以说,表面之下发生的事情并不像某些人想象的那样。稍后我们将讨论其中一些大问题。首先,让我们看看 ChatGPT 和 DALL-E 等模型的幕后情况。
生成式 AI 使用机器学习来处理大量视觉或文本数据,其中大部分是从互联网上搜集而来的,然后确定哪些事物最有可能出现在其他事物附近。生成式 AI 的大部分编程工作都用于创建算法,这些算法可以区分 AI 的创建者感兴趣的“事物”——ChatGPT 等聊天机器人中的单词和句子,或者 DALL-E 中的视觉元素。但从根本上说,生成式人工智能通过评估其训练所依据的大量数据来创建输出,然后根据该语料库确定的概率范围内的内容来响应提示。
自动完成——当您的手机或 Gmail 提示您输入的单词或句子的剩余部分可能是什么时——是一种低级形式的生成 AI。像 ChatGPT 和 DALL-E 这样的模型只是把这个想法带到了更先进的高度。
开发模型以容纳所有这些数据的过程称为训练。对于不同类型的模型,一些底层技术在这里发挥作用。 ChatGPT 使用所谓的转换器(T 代表什么)。转换器从一长串文本中获取意义,以了解不同的词或语义成分可能如何相互关联,然后确定它们出现在彼此附近的可能性有多大。这些转换器在一个称为预训练(即 Pin ChatGPT)的过程中在大量自然语言文本上无人监督地运行,然后由与模型交互的人类进行微调。
另一种用于训练模型的技术是所谓的生成对抗网络或 GAN。在这种技术中,您有两种相互竞争的算法。一种是根据从大数据集导出的概率生成文本或图像;另一个是有辨别力的人工智能,它经过人类训练,可以评估输出是真实的还是人工智能生成的。生成式 AI 反复尝试“欺骗”判别式 AI,自动适应有利于成功的结果。一旦生成性 AI 持续“赢得”这场比赛,判别性 AI 就会被人类微调,并且这个过程会重新开始。
这里要记住的最重要的事情之一是,虽然在训练过程中有人为干预,但大部分学习和适应都是自动发生的。需要如此多的迭代才能使模型产生有趣的结果,因此自动化是必不可少的。该过程在计算上相当密集。
用于创建和训练生成式 AI 模型的数学和编码非常复杂,远远超出了本文的范围。但是,如果您与作为此过程最终结果的模型进行交互,那么这种体验无疑是不可思议的。您可以让 DALL-E 生产看起来像真正艺术品的东西。您可以与 ChatGPT 进行对话,就像与另一个人对话一样。研究人员真的创造了一台思考机器吗?
从事 Watson AI 产品工作的前 IBM 自然语言处理负责人 Chris Phipps 说不。他将 ChatGPT 描述为“非常好的预测机器”。
Phipps 也是一名喜剧演员,他将游戏与一种名为 Mind Meld 的普通即兴游戏进行了比较。
我们可以向这些 AI 模型提供某些提示,这将使 Phipps 的观点更加明显。例如,考虑“什么更重,一磅铅还是一磅羽毛?”这个谜语。答案当然是它们的重量相同(一磅),尽管我们的直觉或常识可能告诉我们羽毛更轻。
ChatGPT 会正确回答这个谜语,您可能会认为它会这样做,因为它是一台冷酷的逻辑计算机,没有任何“常识”来使它出错。但这不是幕后发生的事情。 ChatGPT 并没有从逻辑上推理出答案;它只是根据对关于一磅羽毛和一磅铅的问题的预测来生成输出。由于它的训练集包括一堆解释谜语的文本,它会组装一个正确答案的版本。但如果你问 ChatGPT 两磅羽毛是否比一磅铅重,它会自信地告诉你它们的重量相同,因为根据其训练集,这仍然是关于羽毛和铅的提示最有可能的输出。告诉 AI 它错了并看着它做出反应可能很有趣;我让它为它的错误向我道歉,然后建议两磅羽毛的重量是一磅铅的四倍。