什么是生成式人工智能？人工智能的演变

生成式 AI 是任何一种使用算法来生成、操作或合成数据的自动化过程的总称，通常以图像或人类可读文本的形式出现。之所以称为生成式，是因为 AI 创造了以前不存在的东西。这就是它与判别式 AI 的不同之处，判别式 AI 会区分不同类型的输入。换句话说，有辨别力的人工智能试图回答这样的问题：“这张图片是画兔子还是狮子？”而生成式 AI 会响应诸如“给我画一张狮子和兔子坐在一起的照片”之类的提示。
本文向您介绍生成式 AI 及其在 ChatGPT 和 DALL-E 等流行模型中的用途。我们还将考虑该技术的局限性，包括为什么“太多的手指”已成为人工生成艺术的死胡同。
生成式 AI 已经存在多年，可以说自 1966 年麻省理工学院开发了 ELIZA 以来，ELIZA 是一种模拟与治疗师交谈的聊天机器人。但是随着新的生成式 AI 系统的发布，多年来在 AI 和机器学习方面的工作最近取得了成果.您几乎肯定听说过 ChatGPT，这是一种基于文本的 AI 聊天机器人，可以生成非常像人类的散文。 DALL-E 和 Stable Diffusion 也因其根据文本提示创建生动逼真的图像的能力而备受关注。我们经常将这些系统和其他类似的系统称为模型，因为它们代表了一种尝试，即基于有关现实世界的信息子集（有时是一个非常大的信息子集）来模拟或建模现实世界的某些方面。
这些系统的输出是如此不可思议，以至于许多人都在问关于意识本质的哲学问题——并担心生成人工智能对人类工作的经济影响。但是，尽管所有这些人工智能创造无疑都是大新闻，但可以说，表面之下发生的事情并不像某些人想象的那样。稍后我们将讨论其中一些大问题。首先，让我们看看 ChatGPT 和 DALL-E 等模型的幕后情况。
生成式 AI 使用机器学习来处理大量视觉或文本数据，其中大部分是从互联网上搜集而来的，然后确定哪些事物最有可能出现在其他事物附近。生成式 AI 的大部分编程工作都用于创建算法，这些算法可以区分 AI 的创建者感兴趣的“事物”——ChatGPT 等聊天机器人中的单词和句子，或者 DALL-E 中的视觉元素。但从根本上说，生成式人工智能通过评估其训练所依据的大量数据来创建输出，然后根据该语料库确定的概率范围内的内容来响应提示。
自动完成——当您的手机或 Gmail 提示您输入的单词或句子的剩余部分可能是什么时——是一种低级形式的生成 AI。像 ChatGPT 和 DALL-E 这样的模型只是把这个想法带到了更先进的高度。
开发模型以容纳所有这些数据的过程称为训练。对于不同类型的模型，一些底层技术在这里发挥作用。 ChatGPT 使用所谓的转换器（T 代表什么）。转换器从一长串文本中获取意义，以了解不同的词或语义成分可能如何相互关联，然后确定它们出现在彼此附近的可能性有多大。这些转换器在一个称为预训练（即 Pin ChatGPT）的过程中在大量自然语言文本上无人监督地运行，然后由与模型交互的人类进行微调。
另一种用于训练模型的技术是所谓的生成对抗网络或 GAN。在这种技术中，您有两种相互竞争的算法。一种是根据从大数据集导出的概率生成文本或图像；另一个是有辨别力的人工智能，它经过人类训练，可以评估输出是真实的还是人工智能生成的。生成式 AI 反复尝试“欺骗”判别式 AI，自动适应有利于成功的结果。一旦生成性 AI 持续“赢得”这场比赛，判别性 AI 就会被人类微调，并且这个过程会重新开始。
这里要记住的最重要的事情之一是，虽然在训练过程中有人为干预，但大部分学习和适应都是自动发生的。需要如此多的迭代才能使模型产生有趣的结果，因此自动化是必不可少的。该过程在计算上相当密集。
用于创建和训练生成式 AI 模型的数学和编码非常复杂，远远超出了本文的范围。但是，如果您与作为此过程最终结果的模型进行交互，那么这种体验无疑是不可思议的。您可以让 DALL-E 生产看起来像真正艺术品的东西。您可以与 ChatGPT 进行对话，就像与另一个人对话一样。研究人员真的创造了一台思考机器吗？
从事 Watson AI 产品工作的前 IBM 自然语言处理负责人 Chris Phipps 说不。他将 ChatGPT 描述为“非常好的预测机器”。
Phipps 也是一名喜剧演员，他将游戏与一种名为 Mind Meld 的普通即兴游戏进行了比较。
我们可以向这些 AI 模型提供某些提示，这将使 Phipps 的观点更加明显。例如，考虑“什么更重，一磅铅还是一磅羽毛？”这个谜语。答案当然是它们的重量相同（一磅），尽管我们的直觉或常识可能告诉我们羽毛更轻。
ChatGPT 会正确回答这个谜语，您可能会认为它会这样做，因为它是一台冷酷的逻辑计算机，没有任何“常识”来使它出错。但这不是幕后发生的事情。 ChatGPT 并没有从逻辑上推理出答案；它只是根据对关于一磅羽毛和一磅铅的问题的预测来生成输出。由于它的训练集包括一堆解释谜语的文本，它会组装一个正确答案的版本。但如果你问 ChatGPT 两磅羽毛是否比一磅铅重，它会自信地告诉你它们的重量相同，因为根据其训练集，这仍然是关于羽毛和铅的提示最有可能的输出。告诉 AI 它错了并看着它做出反应可能很有趣；我让它为它的错误向我道歉，然后建议两磅羽毛的重量是一磅铅的四倍。