AI创作 – gitweixin

人工智能 4月 2,2023

零样本学习和生成人工智能的基础

我们可能记得 2022 年是认知人工智能技术从实验室走向主流应用的一年。 ChatGPT 是一种回答问题的对话式 AI，在不到一周的时间内用户从零增加到一百万。图像生成 AI DALL-E 2、Midjourney 和 Stable Diffusion 开放了公众访问，并以从短短语和句子生成的图像的多样性和质量吸引了全世界的关注。
我承认玩 DALL-E 2 很有趣。这是两个迷失的灵魂在鱼缸里游泳的演绎，蒂姆伯顿描绘了打开未成熟鳄梨的痛苦。
Snowflake 产品管理总监 Torsten Grabs 表示：“人工智能已经成为特斯拉和 Waymo 等自动驾驶汽车、无与伦比的游戏玩法（想想 AlphaGo）以及 DALL-E 等迷人的艺术一代等项目的头条新闻。”
许多机器学习模型使用监督学习技术，其中使用标记数据集训练神经网络或其他模型。例如，您可以从标记为猫、狗和其他宠物的图像数据库开始，然后训练 CNN（卷积神经网络）对它们进行分类。
在现实世界中，大规模标记数据集既昂贵又复杂。医疗保健、制造业和其他行业有许多不同的用例来做出准确的预测。合成数据可以帮助扩充数据集，但训练和维护监督学习模型的成本仍然很高。
要了解生成式 AI，首先要了解不依赖于标记数据集的学习算法。单次和零次学习算法是示例方法，它们是生成式 AI 技术的基础。
以下是 ChatGPT 定义单次学习和零次学习的方式：
John Snow Labs 的首席技术官 David Talby 说：“顾名思义，单次或少量学习旨在从一个或仅几个示例中对对象进行分类。目标是让人类用简单的英语提示模型成功识别图像、短语或文本。”
一次性学习是通过对每个样本进行单一训练示例来执行的，比如新员工的头像。然后该模型可以计算两个头像之间的相似度分数，例如与样本匹配的人的照片，并且该分数确定足够的匹配以授予访问权限。一次性学习的一个示例使用了 Omniglot 数据集，该数据集包含来自 50 个不同字母表的 1,623 个手绘字符。
在零样本学习中，网络接受图像和相关数据的训练，包括字幕和其他上下文元数据。零样本学习的一种方法使用 OpenAI 的 CLIP（对比语言-图像预训练）将图像降维为编码，从文本中创建所有可能标签的列表，然后计算匹配图像与标签的相似度得分。然后可以使用该模型使用相似性得分将新图像分类为标签。
OpenAI 的生成 AI DALL-E 使用 CLIP 和 GAN（生成对抗网络）来执行反向功能并从文本创建图像。
小样本学习技术的一项应用是在医疗保健领域，其中带有诊断结果的医学图像可用于开发分类模型。 “不同的医院可能会以不同的方式诊断病情，”Talby 说。 “通过一次或几次学习，临床医生可以在不使用代码的情况下提示算法来实现特定结果。”
但不要指望全自动放射学诊断会过早出现。 Talby 说：“虽然自动提取信息的能力非常有价值，但一次性、少量甚至零样本学习不会很快取代医疗专业人员。”
Persistent 的首席技术官 Pandurang Kamat 分享了其他几个潜在的应用。 “零样本和少样本学习技术在药物发现、分子发现、零日攻击、客户支持团队的案例偏转以及其他可能很难标记训练数据的领域释放机会。”
Kamat 还警告当前的局限性。 “在计算机视觉中，这些技术在图像识别、分类和跟踪方面效果很好，但在需要高精度/精确度的场景中可能会遇到困难，例如识别癌细胞并在病理图像中标记它们的轮廓，”他说。
制造业在识别缺陷方面也有潜在的小样本学习应用。 IndustrialML 的首席执行官 Arjun Chandar 说：“没有任何一家运营良好的工厂会产生足够多的缺陷来拥有大量的缺陷类图像来进行训练，因此需要构建算法以基于少至几十个样本来识别它们。”
数据科学家可能会尝试使用单次和零次学习方法来解决未标记数据集的分类问题。学习算法和工具的一些方法包括使用 Amazon SageMaker 构建基于新闻的警报系统或在会话代理中使用零样本学习。
开发人员和数据科学家还应该将新的学习技术和可用模型视为新应用程序和解决方案的构建块，而不是针对特定问题优化的模型。例如，Moveworks 的工程总监 Chang Liu 表示，开发人员可以利用大规模 NLP（自然语言处理）模型，而不是自己构建模型。
“随着大型语言模型的引入，团队正在利用这些智能系统大规模解决问题。语言模型不需要构建一个全新的模型，只需要根据任务的描述和适当的答案进行训练，”刘说。
未来的人工智能解决方案可能看起来像今天的软件应用程序，混合了专有模型、嵌入式商业和开源组件以及第三方服务。 Snowflake 的 Grabs 表示：“几乎所有愿意花时间定义 AI 解决方案问题并采用新工具和实践来产生初始和持续改进的公司都可以获得成就。”
我们可能会在 2023 年看到新的学习方法和 AI 成就，因此数据科学团队必须不断研究、学习和试验。

作者 east

chatgpt 3月 21,2023

小说家用chatgpt写小说

今年早些时候，我写了一篇关于在小说中使用 AI 的类型小说作家的文章。大多数是为亚马逊的 Kindle 平台写作的，那里的出版速度非常快，快到每月一本书，是常态。人工智能帮助他们快速写作，但也引发了复杂的审美和伦理问题。人工智能的广泛使用是否会使小说偏向最常见的惯例和比喻？在写作不再像他们自己之前，写作过程的哪些部分可以自动化？作者是否必须披露他们对 AI 的使用？随着 ChatGPT 的首次亮相，这些作家正在处理的许多问题变得更加紧迫和主流。我与其中一位作者詹妮弗·莱普 (Jennifer Lepp) 进行了核对，她以笔名 Leanne Leeds 撰写舒适的超自然神秘子流派，看看她现在是如何看待人工智能的。她仍在使用基于 GPT-3 的工具 Sudowrite——事实上，她现在得到报酬为公司的博客撰写使用该工具的技巧——并开始将一些更新的工具融入她的小说中。我们谈到了使用 ChatGPT 的感觉、它的首次亮相如何搅动独立作者社区以及其他话题。

当我们上次交谈时，您经历了使用 Sudowrite 的演变，首先主要是作为一种同义词库，然后尝试将其文本融入您的工作，然后让它引导您并获得疏远的体验并重新控制它并主要使用它来充实您概述的描述。你现在的流程是怎样的？好吧，我曾希望它能帮助我同时写两本书，但最终以失败告终。显然，我仍然与自己的作品有关。所以，一方面，这很好。您认为它可以让您来回切换并同时写两本书吗？我想，嘿，如果我不知道该写什么，我就往里面塞点东西，它会让我继续前进，然后我会马上回到我一周前离开的那本书。事情并非如此。如果我不知道自己在做什么，它向我吐出什么也没关系。它不会帮助我重新连接我已经写过的材料。您和其他一些独立作者是这些工具的早期采用者。使用 ChatGPT，感觉就像很多其他人突然都在努力解决与您面临的相同问题。那是什么样的？我肯定还在挣扎，我想我在更公开地挣扎了一点。在大多数情况下，以前的人们有点翻白眼——我认为他们不明白人们使用 AI 的目的。 ChatGP3 爆炸了。我所在的每一个小组，每一个私人的幕后作者小组，都在进行某种讨论。现在，每个人都在谈论在外围设备上使用它。但两者之间似乎存在这种道德鸿沟：“它做广告真的很好，我讨厌做广告，我必须花钱请人做广告，而广告不是写作，所以我打算用它来做广告 ” 或者“好吧，我要让它帮助我收紧我的情节，因为我讨厌情节，但它的情节非常好，所以我打算用它来做这件事。” 或者“你知道吗，如果你告诉它校对，它会确保它在语法上是正确的？”

每个人都越来越接近用它来写他们的东西，然后他们停下来，每个人似乎都觉得他们在谈论这个时必须宣布：“但我从来没有用它来写我的书 ” 我愿意。它不会推动我的情节。它通常不会驱动我书中的任何想法。它不会创建角色。但实际的话，只是为了更快地把它们记下来并把它说出来，我做到了。所以在过去的几周里我发现自己在想，我要参与这场辩论吗？我说什么吗？大多数情况下，我什么也没说。你认为人们画的线是什么？这是剽窃的问题。每个人都知道他们在获得许可和未经许可的情况下爬取了东西。还有一个道德问题。我可以进去——现在，我正在听 Jim Butcher 的有声读物。我喜欢他的语气。我喜欢面无表情的蛇。因此，当我考虑尝试用角色获得类似的东西时，我进入了 AI，并说：“以 Jim Butcher 的风格重写它。” 砰！同样的面无表情，都市幻想的措辞。那么，它从哪里得到的？这几乎与视觉艺术家的争论和恐惧完全相同。这在艺术家社区中更为明显。我广泛阅读了三位作者的作品，他们都是我的朋友，我知道他们从来没有允许我看他们的东西，我能够合理地重现他们的风格。您是否看到将 AI 用于描述之类的内容与使用它来模仿其他作者的声音之间的界限？是的。那我不会做的。对我来说，这是一条道德底线。我可能喜欢吉姆·布彻，我希望上帝保佑我能像他一样写作，但我不会拿我的故事用他的声音重写来敲诈他。但是，如果您在道德上同意这一点，那么您可以使用这项技术及其允许您做的事情。您是否已将 ChatGPT 纳入您的工作？现在，我将它用于标题和情节——特别是神秘情节。和宣传语。我基本上只是告诉它我是谁以及我需要什么。 “我正在写一部发生在得克萨斯州桌岩小镇的超自然悬疑小说。它有一个女性业余侦探。这是她的名字。我需要一个谋杀受害者。我需要他们是怎么被杀的。我需要四名谋杀嫌疑犯，并提供有关他们为何被怀疑以及如何洗清罪名的信息。然后告诉我凶手是谁。” 它会做到这一点。它会吐出来。

它给了你哪些东西？现在，我有第二、三、四、五、六和七本书的[情节]，所有这些谋杀之谜都是 ChatGPT 生成的，尽管我编辑了其中一些。令人印象深刻的是，如果我告诉它这是一个温馨的谜团，并且告诉它它需要幽默，它似乎就能理解我的要求。它给我的嫌疑人的名字很可爱。其背后的原因从来都不是血腥或严肃的。你觉得你可以将它的那部分自动化并且仍然感觉可以控制故事吗？一个舒适的谜团有两个部分。有谋杀，谋杀是所有角色都围绕的事情。但对我来说，谋杀往往不如所有的循环重要。所以必须有谋杀，而且必须有趣和有趣，并给出混乱和奇怪的原因。但它是什么对情节几乎无关紧要，即使它是驱动一切的东西。 “进展如此之快，以至于真正回答了一些问题。” 您在电子邮件中提到您正在使用 AI 制作书籍封面。我没有在 DALL-E 上完成整个封面，但在我拥有的第七本书中，我勾画了一个涉及一只 Lykoi 猫的情节。这是一只丑到可爱的猫。这显然是一个相当新的品种，就像有毛猫和无毛猫的杂交品种。所以它在某些地方有毛发，看起来像狼人。所以我必须找到一个可以拍摄的摄影师，找到一只 Lykoi 猫，付钱给每个人以获得我需要的图像和封面。这太贵了。所以百灵鸟，我当时想，嗯？我想知道… 然后我去开户，跳进了 DALL-E。繁荣！对我来说，它节省了很多时间和金钱，而且封面看起来很棒，但摄影师没有得到报酬，对吧？想要给他们的猫摆姿势的人没有得到报酬。您如何看待这些工具以及作家使用它们的方式的演变？我真的只是被困在中间，想知道它会走哪条路。我绝对不想鼓励不习惯使用它的人使用它。我确实认为它会渗入他们的生活。它已经泄漏到我们所有其他软件中，所以我认为很难摆脱它。但我绝对不知道它的去向。 ChatGPT 把我吓坏了。我曾想，好吧，这需要三四年时间，它会变得更好。然后出现了 ChatGPT，天啊，那好多了！已经六个月了！进展如此之快，真正得到解答的问题如此之少。

如何用chatgpt写某个主题的小说提示词运用实例
 利用chatgpt扩展写小说提示词运用实例
 如何使用 ChatGPT 写文章
 使用 GPT3 帮助您写一篇读者会记住的博客

作者 east

chatgpt 3月 14,2023

数学家利用chatgpt做数学研究

有一位著名的数学家陶哲轩（Terence Tao）曾经在网上分享过他如何使用ChatGPT来辅助他的数学研究。他认为ChatGPT虽然数学能力不强，但是可以作为一个发散思维的工具，帮助他寻找公式、提示、术语等相关信息。他还用ChatGPT来改写论文语句、查询小语种数学名词的发音等。

陶哲轩给出了一些具体的例子，比如说他用ChatGPT来解决同事提出的一个问题，虽然ChatGPT给出的答案是错误的，但是它提到了一个高度相关的术语：对数矩生成函数，并且给出了一个具体的例子。陶哲轩仔细分析了ChatGPT的解答过程，发现它用到了一个和标准答案很接近的公式。他还用儿子帮忙做的ChatGPT手机短信版来证明有无穷多个素数，发现ChatGPT给出了一个他从未见过的论证思路。

陶哲轩总结说，ChatGPT在处理数学问题时可以做一些半成品的语义搜索工作，也就是说不用提供确切的答案，只用生成一些可能的提示。然后结合传统搜索引擎就可以找到答案。他还把传统计算机软件和AI工具做了一个类比：传统计算机软件就像是数学中的标准函数，比较死板；AI工具更像是数学中的概率函数，会更加灵活。

陶哲轩对AI在数学研究中的应用非常感兴趣，他还组织了一场机器学习辅助证明主题研讨会，展示了很多前沿成果。他还分享了如何用数学结合机器学习预测火灾变化等实际问题。

这些例子可以说明数学家利用ChatGPT做数学研究是有可能和有价值的。当然，这也需要数学家有足够的专业知识和创造力，以及对AI工具有正确和合理的期待和使用方式。

作者 east

深度学习 1月 28,2023

使用 GPT3 帮助您写一篇读者会记住的博客

写博客时时间紧迫或缺乏灵感？别担心 – GPT3 游乐场即将让您的生活真正轻松。

我假设您知道 GPT3 是什么，并且您已经拥有可以访问 GPT3 Playground 的 OpenAI 帐户。您可以在此处访问游乐场。

1.集思广益

对我来说，第三个想法通常是黄金点子。因为我会在淋浴时有一个绝妙的想法……最终不可避免地会变得太宽泛，我在大约 1/3 的方式中失去了动力。我对这篇文章的第一个想法是如何构建一个应用程序，它使用 GPT3 但这太宽泛了（对很多人来说用处不大）

我的第二个想法是如何构建一个使用 GPT3 的写作应用程序……这会更有用，但我不想泄露我所有的秘密��

所以我决定如何写一个你的读者会记住的博客（在 GPT3 的帮助下）。这适合所有喜欢 DIY 的人。

此提示将帮助您深入了解想法，以便：

帮助 GPT3 帮你写（更多）

更好地吸引目标读者（你应该有一个！）。

这是提示语。

Create a list of content ideas related to [topic]. Focus on the following keywords:

[keywords]

These content ideas are for a person who [insert persona here]

如果你有一个主题（你最初的想法）、关键词和你想与之交谈的特定人，你几乎可以保证得到一个惊人的主题列表，你可以写。

您可能会节省其中的 30%。

好消息 – 在 GPT3 playground 中产生这些想法需要 30 秒，而不是你自己的 30 分钟。

2.生成大纲

一旦我从 GPT3 得到一个粗略的轮廓，我几乎总是会（大量）编辑它。编辑大纲比完整的帖子更容易。

这是我用来生成平均博客大纲的提示语：

Create a blog outline with the topic of “[title]” for a reader who [reader description]. //IF YOU HAVE KEYWORDS YOU WANT TO FOCUS ON ADD THIS: Use the following keywords if possible: [keywords]

Outline as markdown:

我喜欢 markdown，因为它很容易阅读，而且 GPT3 已经知道什么是 markdown。

想好主题后，将其输入 GPT3 提示框以生成大纲。这将是您撰写博文的基础，因此请根据需要对其进行审查和编辑。

3. 写草稿

“引导”GPT3 生成对您有价值的东西的最佳方法是欺骗它，让它认为它是根据您的提示提出来的，并且它只是在继续思考。这就像一个真正梦幻般的天才（或蹒跚学步的孩子），具体取决于您问的是谁，但重要的是不要打破咒语。

这实际上是谷歌和其他公司试图检测内容是否由 AI 创建的方式。但这是另一天的博客文章。

一旦我有了一个大纲，我几乎总是会跳过生成一个完整的博客并自己充实内容。但是 – 如果你想得到一个像样的草稿，这里有一个提示：

Create a full and comprehensive blog post on the “[topic]” from the following outline for a reader with the persona who [persona description]. Do not include a table of contents.

Outline:

[outline]

1000 word [contentType] formatted as markdown:

这应该输出一个 500-1000 字的博客。如果没有，点击重试几次，直到你能让 AI 做你想让它做的事。 GPT3 不擅长数词，也不擅长说真话。所以你一定要在点击发布之前检查你的博客的准确性（并不是说你会发布人工智能写的东西而不编辑它，对吧？！）

同样，我喜欢 markdown，因为它让我更容易阅读。如果您不在乎，可以删除该部分。

4、编辑发表

如果您一直在关注，您就会在 GPT3 操场上看到一个博客的草稿。在将其复制并粘贴到 Google 文档或 Word 之前，请帮自己一个忙，让 GPT3 对您的内容进行编辑传递（为您节省一些时间，听起来不像机器人）。你可以使用这个示例提示，但你不能在这里出错（随意试验！）

You’re a writer for the NYT writing an amazing blog. What do we need? Let’s think step by step.

First, we need a first draft.

First draft:

[your draft from the step above]

Then, we can write our final draft and lets format it as Markdown.

Final Draft:

这应该使您的内容听起来不像机器人。您还可以尝试一些很酷的事情，例如：

像我是 16 世纪的英国海盗一样重写此博客

写一个很好的论据来反对这个博客。我真的很喜欢这个，因为人工智能在反对我的观点方面做得很好

以[著名作者]的风格重写此博客

我希望本指南能帮助您成为更好的作家并与世界分享更多有价值的内容。

作者 east

标签归档AI创作