gitweixin
  • 首页
  • 小程序代码
    • 资讯读书
    • 工具类
    • O2O
    • 地图定位
    • 社交
    • 行业软件
    • 电商类
    • 互联网类
    • 企业类
    • UI控件
  • 大数据开发
    • Hadoop
    • Spark
    • Hbase
    • Elasticsearch
    • Kafka
    • Flink
    • 数据仓库
    • 数据挖掘
    • flume
    • Kafka
    • Hive
    • shardingsphere
    • solr
  • 开发博客
    • Android
    • php
    • python
    • 运维
    • 技术架构
    • 数据库
  • 程序员网赚
  • bug清单
  • 量化投资
  • 在线查询工具
    • 去行号
    • 在线时间戳转换工具
    • 免费图片批量修改尺寸在线工具
    • SVG转JPG在线工具

python怎样安装tls_client

精品微信小程序开发门户,代码全部亲测可用

  • 首页   /  
  • 作者: east
  • ( 页面43 )
python 4月 10,2023

python怎样安装tls_client

“tls_client”是Python的第三方库,可以使用pip命令来安装。请按照以下步骤进行操作:

  • 打开终端或命令提示符。
  • 输入以下命令来升级pip工具:
pip install --upgrade pip 
  • 输入以下命令来安装tls_client:
pip install tls_client 
  • 等待一段时间,直到安装完成。
  • 完成安装后,您可以在Python代码中导入tls_client模块并开始使用它:
import tls_client 

请注意,如果您使用的是conda环境,则需要在conda环境中使用pip命令来安装tls_client。如果你遇到了任何问题,请检查您的Python版本和包管理器的设置,并确保您已连接到互联网。

作者 east
云计算 4月 9,2023

Databricks 添加了数据治理和市场功能

除了在年度数据 + AI 峰会上开源 Delta Lake 外,数据湖库提供商 Databricks 周二还推出了一个新的数据市场以及新的数据工程功能。
该公司表示,新市场将在未来几个月推出,它将允许企业共享数据和分析资产,如表格、文件、机器学习模型、笔记本和仪表板,并补充说数据不必移动或出于共享目的从云存储中复制。
据该公司称,该市场将加速数据工程和应用程序开发,因为它允许企业访问数据集而不是开发数据集,并且还可以订阅仪表板进行分析而不是创建新的仪表板。
Databricks 表示,该市场将使共享数据资产的企业更容易将其货币化。
分析师表示,新市场在设计和战略上类似于 Snowflake 的数据市场。
“每个主要的企业平台(包括 Snowflake)都需要有一个可行的应用程序生态系统才能真正成为一个平台,Databricks 也不例外。它正在寻求成为数据资产的中心市场,应该被视为 ISV 和应用程序的直接机会寻求在 Delta Lake 之上建设的开发商,”Amalgam Insights 首席分析师 Hyoun Park 说。
Constellation Research 首席分析师 Doug Henschen 将 Databricks 的市场与 Snowflake 的市场进行比较,他表示,Databricks 数据市场目前的形式非常新,只解决内部和外部的数据共享问题,不像 Snowflake 添加了集成和支持数据货币化。
为了以安全的方式促进与其他企业的数据协作,该公司表示,它正在引入一种名为 Cleanrooms 的环境,该环境将在未来几个月内推出。
数据洁净室是一个安全的环境,允许企业匿名化、处理和存储个人身份信息,以便以后以不违反隐私法规的方式进行数据转换。
Databricks 的 Cleanrooms 将提供一种无需复制即可跨企业共享和加入数据的方法,该公司表示,并补充说,这些企业将能够与任何云上的客户和合作伙伴协作,并灵活地运行复杂的计算和工作负载SQL 和数据科学工具,包括 Python、R 和 Scala。
遵守隐私规范的承诺是一个有趣的提议,Park 说,并补充说其试金石将是它在具有严格监管准则的金融服务、政府、法律和医疗保健部门的采用。
Databricks 还推出了数项数据工程工具补充。
据该公司称,其中一种新工具 Enzyme 是一个新的优化层,用于加速 Delta Live Tables 中的提取、转换、加载 (ETL) 过程,该公司已于今年 4 月全面推出。
Ventana Research 研究总监 Matt Aslett 表示:“优化层专注于通过结合查询计划和数据变更需求分析,使用 Delta Live Tables 支持自动化增量数据集成管道。”
根据 Henschen 的说法,这一层有望“检查另一组客户期望的功能,这将使其作为传统数据仓库和数据集市平台的替代品更具竞争力。”
Databricks 还在其 Delta Lake 平台上宣布了下一代 Spark Structured Streaming,称为 Project Lightspeed,它声称将通过使用扩展的连接器生态系统来降低成本和延迟。
Databricks 将 Delta Lake 称为数据湖屋,建立在提供存储和分析功能的数据架构之上,这与以本机格式存储数据的数据湖和存储结构化数据(通常以 SQL 格式)的数据仓库形成鲜明对比快速查询。
“流数据是 Databricks 有别于其他一些数据湖屋提供商的一个领域,并且随着基于流数据和事件的实时应用程序变得更加主流而受到更多关注,”Aslett 说。
根据 Park 的说法,Spark 的第二次迭代表明 Databricks 对支持用于分析和机器学习的较小数据源越来越感兴趣。
“机器学习不再只是海量大数据的工具,而是实时和分布式数据的有价值的反馈和警报机制,”分析师说。
此外,为了帮助企业进行数据治理,该公司还推出了Data Lineage for Unity Catalog,未来几周内将在AWS和Azure上普遍可用。
“Unity Catalog 的普遍可用性将有助于改善 Lakehouse 资产的安全性和治理方面,例如文件、表格和 ML 模型。这对于保护敏感数据至关重要,”前大数据和分析研究副总裁 Sanjeev Mohan 说在 Gartner。
该公司还发布了 Databricks SQL Serverless(在 AWS 上)以提供完全托管的服务来维护、配置和扩展 lakehouse 上的云基础设施。
其他一些更新包括 Databricks SQL 的查询联合功能和 SQL CLI 的新功能,所有用户都可以直接从其本地计算机运行查询。
该公司表示,联合功能允许开发人员和数据科学家查询远程数据源,包括 PostgreSQL、MySQL、AWS Redshift 等,而无需先从源系统提取和加载数据。

作者 east
云计算 4月 8,2023

使用适用于 Cassandra 的 Azure 托管实例

大规模构建云原生应用程序需要谨慎选择堆栈。一个流行的工具是 Apache 的 Cassandra 项目,这是一个 NoSQL 数据库,旨在快速扩展而不影响应用程序性能。它是处理大数据的理想平台,内置基于 Hadoop 的 map-reduce 工具,以及它自己的查询语言。它最初由 Facebook 开发,后来被用于 CERN、Netflix 和 Uber。
Azure 最初通过 Azure Marketplace 中的 DataStax 产品提供 Cassandra 支持,然后将 Cassandra API 支持添加到其自己的分布式 Cosmos DB,并为希望在 Azure VM 上构建和部署自己的 Cassandra 系统的用户提供指导。它现在正在开发自己的 Cassandra 实现,公开预览一组 Cassandra 托管实例,旨在与 Cosmos DB 一起工作。
Cassandra 是一个分布式数据库,每个节点通过八卦协议相互连接。节点在多台机器上运行,组织为数据中心并部署为节点环。所有节点都是对等节点,因此如果任何一个节点丢失,系统可以在替换开始时继续运行。环也可以与其他环对等,允许您让本地系统与云托管系统一起工作,或者一个区域与其他区域一起工作以实现全球弹性。可以根据需要在环中添加或删除节点,提供线性缩放。要使性能或容量翻倍,您需要做的就是将节点数量翻倍。
微软的 Azure Managed Instance for Apache Cassandra 最好被认为是将本地数据扩展到 Cosmos DB 的一种方式。本地 Cosmos DB 自发布后不久就一直存在需求,但它与 Azure 平台的深度集成使得微软很难将其分离。通过提供其 Azure 实施和 Cosmos DB 之间的集成,现在可以设置一个 Azure 托管的 Cassandra 环,并将其与本地和 Cosmos DB 对等。您现在可以在本地和云之间复制数据,利用 Cosmos DB 的功能运行全球规模的分布式应用程序,同时使用本地 Cassandra 实例在您自己的数据中心处理受监管的数据操作。
使用托管实例还有其他优势,因为您可以将 Cassandra 环的大部分日常操作移交给 Azure。它将自动提供升级和更新,处理补丁,使您的数据库始终运行最安全的软件版本。由于管理开销较少,您可以专注于构建应用程序而不是维护堆栈。
设置和运行 Azure 的 Apache 及其任何其他托管开源数据库之间没有太大区别。首先登录到 Azure 门户,然后搜索 Managed Instance for Apache Cassandra 以创建集群。
您需要执行将 Azure 服务添加到订阅的大部分步骤,从将其添加到资源组和选择位置。同时,选择名称并选择主机 VM 类型。在当前预览版中,您仅限于连接到四个 P30 磁盘的 DS14_v2 服务器。这些是非常强大的基于 Xeon 的系统,具有 16 个 vCPU、112GB 内存和 224GB SSD。支持多达 64 个数据盘和 8 个网卡,带宽为 12,000 Mbps。预计每台服务器每小时至少支付 2.11 美元,具体取决于您提供服务的位置。 P30 磁盘每个磁盘提供 1TB 的存储空间,每月至少花费 122.88 美元(装载额外费用)。
在 Azure 中运行 Casandra 并不便宜,但它不适合小型应用程序。即使您仅将应用程序用作通向 Cosmos DB 的网关,您也会围绕应用程序转移大量数据。
下一步将您的实例链接到新的或现有的 Azure 虚拟网络。任何 VNet 都需要具有 Internet 访问权限,因为它需要链接到多个不同的 Azure 服务。其中包括支持虚拟机扩展、管理加密密钥和证书,以及与 Azure 的安全和身份验证服务集成。如果要连接到现有 VNet,则必须从 Azure CLI 添加适当的权限,否则部署将失败。
您现在已准备好创建集群。一旦部署完毕,下一步就是创建一个支持 Cassandra 库的管理虚拟机。这将允许您使用 Cassandra 查询工具来管理您的数据库,使用您在创建集群时设置的管理员密码。您现在可以开始使用 Cassandra。
如果您考虑使用 Azure 中的 Cassandra 作为 Cosmos DB 的桥梁,您需要将 Azure 资源配置为混合集群。和以前一样,在 Azure 中创建和部署 Cassandra 集群,设置其名称并将其连接到 Azure VNet。您需要为节点到节点加密配置 Cassandra,因此如果您的本地安装未使用它,请启用它。导出加密证书并使用 Azure CLI 将它们安装在 Azure 托管的群集中。这些将使您的两个站点能够通过加密的八卦连接进行通信。
VNet 需要通过专用的 Express Route 连接或使用站点到站点 VPN 连接到本地网络。你使用什么取决于你打算发送到 Azure 的数据量,尽管实验集群可能会使用 VPN 来避免设置专用多协议标签交换 (MPLS) 连接的成本。
您将需要在托管集群中创建一个新的数据中心,使用 Azure CLI 获取其种子节点的详细信息。这些被添加到您的本地系统的配置详细信息,以及定义您的站点到站点复制策略。这个过程非常简单,只需要用 Cassandra 的查询语言编写几行代码。
该服务的一个有趣方面是支持 Azure 基于 Apache Spark 的分析工具 Databricks。如果您在与托管 Cassandra 服务相同的 VNet 中安装 Databricks,然后使用 Apache Spark Cassandra 连接器链接到您的端点,则您可以使用 Spark 和 Databricks 笔记本对 Cassandra 托管的数据运行分析。
有趣的是,微软对混合云运营的承诺如何转化为数据处理。通过提供运行 Cassandra 的托管路径,该公司为您的本地工具和云之间的 NoSQL 数据提供了一个天然的桥梁。这是一种双向连接,可以在本地处理敏感数据,同时利用应用程序的云规模(并最终扩展到 Cosmos DB 的全球规模)。
Cassandra 自己的复制协议提供了桥梁,而 Azure 确保它是最新的和安全的。结果是一组有效的工具解决了与链接云和数据中心相关的许多问题,这些工具可以利用 Apache Spark 等工具将数据交付给依赖大数据的其他 Azure 服务。

作者 east
pgsql 4月 8,2023

pgsql运行出现 set – returning functions are not allowed in join conditions的错误

在 PostgreSQL 中,不允许在 JOIN 条件中使用返回 SET 类型的函数。这是因为,在执行 JOIN 操作时,需要根据 JOIN 条件将两个表中的行进行匹配和组合,而返回 SET 类型的函数可能会返回多行数据,无法直接用于 JOIN 条件。如果需要在 JOIN 条件中使用返回 SET 类型的函数,可以考虑改写查询语句,将函数的结果先存储到一个临时表中,然后再进行 JOIN 操作。或者,可以将该函数的结果提取出来,转化为数组或字符串等单一值类型,再在 JOIN 条件中使用。

以下是一个简单的示例代码,演示了如何避免在 JOIN 条件中使用返回 SET 类型的函数:

- 原始查询语句,会报错
SELECT *
FROM table1 AS t1
JOIN table2 AS t2 ON t1.id = ANY(my_function(t2.col));

-- 改写后的查询语句
WITH temp_table AS (
  SELECT id, my_function(col) AS set_col
  FROM table2
)
SELECT *
FROM table1 AS t1
JOIN temp_table AS tt ON t1.id = ANY(tt.set_col);

上述代码中,首先将返回 SET 类型的函数 my_function() 的结果存储到一个临时表 temp_table 中,并将其转化为数组形式。然后,在 JOIN 操作中使用 temp_table 表的列进行匹配。需要注意的是,实际应用中需要根据具体情况来修改查询语句,以适应不同的业务需求。

作者 east
pgsql 4月 7,2023

pgsql regexp_matches用法

PostgreSQL 中的 regexp_matches() 函数可以用于在一个字符串中匹配多个正则表达式,并返回所有匹配到的子字符串。其基本语法如下:regexp_matches(string, pattern [, flags])

其中:

  • string:要进行匹配的字符串。
  • pattern:用于匹配的正则表达式,可以包含一个或多个捕获组。
  • flags:可选参数,用于指定匹配模式,例如忽略大小写、支持换行、使用 POSIX 格式等。flags 的取值为一个字符组合,具体的取值和含义可以参考 PostgreSQL 文档。

函数的返回结果为一个二维数组,每个元素都是一个与正则表达式匹配的子字符串。以下是一个示例代码,演示了如何使用 regexp_matches() 函数从一个字符串中提取出所有的数字:

SELECT regexp_matches('abc123def456ghi', '\d+', 'g'); 

上述代码会返回一个二维数组,其中包含两个子数组,分别是匹配到的数字。也就是说,该函数返回的结果是:复制代码{{“123”}, {“456”}} 需要注意的是,PostgreSQL 还提供了很多其他的正则表达式函数,例如 regexp_replace()、regexp_split_to_array() 等等,这些函数都可以用于处理和操作字符串。

作者 east
python 4月 7,2023

python 定义一个列表和加入数据的例子

在 Python 中,定义一个列表可以使用方括号 [],并在其中指定元素。例如,下面的代码定义了一个包含三个整数的列表:

my_list = [1, 2, 3]

如果需要向列表中追加数据,可以使用 append() 方法。该方法可以在列表末尾添加一个元素。以下是一个示例代码,演示如何向列表中追加数据:

my_list = [1, 2, 3]

# 向列表末尾添加一个元素

my_list.append(4)

# 打印列表内容 print(my_list)

上述代码会输出包含四个整数的列表:

[1, 2, 3, 4]

除了 append() 方法,还可以使用 extend() 方法来一次性添加多个元素,或者使用 insert() 方法在指定位置插入元素,等等。根据具体应用场景选择合适的方法。

作者 east
python 4月 7,2023

python统计变量出现次数

在 Python 中,可以使用 collections 模块中的 Counter 类来统计变量出现的次数。Counter 可以接收任何可迭代对象,并返回一个字典,其中包含每个元素及其出现的次数。以下是一个简单的示例代码:

from collections import Counter

my_list = [1, 2, 3, 4, 1, 2, 3, 1, 2]
my_counter = Counter(my_list)

print(my_counter)

上述代码会输出一个字典,其中包含了 my_list 列表中每个元素及其出现的次数:

  
{1: 3, 2: 3, 3: 2, 4: 1}

如果需要按照出现次数从高到低排序,可以将结果转化为一个列表,并使用 sorted() 函数进行排序:

[(1, 3), (2, 3), (3, 2), (4, 1)]

需要注意的是,Counter 类还提供了很多其他的方法,例如 most_common() 方法可以返回出现次数最多的几个元素等等,可以根据具体业务需求选择合适的方法。

作者 east
人工智能 4月 7,2023

人工智能能否解决 IT 永恒的数据问题?

人工智能和机器学习已经为企业带来了大量实用价值,从欺诈检测到聊天机器人再到预测分析。但 ChatGPT 大胆的创意写作技巧将人们对 AI/ML 的期望提升到了新的高度。 IT 领导者不禁要问:AI/ML 是否最终准备好超越单点解决方案并解决核心企业问题?
以最大、最古老、最令人困惑的 IT 问题为例:管理和集成整个企业的数据。如今,随着本地和云平台上数据的数量、多样性、可变性和分布呈无休止的指数曲线攀升,这一努力迫切需要 AI/ML 技术的帮助。正如 IDC 数据集成和智能软件副总裁 Stewart Bond 所说:“你需要机器来帮助你管理它。”
AI/ML 真的可以帮助对数据混乱进行排序吗?答案是肯定的,但行业共识是我们只是触及了有一天可能实现的目标的表面。 Informatica、IBM 和 SnapLogic 等现有集成软件公司已经添加了 AI/ML 功能来自动执行各种任务,而 Tamr、Cinchy 和 Monte Carlo 等一批较新的公司将 AI/ML 置于其产品的核心。没有人能够提供能够端到端自动化数据管理和集成流程的 AI/ML 解决方案。
那根本不可能。没有任何产品或服务可以在没有人为干预的情况下协调所有数据异常,更不用说改革混乱的企业数据架构了。这些新的 AI/ML 驱动的解决方案如今可以做的是,从数据编目到构建数据管道再到提高数据质量,大大减少各种数据整理和集成工作中的体力劳动。
这些可能是值得注意的胜利。但要产生真正、持久的影响,需要 CDO(首席数据官)方法,而不是为一次性项目获取集成工具的冲动。在企业确定在何处应用哪些 AI/ML 解决方案之前,他们需要对整个数据资产(客户数据、产品数据、交易数据、事件数据等)有一个连贯的、自上而下的视图,并全面了解元数据定义那些数据类型。
如今,大多数企业都维护着大量的数据存储,每个数据存储都与自己的应用程序和用例相关联——云计算加剧了这种扩散,因为业务部门使用自己的数据孤岛快速启动云应用程序。其中一些数据存储可用于交易或其他运营活动,而其他数据存储(主要是数据仓库)则为从事分析或商业智能的人员服务。
Forrester Research 的副总裁兼首席分析师 Noel Yuhanna 说,让事情变得更加复杂的是,“地球上的每个组织都有超过两打的数据管理工具”。 “这些工具都不会相互交谈。”这些工具可处理从数据编目到 MDM(主数据管理)、数据治理到数据可观察性等一切事务。一些供应商已经为他们的产品注入了 AI/ML 功能,而其他供应商尚未这样做。
在基本层面上,数据集成的主要目的是映射各种数据源的模式,以便不同的系统可以共享、同步和/或丰富数据。例如,后者是开发 360 度客户视图的必备条件。但看似简单的任务,例如确定具有相同名称的客户或公司是否是同一实体——以及哪些记录的哪些细节是正确的——需要人工干预。领域专家经常被要求帮助建立处理各种异常的规则。
这些规则通常存储在嵌入集成软件的规则引擎中。 Michael Stonebraker 是关系数据库的发明者之一,也是 Tamr 的创始人,该公司开发了 ML 驱动的 MDM 系统。 Stonebraker 提供了一个真实世界的例子来说明基于规则的系统的局限性:一家大型媒体公司创建了一个“自制”MDM 系统,该系统已经积累了 12 年的规则。
“他们制定了 300,000 条规则,”Stonebraker 说。 “如果你问某人,你能理解多少规则,一个典型的数字是 500。用力推我,我会给你 1,000。拧我的胳膊,我给你2000。但是 50,000 或 100,000 条规则是完全无法管理的。之所以有这么多规则,是因为有这么多特殊情况。”
Tamr 的首席产品官 Anthony Deighton 声称,他的 MDM 解决方案克服了基于规则的系统的脆弱性。 “基于机器学习的方法的好处在于,当你添加新的来源时,或者更重要的是,当数据形状本身发生变化时,系统可以优雅地适应这些变化,”他说。然而,与大多数 ML 系统一样,需要使用大量数据进行持续训练,并且仍然需要人工判断来解决差异。
AI/ML 不是灵丹妙药。但它可以提供非常有价值的自动化,不仅适用于 MDM,而且适用于数据集成的许多领域。然而,要充分利用这一优势,企业需要收拾好自己的房子。
“数据结构”是用于描述整个企业有用数据的疯狂被子的操作短语。确定该结构的范围首先要了解数据的位置并对其进行编目。该任务可以使用 Informatica 的 AI/ML-infused CLAIRE 引擎或 IBM 的 Watson Knowledge Catalog 等解决方案的 AI/ML 功能实现部分自动化。其他编目软件供应商包括 Alation、BigID、Denodo 和 OneTrust。
Gartner 研究总监 Robert Thanaraj 给 CDO 的信息是,“你需要构建你的结构。你购买必要的技术组件,你构建,并根据你想要的结果进行协调。”他说,这种结构应该是“元数据驱动的”,由围绕企业数据本身的所有重要信息的汇编编织而成。
他对企业的建议是“投资于元数据发现”。这包括“人们与组织中的人一起工作的模式,人们与数据一起工作的模式,以及他们使用的数据组合。他们拒绝哪些数据组合?数据存储位置的模式是什么,数据传输位置的模式是什么?”
Informatica 首席产品官 Jittesh Ghai 表示,Informatica 的 CLAIRE 引擎可以帮助企业获得元数据洞察力并据此采取行动。 “我们应用 AI/ML 功能来提供预测数据……通过将元数据的所有维度链接在一起以提供上下文。”除其他外,这种预测性数据智能可以帮助自动创建数据管道。 “我们自动生成到来自各种源项目的公共元素的映射,并将其坚持到目标系统的模式。”
IDC 的 Stewart Bond 指出,SnapLogic 集成平台具有类似的管道功能。 “因为他们是基于云的,所以他们会查看……所有其他已经建立管道的客户,他们可以找出下一个最好的 Snap:你应该根据什么在这个管道中采取的下一个最佳行动是什么成百上千的其他客户已经这样做了。”
然而,邦德观察到,在这两种情况下,建议都是由系统提出的,而不是系统独立行动的。人类必须接受或拒绝这些建议。 “那里还没有很多自动化发生。我要说的是,即使在地图绘制方面,仍然有很多机会实现更多的自动化、更多的人工智能。”
根据 Bond 的说法,AI/ML 影响最大的地方在于更好的数据质量。 Forrester 的 Yuhanna 对此表示赞同:“AI/ML 确实推动了数据质量的提高,”他说。这是因为 ML 可以从大量数据中发现和学习模式,并推荐人类无法确定的新规则或调整。
高质量数据对于处理重要客户、员工、供应商和产品数据的交易和其他操作系统至关重要。但它也可以让沉浸在分析中的数据科学家的生活变得更加轻松。
人们常说,数据科学家将 80% 的时间花在清理和准备数据上。迈克尔·斯通布雷克 (Michael Stonebraker) 对这一估计提出异议:他引用了他与一位数据科学家的对话,这位数据科学家说她 90% 的时间都花在识别她想要分析的数据源、整合结果和清理数据上。然后,她将剩余 10% 的时间中的 90% 用于修复清洁错误。任何 AI/ML 数据编目或数据清理解决方案,只要能为她节省大量时间,都可以改变游戏规则。
数据质量从来都不是一劳永逸的工作。数据不断变化的性质及其经过的许多系统催生了一类新的解决方案:数据可观察性软件。 “这个类别正在做的是在数据流经数据管道时观察数据。它正在识别数据质量问题,”邦德说。他将初创公司 Anomolo 和 Monte Carlo 称为两个声称“使用 AI/ML 来监控数据质量的六个维度”的参与者:准确性、完整性、一致性、唯一性、及时性和有效性。
如果这听起来有点像 DevOps 必不可少的持续测试,那绝非巧合。越来“但你也为此添加了统计控制。”
问题在于观察数据问题是在事后才发生的。如果不紧急停止管道,就无法阻止不良数据到达用户。但正如 Bond 所说,当数据操作团队成员应用修正并捕获它时,“然后机器可以在下次发生异常时进行修正。”
数据管理和集成软件供应商将继续快速添加有用的 AI/ML 功能,以自动化数据发现、映射、转换、流水线、治理等。然而,Bond 指出,我们遇到了一个黑匣子问题:“每个数据供应商都会说他们的技术是智能的。其中一些仍然是雾里看花。但在这些产品的核心深处有一些真正的人工智能/机器学习的东西。”
对这种情报的需求是显而易见的。 Informatica 的 Ghai 表示:“如果我们要在这种异构、多云、碎片化的环境中提供 PB 级数据,我们就需要将 AI 应用于数据管理。” Ghai 甚至关注 OpenAI 的 GPT-3 大型语言模型系列。 “对我来说,最令人兴奋的是理解人类文本指令的能力,”他说。
然而,没有任何产品具备使数据混乱合理化或独立清理数据的智能。 “完全自动化的结构是不可能的,”Gartner 的 Thanaraj 说。 “必须在可以自动化的东西、可以增强的东西以及仍然可以由循环中的人类补偿的东西之间取得平衡。”
Stonebraker 列举了另一个局限性:AI/ML 人才严重短缺。没有用于数据管理和集成的交钥匙 AI/ML 解决方案,因此正确实施需要 AI/ML 专业知识。 “留给他们自己的设备,企业人员一遍又一遍地犯同样的错误,”他说。 “我认为我最大的建议是,如果你不擅长这些,找一个知道他们在做什么的合作伙伴。”
该声明的另一面是,如果您的数据架构基本上是健全的,并且您有可用的人才来确保您可以正确部署 AI/ML 解决方案,那么数据管理员、分析师和科学家的大量单调工作就可以消除。随着这些解决方案变得更加智能,这些收益只会增加。

作者 east
人工智能 4月 6,2023

人工智能取得真正进步的地方

多年来,我们一直在夸大人工智能的当前能力,但这并不意味着它没有光明的未来。这也许就是为什么斯坦福大学的研究人员在 2016 年构思了一项“人工智能百年研究”(100 年!),并计划在 2116 年之前每五年更新一次报告,记录人工智能的进展情况。在首次报告发布五年后,研究作者最近发布了第二份报告。
长话短说;博士?在不断改进的数据基础设施的支持下,我们在短短五年内取得了“显着进步”,但我们仍然“远未达到该领域在机器中重建完全类人智能的创始愿望。”然而,我们发现的是将人与机器结合起来以获得更好结果的重要性。它是“真正的”人工智能吗?不像最初设想的那样。但可以说它更好。
数据科学(以及由此产生的人工智能)成为现实的主要障碍之一与科学无关,而与数据有关。正如 FirstMark 投资者 Matt Turck 最近在“2021 年机器学习、人工智能和数据 (MAD) 格局”中所说的那样,直到最近,数据仓库才发展到“以一种有用的方式存储大量数据,而不是完全成本过高,并且不需要一群非常技术的人来维护。”是的,我们拥有数据仓库已有数十年,但它们既复杂又昂贵。最近我们涉足了 Apache Hadoop,它使事情变得更便宜但仍然过于复杂。
仅在过去几年中,该行业才专注于完善我们的数据基础架构,以使其对普通人(可能拥有也可能没有博士学位)变得更加平易近人。图尔克认为,通过以具有成本效益的方式“最终可能存储和处理大数据”,它“已被证明是其余数据/人工智能领域的主要解锁”,主要体现在三个方面:
尽管图尔克选择关注现代数据仓库的积极影响,但该行业也受益于数据库(分布式数据库、NoSQL 等)和云的其他进步,这使得数据迭代变得更加容易。通过这些和其他力量,存储和使用数据变得更加容易,这反过来又使组织能够利用这些数据做更多的事情。
这让我们回到了斯坦福大学的 AI100。
我们已经达到了这样一个地步,即我们在日常基础上与 AI 进行交互,并且通常会看到它的缺点。以特斯拉为例。尽管对注入人工智能的“全自动驾驶”进行了所有错误的营销,但特斯拉电动汽车远不能在任何情况下安全地将乘客从 A 点运送到 B 点,除非是在最严密控制的环境中。即便如此,我们已经看到了足够多的东西,对未来充满好奇和希望。
目前,AI100 的作者指出了人工智能取得真正进步的三个领域:
这并不意味着人工智能会很快取代人类,但它确实意味着人工智能越来越有能力以有意义的方式补充人类。正如他们解释的那样,“在人类和人工智能具有互补优势的情况下,增强人类能力的人工智能方法可能非常有价值。人工智能系统可能更擅长综合可用数据并在问题的特征部分做出决策,而人类可能更擅长理解数据的含义。”
例如,该报告的作者表示,机器永远不会成为照顾老人的合适替代品。 “良好的护理需要尊重和尊严,而我们根本不知道如何将这些东西编码到程序算法中。”但是,当老人可能需要药物或其他支持时,AI 会处理大量数据以向护理人员提出建议吗?或者也许使用 AI 驱动的图像处理来评估老年人可能自行服用但可能证明有害的药物(由于药物本身的数量或性质)并提醒护理人员?这是一个很好的组合。
有时诀窍是让 AI 模型自由地分析数据,然后弄清楚它是如何得出结论的。 “通过首先训练一个非常擅长做出预测的模型,然后努力理解为什么这些预测如此之好,我们加深了对从疾病到地震动力学的一切事物的科学理解,”作者指出。在这个例子中,机器促使人们更深入地思考数据,从机器无法理解但无论如何都能得出的结论中学习。
简而言之,机器能够分析大量信息,以更易于消化的方式总结或以其他方式将这些信息呈现给人们。这样,可以更有效地应用人类智能。人不会取代机器,机器也不会取代人。我们构建了数据基础架构,使大量数据成为可能,而机器则通过帮助我们理解所有数据来发挥作用。确实是一个很好的伙伴关系。

作者 east
人工智能 4月 6,2023

如何向业务主管解释机器学习生命周期

如果您是数据科学家或使用机器学习 (ML) 模型,您将拥有标记数据的工具、训练模型的技术环境以及对 MLop 和模型操作的基本理解。如果您有 ML 模型在生产中运行,您可能会使用 ML 监控来识别数据漂移和其他模型风险。
数据科学团队使用这些基本的 ML 实践和平台在模型开发、配置基础设施、将 ML 模型部署到不同环境以及大规模维护模型方面进行协作。其他寻求增加生产模型数量、提高预测质量并降低 ML 模型维护成本的人可能也需要这些 ML 生命周期管理工具。
不幸的是,向业务利益相关者和预算决策者解释这些实践和工具并不容易。对于想要了解机器学习和人工智能投资的投资回报和业务影响并且更愿意远离技术和运营杂草的领导者来说,这都是技术术语。
数据科学家、开发人员和技术领导者认识到,获得认可需要定义和简化行话,以便利益相关者了解关键学科的重要性。继上一篇关于如何向业务主管解释 DevOps 术语的文章之后,我想我会写一篇类似的文章来阐明业务领导者应该理解的几个关键 ML 实践。
作为开发人员或数据科学家,您拥有一个工程流程,可以将新想法从概念转化为交付业务价值。该过程包括定义问题陈述、开发和测试模型、将模型部署到生产环境、监控生产中的模型以及启用维护和改进。我们将此称为生命周期过程,因为我们知道部署是实现业务价值的第一步,而且一旦投入生产,模型就不是静态的,需要持续的支持。
企业领导者可能不理解生命周期这个词。许多人仍然认为软件开发和数据科学工作是一次性投资,这也是许多组织遭受技术债务和数据质量问题困扰的原因之一。
用关于模型开发、训练、部署和监控的技术术语来解释生命周期会让业务主管的眼睛呆滞。 Sauce Labs 技术战略副总裁 Marcus Merrell 建议为领导者提供一个真实世界的类比。
“机器学习在某种程度上类似于农业:我们今天所知道的作物是前几代人注意到模式、尝试组合并与其他农民共享信息以利用积累的知识创造更好的变化的理想结果,”他说。 “机器学习与您的算法训练时的观察、级联结论和复合知识的过程大致相同。”
我喜欢这个类比的地方在于,它说明了从一个作物年到下一个作物年的生成学习,但也可以考虑在生长季节可能因天气、供应链或其他因素而发生的实时调整。在可能的情况下,在您的行业或您的业务领导者了解的领域中找到类比可能会有所帮助。
大多数开发人员和数据科学家认为 MLops 等同于机器学习的 devops。自动化基础架构、部署和其他工程流程可改善协作并帮助团队将更多精力集中在业务目标上,而不是手动执行技术任务。
但对于需要简单定义 MLops 的业务主管来说,所有这些都是杂草,尤其是当团队需要工具预算或时间来建立最佳实践时。
Aporia 的首席技术官兼联合创始人 Alon Gubkin 说:“MLops 或机器学习操作是数据科学、IT 和业务之间协作和沟通的实践,以帮助管理机器学习项目的端到端生命周期。” . “MLops 是关于将组织内的不同团队和部门聚集在一起,以确保有效部署和维护机器学习模型。”
Talend 的技术产品营销经理 Thibaut Gourdel 建议为更受数据驱动的业务领导者添加一些细节。他说,“MLops 促进将敏捷软件原则应用于 ML 项目,例如数据和模型的版本控制以及持续的数据验证、测试和 ML 部署,以提高模型的可重复性和可靠性,以及您的团队’生产力。
每当您可以使用传达图片的单词时,将术语与示例或故事联系起来就容易得多。高管从诸如因风而漂移的船等示例中了解漂移是什么,但他们可能难以将其转化为数据、统计分布和模型准确性的世界。
Fiddler AI 的首席人工智能官兼科学家 Krishnaram Kenthapadi 说:“当模型在生产中看到的数据不再类似于它所训练的历史数据时,就会发生数据漂移。” “这可能是突然的,就像 COVID-19 大流行带来的购物行为变化一样。无论漂移是如何发生的,快速识别这些变化对于保持模型准确性和减少业务影响至关重要。”
Gubkin 提供了第二个示例,说明数据漂移是从训练模型的数据中逐渐转变的。 “数据漂移就像一家公司的产品随着时间的推移变得不那么受欢迎,因为消费者的偏好发生了变化。”
John Snow Labs 的 CTO David Talby 分享了一个普遍的类比。 “模型漂移发生在由于其运行的生产环境不断变化而导致精度下降时,”他说。 “就像一辆新车的价值在你把它开出停车场的那一刻就开始下降一样,一个模型也是如此,因为它所训练的可预测研究环境在生产中表现不同。不管它运行得有多好,随着周围世界的变化,模型总是需要维护。”
数据科学领导者必须传达的重要信息是,由于数据不是静态的,因此必须对模型的准确性进行审查,并根据更新的相关数据进行再培训。
制造商如何在将产品装箱并运送给零售商和客户之前衡量质量?制造商使用不同的工具来识别缺陷,包括当装配线开始显示与可接受的输出质量存在偏差时。如果我们将 ML 模型视为产生预测的小型制造工厂,那么数据科学团队需要 ML 监控工具来检查性能和质量问题是有道理的。 Neo4j 的数据科学解决方案架构师凯蒂·罗伯茨 (Katie Roberts) 说:“ML 监控是在生产过程中使用的一组技术,用于检测可能对模型性能产生负面影响的问题,从而导致质量不佳的洞察力。”
制造和质量控制是一个简单的类比,这里有两条建议提供 ML 模型监控细节:“随着公司加速对 AI/ML 计划的投资,AI 模型将从数十个急剧增加到数千个。每一个都需要安全存储并持续监控以确保准确性,”Teradata 首席产品官 Hillary Ashton 说。
MLops 侧重于协作开发、部署和维护模型的多学科团队。但是,领导者应该如何决定投资哪些模型,哪些模型需要维护,以及在哪些方面为人工智能和机器学习的成本和收益创造透明度?
这些是治理问题,也是 modelops 实践和平台旨在解决的部分问题。业务领导者想要模型操作,但在部分实施之前不会完全理解需求及其交付的内容。
这是一个问题,尤其是对于寻求对 modelops 平台进行投资的企业而言。 Mphasis 的首席执行官兼董事总经理 Nitin Rakesh 建议以这种方式解释模型操作。 “通过专注于模型操作,组织可以确保部署和维护机器学习模型以实现价值最大化并确保对不同版本的治理。”
Ashton 建议包括一个示例练习。 “Modelops 允许数据科学家识别和修复数据质量风险,自动检测模型何时降级,并安排模型再训练,”她说。
仍有许多新的 ML 和 AI 功能、算法和技术带有令人困惑的行话,它们将渗入业务领导者的词汇表中。当数据专家和技术专家花时间用业务领导者理解的语言解释术语时,他们更有可能获得协作支持和新投资的支持。

作者 east
技术架构 4月 5,2023

技术领导者的 2023 年指南

最近,我有机会向十几位领先的技术专家询问他们对 2023 年的希望、预测和指导。这篇文章提炼了我回想起的广泛对话和丰富的见解。未来一年在金融投资方面看起来很精简,但在创新方面却很长。
毫不奇怪,经济状况对许多技术人员来说很重要。用更少的钱做更多的事情的主题很普遍,同时推动技术解决方案来弥补这一不足。
Vercel 首席执行官兼创始人 Guillermo Rauch(见访谈)表示:“随着宏观经济压力不断上升,企业将不得不为每一分钱而更加努力地奋斗,同时用更少的钱做更多的事。在线企业将如何在短时间内解决这些挑战,同时牢记成本?通过为他们的开发人员配备合适的工具并转向前端性能优化和个性化,为他们的客户提供新的创意体验。”
Builder.io 的首席执行官兼创始人 Steve Sewell(见访谈)也提到了简化的推动力。 “由于裁员而减少工程人员意味着专注于核心业务,减少投机性投资,减少营销/增长支出,以及高效增长而不是不惜一切代价。不要过度修饰——简单。用更少的钱解决更多的事情。”
OutSystems 全球投资组合负责人 Prakash Vyas 对此表示赞同:“确保 IT 生产力在 2023 年将变得更加重要。由于越来越多的技术裁员加剧了开发人员的短缺。” Vyas 补充说,为开发团队提供低代码工具可能有助于最大限度地提高生产力。
Sentry.io 的首席执行官 Milin Desai 也谈到了专注的必要性:
Brave 的首席执行官兼联合创始人 Brendan Eich 指出,“ChatGPT 预测浏览和信息应用程序(不仅仅是搜索)将重新焕发活力,这要归功于网络上所有人类创建的文本。今年可能是结合区块链、隐私和浏览器技术的创新将打破 Big Social 围墙花园的一年。”
2022 年,我们看到人工智能和机器学习从前景广阔的前沿领域转变为许多业务流程中的实际因素。 Java Champion 和 Drools 项目负责人 Mario Fusco 希望在 2023 年采用更加慎重的方法:
OutSystems 的首席技术官 Patrick Jean 预测,今年,公司将采用低代码工具来实现高效的业务流程管理 (BPM):
Guillermo Rauch 预计“基于 AI 的应用程序将包含整个软件类别。但每个应用程序都会找到嵌入人工智能的机会。”作为一个例子,他引用了 Vercel 的无头架构,“让开发人员可以轻松地将现成的人工智能模型集成到客户体验中。”他还预计人工智能/机器学习的进一步发展工作负载“正在为低延迟人工智能驱动的应用程序在边缘执行。”
SvelteKit 框架的创建者 Rich Harris(见访谈)看到了 AI 对用户界面设计的影响。 “AI 将无处不在,其中大部分将是垃圾——繁琐的界面、可疑的结果以及普遍存在的机会主义意识——但它也将在一代人中引发我们对 UI 和工作流程的看法的一些最根本的变化”
Fusion Auth 开发者关系负责人 Dan Moore 表示,机器学习“将继续集成到软件和应用程序中,但像 ChatGPT 这样的东西非常昂贵,只有大玩家才能拥有如此流畅的体验。”与此同时,机器学习“将继续成为任何寻求风险投资资金的公司所必需的闪亮对象,”摩尔说。
AI 取代人类的工作有一些声音和愤怒,但任何花时间使用 AI 工具的人都明白它们只是工具包中的一个工具。当前的 AI 是现有功能和数据的 NLP 接口——其解析和响应人类语言的能力令人印象深刻,但不是根本性的改变。
在过去的几年中,前端框架和技术一直处于激烈的发展之中,并且这种趋势显示出与我们保持一致的迹象。
Solid.js 的创建者(见访谈)和 JavaScript 框架前沿工作人员之一的 Ryan Carniato 说:“过去的一年有点觉醒。在过去十年的大部分时间里,我们一直假设我们开发网站和应用程序的方式正朝着一个特定的方向前进——可以在浏览器中运行的东西,将在浏览器中运行。”Carniato 继续说道:
Steve Sewell 还看到了对开发人员体验的日益关注:“制作高性能网站将更容易维护我们习惯的出色 DX。”他还指出,“React 的主导地位最终将开始失去一些动力。”
吉列尔莫·劳赫继续说道:
Vaadin 的首席营销官 Kim Weins 将 Java 引入了对话,他说“公司将使用全栈 Java 构建新的应用程序,或者将基于 TypeScript 和 JavaScript 的前端框架与 Java 后端相结合。”Weins 引用了开源框架 Hilla作为一个框架的例子,它使开发人员可以更快、更容易地将 React 与 Java 后端结合起来。
MongoDB 首席技术官 Mark Porter(见访谈)也指出,分析正在“左移”到应用程序开发中:
加密货币在 2022 年遭受了真正的打击。尽管如此,许多技术仍在向前发展。似乎在区块链主题上出现了两个阵营。一方面,正如 Mario Fusco 所说,“我希望人们最终会意识到加密货币只是历史上最大的庞氏骗局。”

作者 east
人工智能 4月 5,2023

担心生成式 AI(ChatGPT) 的 10 个理由

像 ChatGPT 这样的生成式 AI 模型非常好,以至于现在有些人声称 AI 不仅与人类平等,而且通常更聪明。他们以各种令人眼花缭乱的风格创作出精美的艺术品。他们炮制出充满丰富细节、想法和知识的文本。生成的工件千差万别,看似独一无二,很难相信它们来自机器。我们才刚刚开始发现生成式 AI 可以做的一切。
一些观察家喜欢认为这些新的 AI 终于跨过了图灵测试的门槛。其他人认为门槛并没有被轻轻地通过,而是被炸成了碎片。这种艺术是如此之好,以至于另一批人肯定已经走向失业线。
但一旦惊奇感消退,生成人工智能的原始明星力量也会消退。一些观察家把以恰到好处的方式提问作为一种运动,这样智能机器就会吐出一些空洞或错误的东西。有些人使用在小学美术课上流行的旧逻辑炸弹——比如要求一张晚上的太阳图片或暴风雪中的北极熊图片。其他人则提出奇怪的请求,以展示 AI 情境感知(也称为常识)的局限性。那些有这种倾向的人可以数一数生成式人工智能失败的方式。
以下是生成式人工智能的 10 个缺点和缺陷。这份清单读起来可能像酸葡萄一样——如果允许机器接管,作家将失去工作,这是嫉妒的涂鸦。称我为团队人类的小人类生根——希望 John Henry 继续击败蒸汽钻机。但是,我们不应该有点担心吗?
当 DALL-E 和 ChatGPT 等生成式 AI 模型创建时,它们实际上只是从训练集中的数百万个示例中创建新模式。结果是从各种来源提取的剪切和粘贴合成——当人类这样做时,也被称为剽窃。
当然,人类也可以通过模仿来学习,但在某些情况下,这种借鉴是如此明显,以至于会向小学老师告密。此类 AI 生成的内容由或多或少逐字呈现的大块文本组成。然而,有时,涉及的混合或合成足够多,以至于即使是大学教授小组也可能难以检测出来源。无论哪种方式,缺少的是唯一性。尽管它们光彩照人,但这些机器无法生产出任何真正新颖的东西。
虽然剽窃在很大程度上是学校的问题,但版权法适用于市场。当一个人窃取另一个人的作品时,他们就有可能被带上法庭,并处以数百万美元的罚款。但是人工智能呢?同样的规则适用于他们吗?
版权法是一门复杂的学科,生成人工智能的法律地位需要数年时间才能确定。但请记住这一点:当 AI 开始制作看起来足够好以让人类走上就业线的工作时,其中一些人肯定会花费他们新的业余时间提起诉讼。
剽窃和版权并不是生成式 AI 引发的唯一法律问题。律师们已经在为诉讼设想新的道德问题。例如,制作绘图程序的公司是否应该能够收集有关人类用户绘图行为的数据,然后将这些数据用于人工智能训练?人类是否应该因这种创造性劳动的使用而得到补偿?当前这一代人工智能的成功在很大程度上源于对数据的访问。那么,当生成数据的人想要分一杯羹时会发生什么?什么是公平?什么会被认为是合法的?
人工智能特别擅长模仿人类需要多年才能发展起来的那种智能。当一位人类学者能够介绍一位默默无闻的 17 世纪艺术家或以几乎被遗忘的文艺复兴时期的音调结构创作新音乐时,我们有充分的理由印象深刻。我们知道需要多年的学习才能发展出这种知识深度。当 AI 仅经过几个月的训练就可以完成这些相同的事情时,结果可能会非常精确和正确,但会遗漏一些东西。
如果训练有素的机器可以在装满数十亿条记录的数字鞋盒中找到正确的旧收据,它也可以了解关于像 Aphra Behn 这样的诗人的一切知识。您甚至可能认为机器是用来解码玛雅象形文字的含义的。 AI 可能看起来模仿了人类创造力中有趣和不可预测的一面,但它们并不能真正做到这一点。与此同时,不可预测性是推动创造性创新的动力。像时尚这样的行业不仅沉迷于变化,而且由变化来定义。事实上,人工智能有它的一席之地,过去来之不易的人类智慧也是如此。
说到智能,人工智能本质上是机械的和基于规则的。一旦 AI 研究了一组训练数据,它就会创建一个模型,而该模型并没有真正改变。一些工程师和数据科学家设想随着时间的推移逐渐重新训练 AI 模型,以便机器能够学会适应。但是,在大多数情况下,这个想法是创建一组复杂的神经元,以固定的形式对某些知识进行编码。恒常性有它的作用,可能适用于某些行业。人工智能的危险在于它将永远停留在其训练数据的时代精神中。当我们人类变得如此依赖生成式人工智能以至于我们无法再为训练模型生产新材料时会发生什么?
AI 的训练数据需要来自某个地方,而我们并不总是那么确定是什么卡在了神经网络中。如果 AI 从他们的训练数据中泄露个人信息怎么办?更糟糕的是,锁定人工智能要困难得多,因为它们被设计得非常灵活。关系数据库可以限制对包含个人信息的特定表的访问。不过,可以通过数十种不同的方式查询 AI。攻击者将很快学会如何以正确的方式提出正确的问题,以获取他们想要的敏感数据。例如,假设特定资产的纬度和经度被锁定。聪明的攻击者可能会在数周内询问该位置太阳升起的确切时刻。一个尽职尽责的 AI 会尝试回答。教 AI 保护私人数据是我们还不了解的事情。
即使是最早的大型机程序员在创造首字母缩略词 GIGO 或“垃圾输入,垃圾输出”时也理解了计算机问题的核心。人工智能的许多问题都来自糟糕的训练数据。如果数据集不准确或有偏差,结果将反映出来。
生成式 AI 的核心硬件可能像 Spock 一样是逻辑驱动的,但构建和训练机器的人却不是。偏见和党派偏见已被证明会进入 AI 模型。也许有人使用有偏见的数据来创建模型。也许他们添加了覆盖以防止模型回答特定的热键问题。也许他们输入了硬连线答案,然后很难检测到。人类已经找到了许多方法来确保人工智能成为我们有害信念的优秀载体。
原谅 AI 模型犯错很容易,因为它们在很多其他事情上做得很好。只是很多错误很难预料,因为人工智能的思维方式与人类不同。例如,许多使用文本转图像功能的用户发现 AI 会在相当简单的事情上出错,比如数数。人类很早就在小学学习基本算术,然后我们以各种方式使用这项技能。让一个 10 岁的孩子画一只章鱼,这个孩子几乎肯定会确定它有八条腿。当涉及到数学的抽象和上下文使用时,当前版本的人工智能往往会陷入困境。如果模型构建者对失误给予一些关注,这可能很容易改变,但还会有其他人。机器智能不同于人类智能,这意味着机器的愚蠢也会有所不同。
有时在没有意识到的情况下,我们人类往往会填补 AI 智能的空白。我们填写缺失的信息或插入答案。如果人工智能告诉我们亨利八世是杀害他妻子的国王,我们不会质疑,因为我们自己不了解那段历史。我们只是假设 AI 是正确的,就像我们在有魅力的主持人挥手时所做的一样。如果一个声明是有信心的,那么人类的头脑就会倾向于接受它是真实和正确的。
对于生成式 AI 的用户来说,最棘手的问题是知道 AI 何时出错。机器不能像人类那样撒谎,但这使它们更加危险。他们可以产生完全准确的数据段落,然后转向猜测,甚至公然诽谤,而没有人知道它发生了。二手车经销商或扑克玩家往往知道他们什么时候在捏造谎言,而且大多数人都会揭穿他们的中伤;人工智能没有。
数字内容可以无限复制,这已经使许多围绕稀缺性建立的经济模型变得紧张。生成式人工智能将进一步打破这些模型。生成式人工智能会让一些作家和艺术家失业;它还颠覆了我们赖以生存的许多经济规则。当广告和内容都可以无休止地重新组合和重新生成时,广告支持的内容是否有效?互联网的免费部分是否会陷入机器人点击网页广告的世界,所有这些都由生成人工智能精心制作并可以无限复制?
如此容易的富足可能会破坏经济的各个方面。如果可以永久复制,人们会继续为不可替代的代币付费吗?如果做艺术这么容易,它还会受到尊重吗?还会特别吗?如果它不特别,会有人关心吗?当一切都被视为理所当然时,一切都会失去价值吗?这就是莎士比亚所说的离谱命运的弹弓和箭的意思吗?我们不要试图自己回答。让我们向生成式 AI 询问一个有趣、古怪,并最终神秘地陷入对与错之间的某个阴间世界的答案。

作者 east

上一 1 … 42 43 44 … 93 下一个

关注公众号“大模型全栈程序员”回复“小程序”获取1000个小程序打包源码。回复”chatgpt”获取免注册可用chatgpt。回复“大数据”获取多本大数据电子书

标签

AIGC AI创作 bert chatgpt github GPT-3 gpt3 GTP-3 hive mysql O2O tensorflow UI控件 不含后台 交流 共享经济 出行 图像 地图定位 外卖 多媒体 娱乐 小程序 布局 带后台完整项目 开源项目 搜索 支付 效率 教育 日历 机器学习 深度学习 物流 用户系统 电商 画图 画布(canvas) 社交 签到 联网 读书 资讯 阅读 预订

官方QQ群

小程序开发群:74052405

大数据开发群: 952493060

近期文章

  • spark内存溢出怎样区分是软件还是代码原因
  • MQTT完全解析和实践
  • 解决运行Selenium报错:self.driver = webdriver.Chrome(service=service) TypeError: __init__() got an unexpected keyword argument ‘service’
  • python 3.6使用mysql-connector-python报错:SyntaxError: future feature annotations is not defined
  • 详解Python当中的pip常用命令
  • AUTOSAR如何在多个供应商交付的配置中避免ARXML不兼容?
  • C++thread pool(线程池)设计应关注哪些扩展性问题?
  • 各类MCAL(Microcontroller Abstraction Layer)如何与AUTOSAR工具链解耦?
  • 如何设计AUTOSAR中的“域控制器”以支持未来扩展?
  • C++ 中避免悬挂引用的企业策略有哪些?

文章归档

  • 2025年7月
  • 2025年6月
  • 2025年5月
  • 2025年4月
  • 2025年3月
  • 2025年2月
  • 2025年1月
  • 2024年12月
  • 2024年11月
  • 2024年10月
  • 2024年9月
  • 2024年8月
  • 2024年7月
  • 2024年6月
  • 2024年5月
  • 2024年4月
  • 2024年3月
  • 2023年11月
  • 2023年10月
  • 2023年9月
  • 2023年8月
  • 2023年7月
  • 2023年6月
  • 2023年5月
  • 2023年4月
  • 2023年3月
  • 2023年1月
  • 2022年11月
  • 2022年10月
  • 2022年9月
  • 2022年8月
  • 2022年7月
  • 2022年6月
  • 2022年5月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2022年1月
  • 2021年12月
  • 2021年11月
  • 2021年9月
  • 2021年8月
  • 2021年7月
  • 2021年6月
  • 2021年5月
  • 2021年4月
  • 2021年3月
  • 2021年2月
  • 2021年1月
  • 2020年12月
  • 2020年11月
  • 2020年10月
  • 2020年9月
  • 2020年8月
  • 2020年7月
  • 2020年6月
  • 2020年5月
  • 2020年4月
  • 2020年3月
  • 2020年2月
  • 2020年1月
  • 2019年7月
  • 2019年6月
  • 2019年5月
  • 2019年4月
  • 2019年3月
  • 2019年2月
  • 2019年1月
  • 2018年12月
  • 2018年7月
  • 2018年6月

分类目录

  • Android (73)
  • bug清单 (79)
  • C++ (34)
  • Fuchsia (15)
  • php (4)
  • python (45)
  • sklearn (1)
  • 云计算 (20)
  • 人工智能 (61)
    • chatgpt (21)
      • 提示词 (6)
    • Keras (1)
    • Tensorflow (3)
    • 大模型 (1)
    • 智能体 (4)
    • 深度学习 (14)
  • 储能 (44)
  • 前端 (4)
  • 大数据开发 (491)
    • CDH (6)
    • datax (4)
    • doris (31)
    • Elasticsearch (15)
    • Flink (78)
    • flume (7)
    • Hadoop (19)
    • Hbase (23)
    • Hive (41)
    • Impala (2)
    • Java (71)
    • Kafka (10)
    • neo4j (5)
    • shardingsphere (6)
    • solr (5)
    • Spark (100)
    • spring (11)
    • 数据仓库 (9)
    • 数据挖掘 (7)
    • 海豚调度器 (10)
    • 运维 (34)
      • Docker (3)
  • 小游戏代码 (1)
  • 小程序代码 (139)
    • O2O (16)
    • UI控件 (5)
    • 互联网类 (23)
    • 企业类 (6)
    • 地图定位 (9)
    • 多媒体 (6)
    • 工具类 (25)
    • 电商类 (22)
    • 社交 (7)
    • 行业软件 (7)
    • 资讯读书 (11)
  • 嵌入式 (71)
    • autosar (63)
    • RTOS (1)
    • 总线 (1)
  • 开发博客 (16)
    • Harmony (9)
  • 技术架构 (6)
  • 数据库 (32)
    • mongodb (1)
    • mysql (13)
    • pgsql (2)
    • redis (1)
    • tdengine (4)
  • 未分类 (7)
  • 程序员网赚 (20)
    • 广告联盟 (3)
    • 私域流量 (5)
    • 自媒体 (5)
  • 量化投资 (4)
  • 面试 (14)

功能

  • 登录
  • 文章RSS
  • 评论RSS
  • WordPress.org

All Rights Reserved by Gitweixin.本站收集网友上传代码, 如有侵犯版权,请发邮件联系yiyuyos@gmail.com删除.