Starburst Galaxy 获得数据可发现性更新

分析软件提供商 Startburst 周二表示,它正在为 Startburst Galaxy 添加数据可发现性功能,Startburst Galaxy 是一项托管的 Trino SQL 查询引擎服务。
Trino,前身为 Presto SQL,是一种用于大数据的开源分布式 SQL 查询引擎,允许用户在单个查询中查询来自多个数据源(包括 NoSQL 数据库)的数据。
该公司表示,这些更新是在 AWS re:Invent 2022 上宣布的,将帮助企业简化传统的提取、转换、加载 (ETL) 流程来管理数据产品,从而加速数据查询、访问和分析。
通过 Starburst Galaxy 作为托管服务提供,这些新的可发现性功能正在解决与数据湖变成数据沼泽相关的挑战——杂乱无章的数据杂乱无章,这对可访问性和利用数据获得可操作见解的能力提出了重大挑战。
新功能旨在将发现时间从几小时缩短到几秒,并为自助服务数据产品管理奠定基础,无论技术专长如何。
物联网设备的激增一直是全球企业面临的杂乱无章的数据问题的重要贡献者。据 IDC 称,到 2025 年,预计将有 557 亿台联网的物联网设备,产生近 80 兆字节的数据(相当于十亿太字节或万亿千兆字节)。
Starburst 董事长兼首席执行官 Justin Borgman 在一份新闻稿中表示:“Starburst Galaxy 使组织能够更有效地发现正确的数据集,有助于降低成本,同时从数据中获得更多价值。”
该公司期望这些新功能将帮助企业创建自助服务数据产品,包括数据发现、模式发现和精细访问控制。
顾名思义,数据发现功能有助于找到所需的数据集及其位置。该公司表示,该功能使元数据能够自动填充查询历史和上下文,从而提供有关数据使用方式的关键见解。
另一方面,模式发现旨在消除 ETL 过程中的“转换”方面。 Starburst 表示,该功能将使企业能够发现跨来源的现有数据集以及新数据集,而不管它们位于何处。
该公司补充说,这意味着加载数据的数据工程师不需要事先考虑模式。
Starburst 说,新的粒度访问控制 (GAC) 功能旨在使企业数据管理员能够查看和了解谁有权访问哪些数据以及如何使用这些数据,并补充说这允许管理员通过策略即代码更改权限确保持续部署管道中的安全性和风险降低。
Starburst Galaxy 目前可通过各种定价计划在 AWS、Microsoft Azure 和 GCP 上使用。
Starburst Galaxy 的更新是在公司将数据产品添加到其企业数据和分析平台(称为 Starburst Enterprise)后的一年内进行的。 9 月,该公司向该平台添加了新功能以简化跨云分析。
在 re:Invent 2022 上,该公司还宣布支持通过 Starburst Enterprise 为 AWS Lake Formation 实施数据网格架构,这是一项创建数据湖的服务。
数据网格概念包含异构分布式数据的分散管理和治理。数据网格架构的目标是允许管理和分析数据,无论数据位于何处——本地、公共云或多云环境,或者 SQL 或 NoSQL 数据库。
该公司表示,作为支持的一部分,Starburst 将帮助其与 AWS 的联合客户实施数据网格的技术方面,并补充说这将帮助企业从混合部署中获得最大价值。

关注公众号“大模型全栈程序员”回复“小程序”获取1000个小程序打包源码。更多免费资源在http://www.gitweixin.com/?p=2627