亚马逊云科技发布全新数据管理服务Amazon DataZone

2023-11-02

亚马逊云科技在2022 re:Invent全球大会上宣布,推出一项全新的数据管理服务Amazon DataZone,它可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。Amazon DataZone使工程师、数据科学家、产品经理、分析师和业务用户可以轻松访问整个组织的数据,从而发现、使用数据,通过数据进行协作来获得洞察。

当前,企业收集的数据达到PB甚至EB级别,这些数据来自多个部门、多项云服务、众多本地数据库以及第三方数据源(如来自合作伙伴解决方案和公共数据集)。在企业可以释放数据的全部价值之前,管理员和数据管理者作为数据生产者与管理者,需要在保障数据的管控和治理的前提下允许数据访问,确保数据只能由正确的人在正确的情境下访问。另一方面,整个公司的员工(如数据消费者)都希望发现和分析来自数据生产者的信息,以推动决策制定。数据需要被管控以保证安全,产生新的洞察需要允许数据访问,企业必须在二者之间寻求平衡。然而企业内数据多样,部门林立,用例不同,这些都对治理策略的落实提出挑战。一些企业通过建立目录来管理信息,但这些目录系统维护起来相当耗时,需要数据生产者手动标记每个数据集,额外添加来源或描述等情境信息来保证数据可以被检索和发现,同时缺乏内嵌的访问控制来简化数据治理。企业很难保持数据分级分类的一致性,以及各个数据生产者必须保持自己的信息实时更新,这使得在整个企业中搜索数据变得非常困难,并可能导致数据过时。在这种情况下,数据消费者即使找到了所需信息,也无法快速通过目录直接向数据所有者请求访问权限,也就无法加载数据分析服务以及与他人协作。最终,决策者无法及时获得所需信息,或者可能根据不完整或过时的数据做出欠佳的决策。

Amazon DataZone是一种全新的数据管理服务,它助力数据生产者轻松管理和控制数据访问,使数据消费者能够发现和使用数据、开展数据协作以获取业务洞察。数据生产者可以通过Amazon DataZone定义数据分级分类,配置治理策略,连接一系列亚马逊云科技服务(如 Amazon S3和 Amazon Redshift)、合作伙伴解决方案(如Salesforce和ServiceNow)和本地系统,从而创建自己的业务数据目录。Amazon DataZone使用机器学习为每个数据集收集和建议元数据信息(如数据来源和数据类型),并根据客户的分级分类和偏好进行模型训练,不断优化,从而消除数据目录维护的繁重工作。设置目录后,数据消费者可以使用 Amazon DataZone搜索和发现数据资产,检查元数据使用情境,请求数据集访问权限。当数据消费者开始分析数据,他们会创建一个Amazon DataZone数据项目,即门户系统中的一个共享空间,用户可以在其中提取不同的数据集、与同事共享访问权限、进行分析协作。Amazon DataZone与Amazon Redshift、 Amazon Athena和Amazon QuickSight等亚马逊云科技数据分析服务进行了集成,数据消费者能够在其数据项目的情境中访问这些服务,他们的数据在这些服务中自动可用、无需单独的登录凭证。Amazon DataZone还提供应用程序编程接口(API)以与自定义解决方案或与DataBricks、Snowflake和Tableau等合作伙伴进行集成,因此,客户可以轻松发布、搜索和使用其所有的数据资产。

“良好的治理是整个组织都可以访问数据的基础,但我们经常听客户说,在使数据可发现和保持控制之间很难取得适当的平衡。”亚马逊云科技数据库、数据分析和机器学习副总裁Swami Sivasubramanian表示,“借助 Amazon DataZone,客户可以使用单一服务在强大的治理控制和简化的数据访问之间取得平衡,从而轻松查找、组织数据,使用数据进行协作。Amazon DataZone在整个企业内解放了数据的束缚,每个员工都可以帮助推动获取新的洞察,最大限度地发挥数据价值。”

ENGIE是一家全球能源公司,专注于可再生能源和分布式低碳能源基础设施,帮助客户实现脱碳目标。“我们ENGIE的主要优先事项是统一所有业务的数据,允许数据共享,以提高绩效,大规模创造价值。为了实现这一目标,我们在内部构建了公共数据平台,这在很大程度上解决了这一挑战。”Data@ENGIE首席技术官Gregory Wolowiec表示,“我们没有自建和维护一个平台来进行数据共享和治理。在过去六个月里,我们作为测试版本客户,一直与Amazon DataZone团队合作,为创建这项亚马逊云科技原生服务提供意见。我们期待着使用Amazon DataZone在整个公司内共享数据,简化对亚马逊云科技分析服务和治理工具的访问。这将使我们的分析师和业务线领导能够开启创新项目,根据数据驱动做出决策。我们很高兴将Amazon DataZone融入到我们的业务运营,利用其强大的功能实现数据共享,利用大数据创造价值。”

福克斯公司是一家领先的内容制作商和发行商,旗下拥有体育、新闻和娱乐等品牌。“在福克斯,统一所有的业务数据,打造安全、可信、规模化的数据发现、发布、访问和共享能力至关重要。我们希望业务团队能够安全地发现和共享数据,无需做深入的技术工作。”福克斯公司数据基础设施副总裁Alex Tverdohleb表示,“Amazon DataZone有助于我们简化、自动化数据发现和共享,保持适当的数据治理,因此我们可以确保在正确的时间使用正确的工具访问数据。”

伊塔乌联合银行(Itaú)是一家全球金融服务公司,也是拉丁美洲最大的私营金融机构。“打造数据驱动力是我们的主要企业目标之一,但我们在使用亚马逊云科技分析服务的过程中,必须不断平衡数据访问与治理及合规政策之间的关系,这使得团队难以快速行动。”伊塔乌联合银行数据和分析工程平台负责人Roberto Figueira表示,“我们很高兴能够测试使用Amazon DataZone,因为它将简化数据治理,使跨业务部门的数据访问变得更容易。借助Amazon DataZone,我们将能够快速轻松地为分析师、工程师和数据科学家团队设置精细的访问权限,帮助他们在各种业务场景中验证数据假设。”

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

亚马逊云科技发布全新数据管理服务Amazon DataZone 的相关文章

随机推荐

  • Linux下的MongoDB安装&启动&关闭

    https developer aliyun com article 668662
  • 猴子吃桃问题:猴子第一天摘下若干个桃子,当即吃了一半,又多吃了一个第二天早上又将剩下的桃子吃掉一半,又多吃了一个。到第10天早上时,只剩下一个,求第一天有多少桃子。

    猴子吃桃问题 猴子第一天摘下若干个桃子 当即吃了一半 又多吃了一个第二天早上又将剩下的桃子吃掉一半 又多吃了一个 到第10天早上时 只剩下一个 求第一天有多少桃子 我的思路 用逆向思维推测第一天 由题可知第10天时桃子数量为1 根据规律 第
  • Docker 开启 buildx 多CPU架构镜像制作

    Docker开启buildx多CPU架构镜像制作 buildx简介 关于QEMU 系统限制 查看Linux内核版本 查看Docker版本 Docker开启实验特性 启用 binfmt misc 来运行非本地架构 Docker 镜像 检查 Q
  • Spring MVC+Maven 实现同一项目的前端和后台交互

    在做前端和后台交互时 首先得有一个建立完毕的spring MVC项目 这里我以Maven Spring MVC的HelloWord工程来示例 当然你也可以在你已有的Spring MVC工程下进行操作 建立Spring MVC的HelloWo
  • 【论文随笔】强化学习与奖励机 LTL and Beyond: Formal Languages for Reward Function Specification in RL

    前言 最近对强化学习比较感兴趣 来读一读时序逻辑与强化学习交叉的文章 P S 随着毕业设计的结束 最近恢复了一波旧帖子 另外新建了个人网站 可能慢慢把笔记都移到个人网站上 但就目前而言还是CSDN的编辑器用着更顺手一些些 主要参考文献 Ca
  • python机器学习入门到精通--实战分析(三)

    利用sklearn分析鸢尾花 前面两篇文章提到了机器学习的入门的几个基础库及拓展练习 现在我们就对前面知识点进行汇总进行一个简单的机器学习应用 并构建模型 练习即假定一名植物专家收集了每一朵鸢尾花的测量数据 花瓣的长度和宽度以及花萼的长度和
  • -bash: netstat: 未找到命令

    linux命令报错信息 bash netstat 未找到命令 root localhost netstat anp bash netstat 未找到命令 原因分析 缺少Net tools Net tools 包含一系列程序 是构成了 Lin
  • 本地安装node.js安装,使用npm下载插件

    操作系统 windows10 开发工具 VS Code 1 下载node js文件 全程下一步即可 2 打开vscode 运行终端 此处打开的额终端路径是你当前的项目根目录 node中自带npm 所以安装号node就已经安装号 npm了 使
  • 白鲸开源代立冬:一年5个孵化项目来自于中国,佛系Apache如何帮助中国开源立足全球?

    近两年 在Apache等顶尖开源基金会中涌现出很多像SeaTunnel这样的国产开源项目 但由于起步较晚 中国开源与海外还存在明显差距 那么中国开源该如何追赶 本期 开源访谈录 邀请到了Apache mentor代立冬来分享他的见解 本期受
  • Ubuntu 20.04vscode配置C语言

    网上好多都是乱七八糟的 调的我心烦 我自己把自己配置成功的拿出来方在这里给大家看了 vscode配置C语言实际上就是每个文件夹修改一下launch json和tasks json文件 launch json version 0 2 0 co
  • Google分布式三篇论文--MapReduce

    MapReduce 超大机群上的简单数据处理 摘要 MapReduce是一个编程模型 和处理 产生大数据集的相关实现 用户指定一个map函数处理一个key value对 从而产生中间的key value对集 然后再指定一个reduce函数合
  • SpringBoot2.0之整合Apollo

    SpringBoot2 0之整合Apollo Spring Boot客户端对接阿波罗服务器端 核心源码都在这个压缩包里面 封装好了环境 运行shell脚本就ok了 下面进入到本地maven仓库 远程仓库apollo的jar包 只能打包到本地
  • 【路径规划】基于模糊逻辑系统实现车辆的自主导航附matlab代码

    1 内容介绍 在过去的30年 用于城市地面交通工具中自动驾驶技术的开发已经得到了飞速的发展 目前 现代自主驾驶车辆已具备一定感知车辆周围环境的能力 比如根椐分类所分析对象的类型并进行检测 观测周身环境的变化并评估对象的移动可能性 在遵循交通
  • 交换瓶子

    交换瓶子 贡献者 programmer ada 有N个瓶子 编号 1 N 放在架子上 比如有5个瓶子 2 1 3 5 4 要求每次拿起2个瓶子 交换它们的位置 经过若干次后 使得瓶子的序号为 1 2 3 4 5 对于这么简单的情况 显然 至
  • SpringBoot Controller 提取Post请求中Body的参数问题——驼峰命名规则

    正常在Controller方法中使用 RequestBody 类 对象进行参数接收 通过ApiFox对对应接口发起请求 但控制台打印内容为空 原因 ApiFox中设置json格式的body参数时 变量名未遵循驼峰命名规则 类似于printE
  • Qt样式表的使用

    Qt中可以灵活的使用层叠样式表 CSS 其语法和CSS很相似 因为HTML CSS的灵活性 所以可以很方便的为QT界面设计自己需要的外观 除了子类化Style类 使用QT样式表 QStyleSheet 是另一种快速改变QT程序UI风格的方法
  • java开发记录-微信二维码支付

    关于微信二维码支付的一点点总结 如上一个博客所说 开始开发前需要前往官网进行一系列的接入 从而得到相关的appid 密钥 本次的开发中 使用谷歌zxing实现将支付链接字符串转为二维码 附上相关依赖
  • 用STM32F103输出一路PWM波形

    用STM32F103输出一路PWM波形 一 PWM简介 二 STM32F1 PWM介绍 三 PWM输出配置步骤 四 PWM代码 Keil仿真 一 PWM简介 PWM是 Pulse Width Modulation 的缩写 中文意思就是脉冲宽
  • 6个超酷智能交互案例分享

    本次的案例分享主要集中在智能交互方向 主要集中在4个方面 智能设备如何增强情感化设计 全息投影如何运用在实际商业领域 智慧家庭的终端设计如何陪伴宠物 私域流量借助图像识别的智能营销玩法 机器人难道只能屏幕脸表达情感 只会嘤嘤嘤求抱抱的机器人
  • 亚马逊云科技发布全新数据管理服务Amazon DataZone

    亚马逊云科技在2022 re Invent全球大会上宣布 推出一项全新的数据管理服务Amazon DataZone 它可以让客户更快 更轻松地对存储在亚马逊云科技 客户本地和第三方来源的数据进行编目 发现 共享和治理 借助Amazon Da