干货分享

2023-11-03

在企业数字化转型的过程中,尤其随着互联网+、云计算、大数据等信息技术与通信技术的迅猛发展,海量数据在各种信息系统上被存储和处理,其中包含大量有价值的敏感数据,这意味着数据泄露的风险也不断增加。

数据泄露可能由各种因素引起,包括恶意攻击、黑客入侵、员工失误、设备丢失或盗窃等。一旦数据泄露,个人隐私将面临泄露风险,可能导致身份盗窃、金融欺诈、个人信息滥用等问题。此外,一些行业和法规要求组织必须采取措施来保护敏感数据,例如金融机构需要保护客户的个人身份信息,医疗机构需要保护患者的病历数据。

为了应对这些挑战,数据脱敏技术应运而生。数据脱敏是一种数据保护方法,通过对敏感数据进行修改、转换或隐藏,以保护数据的安全性和隐私性。脱敏后的数据仍然保留其原始数据的结构和格式,但不包含直接识别个人的敏感信息。

数据脱敏也成为大部分企业在数据管控中的必修课。

CloudQuery 的数据脱敏能力

CloudQuery 目前已经搭载了静态脱敏和动态脱敏两种数据脱敏方式。

静态脱敏是一种在数据存储或传输过程中对数据进行脱敏处理的方法,采用“先脱敏-后分发”的方式。它通常在数据收集和存储阶段对敏感信息进行脱敏,以确保数据在存储和传输过程中的安全性。静态脱敏的目标是通过对敏感信息进行不可逆的处理,使其无法还原为原始数据,以保护个人隐私。

而动态脱敏一种在数据使用过程中动态地对敏感信息进行脱敏处理的方法。与静态脱敏不同,动态脱敏是在需要使用敏感信息时进行加密,其他情况下仍保持数据的明文状态。可以说,动态脱敏的核心概念是根据实际需求和使用场景,在数据使用过程中灵活调整脱敏级别和方式,以实现更高级别的隐私保护和数据可用性的平衡。

动态数据脱敏和静态数据脱敏适用于不同的场景,两者之间没有优劣之分,主要是以使用场景来选择合适的脱敏模式。目前 CloudQuery 静态脱敏功能仅对企业版客户开放,本文将主要介绍几个版本的通用能力——动态脱敏。

CloudQuery 动态脱敏解决方案

目前主流的动态脱敏技术路线分为「结果集解析」和「语句改写」两条路径:

  • 结果集解析:
    不改写发给数据库的语句,需要提前获悉数据表结构,待数据库返回结果后再根据表结构判断集合内哪些数据需要脱敏,并逐条改写结果数据。

  • 语句改写:
    将包含敏感字段查询的语句改写,对于查询中涉及的敏感字段(表列)通过外层嵌套函数的方式改写,使得数据库运行查询语句时返回不包含敏感数据的结果集。

但两种方法各有优劣。「结果集解析」具备更高的灵活性和数据可用性,但同时在处理大规模数据时会带来一定的性能开销。「语句改写」效率更高,其在查询语句中改写敏感字段的方式更确保敏感数据不会传输到应用层或其他环节,保证较高的数据安全性,同时语句改写还具备良好的可移植性。但相对的,因为在查询语句中进行修改,「语句改写」势必会限制一些复杂查询,其可定制性较弱。

针对两种方法的不同,CloudQuery 在动态脱敏的实现上融合了 SQL 语句改写与结果集改写两种技术路线优点,实现了性能和适用性的平衡,用户可基于不同的场景根据 SQL 语句的不同,触发不同方式的脱敏,全面覆盖运维场景和业务场景下数据实时脱敏需求。

例如:select * from table1;

该语句由于语句中是查询的所有列,这时我们不会进行前置脱敏,转而在执行结束之后,对比结果集中的列名,判断与已配置的列名是否相同,去进行结果集解析的脱敏。

而下面这种:select a from table1;

在语句中有显式的查询 a 这个列,则会对 a 进行改写,将语句改写成select func(a) from table1;

去执行,这样就只会使用前置脱敏,而不用去遍历结果集。

使用过程中可以根据数据量和性能要求使用不同的 SQL 语句去查询。

CQ 的动态脱敏功能如何使用?

CloudQuery 社区版 v2.0.0 的动态脱敏功能无须改变生产数据库中的数据,即可依据用户级别、数据级别,对数据库返回数据进行差异化脱敏。可以确保不同角色的用户能够差异化地访问数据库中的敏感数据。支持截取、加密、隐藏、替换等脱敏算法。

在 CloudQuery 的主页面点击「数据保护管理」菜单按钮可进入数据保护设置页面。


我们这里给 AAA 字段设置一个保留前三位的截取算法。

之后也可在该处或者该表的父级节点选择是否开启规则。

改写前后如下图所示:

(改写前)

(改写后)

CloudQuery 动态脱敏展望

在之后的版本中,CloudQuery 会陆续推出更多功能来完善动态数据脱敏图谱,如:

  • 自定义结果集数据解析规则: 即在一个 schema 下指定一个正则表达式,如手机号码或身份证号,如果查询结果有符合格式的数据,则会按照相应改规则进行脱敏。并且支持内置脱敏规则的自定义添加,该方式可以捕捉到没有被配置的脱敏算法拦截到的敏感数据,进一步保障数据安全。

  • 通过分级方式脱敏: 即支持对字段设置等级,对用户设置等级。不同用户只能查询到其对应等级的数据,不符合要求的数据则会被脱敏,提供更加个性化和精确的隐私保护能力。

  • 数据扫描: 自动识别敏感数据项和敏感数据的位置,扫描后数据可被分类为不同的敏感级别或类别,以便为每个类别应用相应的脱敏规则。同时,数据扫描可以分析敏感数据之间的关联性,确保在脱敏过程中保持数据的一致性和完整性。通过理解敏感数据之间的关系,可以确保脱敏后的数据仍然具有可用性和实用性。

  • 字段脱敏算法推荐: 针对不同的应用场景和需求推荐不同的字段脱敏算法,结合多种算法和策略,以实现对不同类型的敏感数据进行灵活、安全和高效的脱敏处理。

动态数据脱敏是 CloudQuery 数据保护管理能力里的重要组成部分。通过实时对敏感数据进行脱敏处理,在数据使用和共享的过程中减少了对敏感信息的可见性,从而降低了数据泄露和滥用的风险。

后续 CloudQuery 不仅会完善动态脱敏功能,更会不断补充数据保护能力。目前在 CloudQuery 企业版中就已经实现了国密支持、审计日志、数据备份等能力。综合运用这些数据保护措施,企业可以建立起完善的数据安全和隐私保护体系,保障数据的安全性、完整性和可用性。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

干货分享 的相关文章

  • Qt源码分析:Qt程序是怎么运行起来的?

    一 从 exec 谈起 一个标准的Qt gui程序 在启动时我们会coding如下几行简洁的代码 include widget h include
  • 【镜像压缩】linux 上 SD/TF 卡镜像文件压缩到实际大小的简单方法(树莓派、nvidia jetson)

    文章目录 1 备份 SD TF 卡为镜像文件 2 压缩镜像文件 2 1 多分区镜像文件的压缩 树莓派 普通 linux 系统等 2 2 单分区镜像文件的压缩 Nvidia Jetson Nano 等 3 还原镜像文件到 SD TF 卡
  • 智能时代:自然语言生成SQL与知识图谱问答实战

    语义解析 前言 语义解析的应用场景 总结概论 语义解析和大模型的关系 延伸阅读 前言 语义解析技术可以提高人机交互的效率和准确性 在自然语言处理 数据分析 智能客服 智能家居等领域都有广泛的应用前景 特别是在大数据时代 语义解析能够帮助企业
  • 【Mysql】InnoDB 引擎中的页目录

    一 页目录和槽 现在知道记录在页中按照主键大小顺序串成了单链表 那么我使用主键查询的时候 最顺其自然的办法肯定是从第一条记录 也就是 Infrimum 记录开始 一直向后找 只要存在总会找到 这种在数据量少的时候还好说 一旦数据多了 遍历耗
  • 【计算机毕业设计】病房管理系统

    当下 如果还依然使用纸质文档来记录并且管理相关信息 可能会出现很多问题 比如原始文件的丢失 因为采用纸质文档 很容易受潮或者怕火 不容易备份 需要花费大量的人员和资金来管理用纸质文档存储的信息 最重要的是数据出现问题寻找起来很麻烦 并且修改
  • 【计算机毕业设计】个人日常事务管理系统

    进入21世纪网络和计算机得到了飞速发展 并和生活进行了紧密的结合 目前 网络的运行速度以达到了千兆 覆盖范围更是深入到生活中的角角落落 这就促使 管理系统的发展 管理系统可以实现远程处理事务 远程工作信息和随时追踪工作的状态 网上管理系统给
  • 【计算机毕业设计】校园体育赛事管理系统

    身处网络时代 随着网络系统体系发展的不断成熟和完善 人们的生活也随之发生了很大的变化 人们在追求较高物质生活的同时 也在想着如何使自身的精神内涵得到提升 而读书就是人们获得精神享受非常重要的途径 为了满足人们随时随地只要有网络就可以看书的要
  • 【计算机毕业设计】网上拍卖系统

    现代经济快节奏发展以及不断完善升级的信息化技术 让传统数据信息的管理升级为软件存储 归纳 集中处理数据信息的管理方式 本网上拍卖系统就是在这样的大环境下诞生 其可以帮助使用者在短时间内处理完毕庞大的数据信息 使用这种软件工具可以帮助管理人员
  • 【计算机毕业设计】Java图书馆智能选座系统

    现代经济快节奏发展以及不断完善升级的信息化技术 让传统数据信息的管理升级为软件存储 归纳 集中处理数据信息的管理方式 本图书馆智能选座系统就是在这样的大环境下诞生 其可以帮助使用者在短时间内处理完毕庞大的数据信息 使用这种软件工具可以帮助管
  • Jenkins 插件下载速度慢、安装失败了!我教你怎么解决!

    Jenkins部署完毕 如果不安装插件的话 那它就是一个光杆司令 啥事也做不了 所以首先要登陆管理员账号然后点击系统管理再点击右边的插件管理安装CI CD必要插件 但是问题来了 jenkins下载插件速度非常慢 而且经常提示下载插件失败 真
  • messages,CentOS 7不收集日志或不存在 /var/log/messages

    var log message var log secure等都不记录了 并且都是空文件 重启机器 reboot 无效 重启日志 systemctl start rsyslog 无效 怀疑空间不足 删除 var log messages 重
  • 通俗易懂,十分钟读懂DES,详解DES加密算法原理,DES攻击手段以及3DES原理

    文章目录 1 什么是DES 2 DES的基本概念 3 DES的加密流程 4 DES算法步骤详解 4 1 初始置换 Initial Permutation IP置换 4 2 加密轮次 4 3 F轮函数 4 3 1 拓展R到48位 4 3 2
  • 基于java的学生宿舍管理系统设计与实现

    基于java的学生宿舍管理系统设计与实现 I 引言 A 研究背景和动机 基于Java的学生宿舍管理系统设计与实现的研究背景和动机 在数字化时代的推动下 学生宿舍管理系统已经成为了管理学生宿舍的重要工具 学生宿舍管理系统能够帮助管理者更好地管
  • 基于java的饮食分享平台系统设计与实现

    基于java的饮食分享平台系统设计与实现 I 引言 A 研究背景和动机 近年来 随着人们生活水平的提高和健康意识的增强 饮食健康已经成为越来越多人的关注焦点 因此 一个方便快捷的饮食分享平台就显得尤为重要 基于Java的饮食分享平台系统设计
  • 软件测试|SQLAlchemy环境安装与基础使用

    简介 SQLAlchemy 是一个强大的 Python 库 用于与关系型数据库进行交互 它提供了高度抽象的对象关系映射 ORM 工具 允许使用 Python 对象来操作数据库 而不必编写原生SQL查询 本文将介绍如何安装 SQLAlchem
  • 基于java的物业管理系统设计与实现

    基于java的物业管理系统设计与实现 I 引言 A 研究背景和动机 物业管理系统是指对物业进行管理和服务的系统 该系统需要具备对物业信息 人员信息 财务信息等进行管理的能力 基于Java的物业管理系统设计与实现的研究背景和动机主要体现在以下
  • 【计算机毕业设计】北工国际健身俱乐部

    本系统为会员而设计制作北工国际健身俱乐部 旨在实现北工国际健身俱乐部智能化 现代化管理 本北工国际健身俱乐部管理自动化系统的开发和研制的最终目的是将北工国际健身俱乐部的运作模式从手工记录数据转变为网络信息查询管理 从而为现代管理人员的使用提
  • MongoDB - 库、集合、文档(操作 + 演示 + 注意事项)

    目录 一 MongoDB 1 1 简介 a MongoDB 是什么 为什么要使用 MongoDB b 应用场景 c MongoDB 这么强大 是不是可以直接代替 MySQL d MongoDB 中的一些概念 e Docker 下载 1 2
  • Python 使用 NoSQL 数据库的优选方案

    NoSQL 数据库因其高性能 可扩展性和灵活性而风靡一时 然而 对于 Python 程序员而言 选择合适的 NoSQL 数据库可能会令人困惑 因为有多种选择可供选择 那么 哪种 NoSQL 数据库最适合 Python 呢 2 解决方案 根据
  • 【安全-SSH】SSH安全设置

    今天发现自己的公有云服务器被攻击了 在这里插入图片描述 https img blog csdnimg cn direct cafdca04646f4b8b838400ec79ac282f png 然后查看了登录日志 如上图 ls sh va

随机推荐

  • (五)pandas-修改数据

    pandas修改数据可以通过以下几种方式 1 通过切片定位到数据位置 然后直接赋值 2 mask where 两个函数 3 replace函数 4 apply函数 以下图df为例 1 切片方式 切片方式用于通过下标 标签直接定位到指定位置
  • 高性能Key/Value存储引擎levelDB, rocksDB, TiDB,InnoDB

    高性能存储引擎levelDB rocksDB TiDB InnoDB 1 简单介绍 1 1 LevelDB LevelDB是Google开源的持久化KV单机数据库 具有很高的随机写 顺序读 写性能 但是随机读的性能很一般 也就是说 Leve
  • 在windows系统中使用Ceres非线性优化库:(一)安装Ceres库

    一 安装Ceres库 1 用vcpkg安装Ceres库 1 1 安装vcpkg 1 2 安装Ceres 1 3 配置Ceres 2 用Virtual Studio安装Ceres库 2 1 下载ceres windows 2 2 打开或升级解
  • mysql查询每个学生最高分_mysql查询各班最高分学生的信息

    学生表student 班级表class 课程表subject 成绩表score 一 查询各班最高分学生的信息 1 从成绩表score中查询每个学生的总成绩并按降序排列 select sc stu id sum sc score sumsco
  • 小程序图片懒加载放在服务器,【小程序】使用uni-app搭建小程序环境---图片懒加载...

    延迟加载的理念 页面初始化时 暂不加载处于屏幕可见区域之外的图片 该方案会有如下几大好处 n加快页面渲染速度 n提升页面滚动性能 n默认不下载屏幕外的图片 减少网络流量 主标题 列表二级标题 exportdefault data varim
  • 手写Android事件分发

    Android事件分发原理搞清楚可以辅助我们解决很多实际项目中遇到的事件冲突等问题 1 进入正题之前 问大家几个事件相关的问题 标签 dispatchTouchEvent Q1 Android点击事件传递规则是怎样的 下面几步仔细阅读2遍
  • Gradle基础知识

    转自 https blog csdn net xingzhong128 article details 80290166 前言 随着业务需求变得越来越复杂 项目的规模也变得越来越大 项目越大包含的代码资源文件也就越多 而越大的项目往往需要越
  • 图书管理系统(包含找回密码、设置密保等) C语言

    目录 一 需求分析 二 概要设计 1 程序设计框架 2 数据结构 3 模块函数划分 三 详细设计 1 main主函数 2 主菜单函数 3 密保 4 管理员登录 5 修改管理员账号和密码 6 录入图书 7 输出图书 8 修改图书 9 删除图书
  • android-studio undefined reference to `__android_log_print

    最近在使用android studio编译安卓程序 要用到jni 我在jni源码中引用了 android log print 且在Android mk中加了LOCAL LDLIBS llog 但是编译时还是会出现如下错误 Error 82
  • PHP 实现抽奖功能

    1 场景 商品抽奖 用户参与抽奖后 分享页面给新用户 并且新用户也参与抽奖 然后为上个用户增加一次抽奖码 2 问题 用户获得的抽奖码机会只为了增加自己的中奖概率 一次活动的产品一个用户只 能中一次 public function index
  • 00天精通Python(基础篇)——第10天:字符串格式化

    文章目录 python中常用的数据类型占位 示例 示例代码 python中常用的数据类型占位 示例 占位符 变量 占位符 s d f 我们可以通过如下语法 完成字符串和变量的拼接 示例代码 name 科比 time 2006 score 8
  • getCurrentInstance

    https blog csdn net m0 46318298 article details 130726043 注 是在vue中所有实例中都可用的一个简单约定 这样做会避免和已被定义的数据 方法 计算属性产生冲突
  • ‘pip’不是内部或外部命令---Python+OpenCV配置过程中常见问题

    1 用pip进行安装时 输入pip命令会提示 pip 不是内部或外部命令 在python安装目录中找得到script文件夹 查看文件夹内部是否存在pip3 exe这个文件 下面以我的电脑为例 如果没有 在命令行输入 python m ens
  • stream, parser, 文法的一些概念

    stream就是个Iterable
  • leaftlet入门教程一

    1 实时输出坐标 监听 mousemove 事件 map on mousemove e gt let latlng e latlng console log latlng lat 30 59 lng 114 32 取消 mousemove
  • 全球及中国废钢市场发展机遇与十四五运行潜力调研报告2022版

    全球及中国废钢市场发展机遇与十四五运行潜力调研报告2022版 修订日期 2021年11月 搜索鸿晟信合研究院查看官网更多内容 第一章 废钢相关概述 1 1 废钢基本概念 1 1 1 废钢的定义 1 1 2 废钢的来源 1 1 3 废钢的分类
  • 开源进展

    作为连接实体对象 人或物 的现实身份与链上身份的可信映射 实现实体对象之间安全可信的数据授权与交换 分布式身份技术解决方案在推动区块链应用繁荣及可信数据流转的过程中扮演着重要角色 WeIdentity是由微众银行自主研发并完全开源的一套分布
  • Failed to execute ‘pushState‘ on ‘History‘: function nextWeek(now)......

    我在使用react跳转页面传参数时 报了上述错误 具体代码为 原因 saveData里面存在函数 我在传值的时候 参数里面有时间格式的数据 里面包含函数 所以不能跳转 需要把时间格式的数据转换成字符串或其他形式 我转换成了YYYY MM D
  • C++基础-基础数据类型

    目录 类型简介 整型 整型类型宽度 整型类型取值范围 如何选择适合的整型 整型字面量 整型字面量的表示形式 如何确定整型字面量的类型 本节了解即可 char类型 char类型的符号 字符字面量 bool类型 浮点类型 浮点数内部存储方式简介
  • 干货分享

    在企业数字化转型的过程中 尤其随着互联网 云计算 大数据等信息技术与通信技术的迅猛发展 海量数据在各种信息系统上被存储和处理 其中包含大量有价值的敏感数据 这意味着数据泄露的风险也不断增加 数据泄露可能由各种因素引起 包括恶意攻击 黑客入侵