differential privacy 差分隐私入门 (二)

2023-11-15

(书接上回)

 对差分隐私比较感兴趣,看了几篇文章,了解一下大概的思想。现在决定重新看一下,发现有些文章内容不是很懂,干脆就一边翻译一边看了,不懂的地方我会加下划线,如果有人看到了,还请不吝指教。(注:文章是Cynthia Dwork的《Differential Privacy》)

隐私泄露完全防护的不可实现性

这种“不可能的结果”需要注意数据的实用性,毕竟如果一个机制只输出空字符串或者仅仅是噪声,显然也是保护了隐私。首先提到一些现有的机制,比如直方图发布或者K-Anonymity技术[19],很明显,对于一个有用的机制来说,他的输出不应该被用户预测到;在随机化的机制里也是如此,但是其中的不可预测性不是来自于随机机制的随机选择。感觉上来说,应该有一系列的问题(其中大多数),这些问题的答案对于用户来说是可学习的,但在事前是不知道到的。因此我们提出了一个可用性向量,称为 w,这是一个有着固定长度 k 的二进制向量(对于二进制值无特别意义)。我们可以认为关于数据问题的答案就是这些可用性向量。
数据库的隐私侵犯可以用图灵机 C 来描述,输入数据库分布 D 的描述,通过这个描述生成一个数据库 DB,一个所谓隐私侵犯的字符串并输出一个单独的比特(我们不知道具体的D的分布是什么)。我们要求C总是停止。我们说,如果在C中,给定一对(D,DB),生成了一个C(D,DB,s)接受的字符串s,则认为隐私被侵犯了。下文中C将省略。
附加信息生成者是一个图灵机,他的输入是数据库的分布D和以此生成的数据库DB,输出一个附加信息字符串z。攻击者和模拟者都会获得这个字符串。模拟者没有任何数据库的权限,攻击者可以通过隐私保护机制访问数据库。
我们用一种交流式的图灵机来模拟对手。下面的理论说明了对于任何隐私保护机制 San()和任何分布在San()中满足某种技术的分布D,总会有一些附加信息z,使得z单独出现没有影响,但是若是和访问数据库的权限结合起来,就可以认为会造成隐私泄露。除了对上面讨论的效用矢量的熵要求进行形式化外,分布上的技术条件表明,了解隐私泄露的长度并不能帮助人们猜测隐私问题。
理论1:给定任何的隐私保护机制San()和一个隐私泄露判定者C。存在一个附加信息生成者和一个攻击者,对于任何满足假设3的分布D,和所有的模拟攻击者A*,
Pr[A(D,San(D,DB),X(D,DB))wins]-Pr[A*(D,X(D,DB))wins]>= ∆
 ∆一个合格的选定的常数。The probability spaces are over choice of DB ∈R D and the coin flips of San, X, A, and A∗?(翻译者:就说隐私保护机制的存在增加了隐私泄露的风险 ∆?)
在看到附加信息生成者输出的信息之前,分布D描述了攻击者所知道关于数据库的任何信息。例如,可能知道数据库的行与至少拥有两只宠物的人有关联。注意在定理的声明中,所有参与方可以可到分布D,可能还有一个C的硬链接;但是,攻击者并不会使用它们。
当所有w都是从San(DB)中得到时X和A所选择的策略:为了研究我们的观点,我们先用一些非正式的方式来描述这种特殊情况的策略,在这种情况下,对手总是从隐私机制中学习所有的效用向量w。这是比较现实的,例如,当数据清洗提供了一个在各个年龄区间患病的人数统计直方图,或者数据清洗者从数据库中随机选出一部分子集来发布不同疾病,不同年龄段的统计信息。这个简单的例子让我们可以使用一个假设3 的更宽泛的版本:
假设2:
1,任意0<γ<1,存在nγ,使得Pr[|DB|>nγ]<γ(DB属于RD);nγ可以被D当做输出计算出来。
2,存在一个l是下面两项成立:
(a)给定任何隐私泄露长度l,使用向量的最小熵是l。
(b)对于每一个DB属于D都有长度为l的隐私泄露。
3,Pr[B(D,San(DB))wins ]<=u成立,对于任何交互式图灵机B,u是一个合适的小常量。 The probability is taken over the coin flips of B and the privacy mechanism San(), as well as the choice of DB ∈R D?
直觉上来说,2(a)部分意味着我们可以从实用性向量中随机抽取l个比特。。。
(恕奴愚钝,越来越看不懂了,下一篇直接到差分隐私吧)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

differential privacy 差分隐私入门 (二) 的相关文章

  • less样式变量设置透明度、饱和度

    不透明度 background fade blue 20 饱和度 background lighten blue 20
  • JavaScript(null, undefined 和布尔值)

    JavaScript null 和 undefined 概述 用法和含义 布尔值 null 和 undefined 概述 null与undefined都可以表示 没有 含义非常相似 将一个变量赋值为undefined或null 老实说 语法
  • 如何用手机快速精准定位、查看当前详细位置信息

    下载链接 https pan baidu com s 1eu6m8D2tQKs0XyZnzVg79w 提取码 ivu7
  • Chatgpt帮我写程序切分Midjourney生成的图片

    背景 非程序员 只懂VBA 其他语言一概没入门 这两天在尝试MJ在抖音上做图文的玩法 遇到一个问题 如何将MJ生成的一张4宫格图片切分成4张单独的图片 找了一圈 要是用图片处理软件 那太麻烦了 忽然想到chatgpt可以写程序 于是我向ch
  • 瑞芯微迅为iTOP-3399开发板资料更新最新版本为1.3版本

    迅为3399开发板 1 Android底层驱动移植篇新增基于RTL8822CS模块Android7移植WiFi2 Android底层驱动移植篇新增基于RTL8822CS模块Android7移植蓝牙 lt lt lt lt lt lt lt
  • having关键字和where关键字区别

    select语句的基本格式 select 字段列表 from 表 where 表达式 group by 字段 having 表达式 order by 字段 having关键字和where关键字区别 相同点 都是用来过滤数据 不同点 havi
  • 熵在机器学习中的应用

    1 信息量 首先是信息量 假设我们听到了两件事 分别如下 事件A 巴西队进入了2018世界杯决赛圈 事件B 中国队进入了2018世界杯决赛圈 仅凭直觉来说 显而易见事件B的信息量比事件A的信息量要大 究其原因 是因为事件A发生的概率很大 事
  • Unity拓展——Project窗口拓展

    Unity拓展 Project窗口拓展 1 鼠标右键单击面板 Project面板是用来存放整个工程文件信息的 这个窗口也是可以进行用户自定义拓展的 我们单击Project窗口空白的地方 就会弹出一个面板如下 我们再看看Unity菜单栏 打开
  • 基于教学优化算法(TLBO)求解TSP问题 (Matlab代码实现)

    个人主页 研学社的博客 欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 目录 1 概述 2 运行结果
  • [ 靶场环境篇 ] XSS-labs 靶场环境搭建(特别详细)

    博主介绍 博主介绍 大家好 我是 PowerShell 很高兴认识大家 主攻领域 渗透领域 数据通信 通讯安全 web安全 面试分析 点赞 评论 收藏 养成习惯 一键三连 欢迎关注 一起学习 一起讨论 一起进步 文末有彩蛋 作者水平有限 欢
  • vscode中文注释显示成乱码

    在Ubuntu中用vscode打开代码后发现中文部分出现乱码 搜索了一下方才找到简洁的解决办法 具体如下 1 打开vscode 打开带有中文注释的代码 可以看到中文注释部分为乱码 2 按住ctrl p键 在查找选项框中输入下列的命令 则有下
  • MySQL日志设置及查看

    MySQL有以下几种日志 错误日志 log err 查询日志 log 慢查询日志 log slow queries 更新日志 log update 二进制日志 log bin 默认情况下 所有日志创建于mysqld数据目录中 通过刷新日志
  • 【POJ 2406】 Strings

    Strings Time Limit 3000MS Memory Limit 65536K Total Submissions 35168 Accepted 14543 Description Given two strings a and
  • hosts文件为空白或删除情况修复

    直接输入修改即可 ip baiTab 空格 域名 回车 即可 du如果不放心 复制以下内容zhi修复hosts文件 再修dao改hosts文件 Copyright 1993 1999 Microsoft Corp This is a sam
  • 嵌入式面试题及答案

    我们在找嵌入式方面的工作时 最让我们头疼的恐怕就是技术类的面试题了 因为我们摸不到企业的命题规律 也不知道该怎样去准备 今天华清远见的高级嵌入式讲师将各大企业的面试题进行汇总 分享给大家 希望可以帮到各位小伙伴 下方附有答案哦 一 选择题
  • 深度学习基础模型算法原理及编程实现--10.优化方法:从梯度下降到NAdam

    文章列表 1 深度学习基础模型算法原理及编程实现 01 感知机 2 深度学习基础模型算法原理及编程实现 02 线性单元 3 深度学习基础模型算法原理及编程实现 03 全链接 4 深度学习基础模型算法原理及编程实现 04 改进神经网络的方法
  • C/C++趣味编程经典100例详解

    更新记录 2019 08 27 28题 重写 C C 语言经典 实用 趣味程序设计编程百例精解 1 绘制余弦曲线 在屏幕上用 显示0 360度的余弦函数cos x 曲线 问题分析与算法设计 如果在程序中使用数组的话 这个问题十分简单 但若规
  • 阿辉闯Java(Java基本语法)

    hallo 大家好 接下来和阿辉一起了解一下Java的基本语法吧 1 Java程序的基本格式 Java程序代码必须放在一个类中 初学者可以简单地把一个类理解为一个Java程序 类使用class关键字定义 在class前面可以有类的修饰符 类
  • 二十、转置矩阵

    1 定义 假设 交换A的所有行和列后 形成的新矩阵 即为矩阵A的转置矩阵 对一个矩阵进行转置的转置 结果是原矩阵 2 下面为转置矩阵的性质 分析矩阵时 我们主要从加法 乘法 零空间 列空间 秩 行列式等角度进行分析 矩阵又分为原始矩阵 逆矩

随机推荐

  • Uncaught ReferenceError: xxx is not defined 解决办法

    VM11371 1 Uncaught ReferenceError inputSize is not defined at
  • JSP&EL表达式&MVC&三层结构综合案例

    文章目录 JSP 1 JSP 概述 2 JSP 快速入门 2 1 搭建环境 2 2 导入 JSP 依赖 2 3 创建 jsp 页面 2 4 编写代码 2 5 测试 3 JSP 原理 4 JSP 脚本 4 1 JSP 脚本分类 4 2 案例
  • YOLOv7原文翻译

    前言 这个本来是我的毕业论文文献翻译 但是老师给打回来了 原因是网上的重合率太高 所以我又重新找了一篇 大家 文献翻译千万不要找大热门 太痛苦了 但是翻都翻完了所以就扔上来 除了一些名词不知道怎么翻译之外也还好 按理这些名词应该不翻译直接用
  • CentOS7下解决ifconfig command not found的办法

    注 本办法仅限于可联网的机器 即在安装时设置了IP地址和DNS可正常上网 解决办法如下 1 输入ip addr 确认IP地址是否设置正常 设置好如下所示 如果没有获取到IP地址则设置一个即可 2 确认sbin目录是否存在 cd sbin 3
  • Makefile学习(二)

    Makefile 1 ifeq DEBUG true 2 CC gcc g 生成debug版本 才可以生成调试信息 对程序进行调试 3 else 4 CC gcc 5 endif 6 all hello 7 hello lcd o play
  • 使用 Docker Desktop 安装 Centos 系统

    一 前言 由于 Docker 是一个容器 它支持在一个服务器进行多服务部署 并且还能保持服务的独立性 那么 在Docker 上的运用时 我们也是可以 独立部署多个系统来做不同是其他 这样环境独立的情况下 也就不会造成一下不必要的问题 二 使
  • 后端开发通用

    1 前后端开发 项目基于前后端分离的架构进行开发 前后端分离架构总体上包括前端和服务端 通常是多人协作开发 对于后端java工程师 把精力放在设计模式 spring springmvc linux mysql事务隔离与锁机制 mongodb
  • WB_BF项目问题说明以及探究

    我就现在WB BF项目群里面提到的 根据测试脚本运行日志来看 bf运行了约31小时后又开始出现了api调用返回nginx的错误信息 之后 bf客户端也无法打开 问题做一下说明 今天早上我在机器上复现了这一问题 针对于api调用会返回ngin
  • 遗传算法整理

    1 基本概念 使用群体搜索技术 将种群代表一组问题解 通过对当前种群施加选择 交叉和变异等一系列遗传操作来产生新一代种群 并逐步使种群进化到包含近似最优解的状态 2 遗传算法流程 3 标准遗传算法 标准遗传算法又称为经典遗传算法 它的优化变
  • 百度搭台,千家打擂,文心杯创业大赛成投资人新宠?

    百模大战 打响 掀起大模型领域 创业热潮 今年5月31日 百度启动 文心杯 创业大赛 后简称 大赛 不到1个月报名时间 吸引近1000个项目激烈角逐 在知名投资人和AI专家的权威评审和层层筛选后 40个潜力项目闯入 决赛圈 进行最终较量 大
  • Python数据可视化的例子——热力图(heatmap)

    关系型数据的可视化 热力图体现了两个离散变量之间的组合关系 热力图 有时也称之为交叉填充表 该图形最典型的用法就是实现列联表的可视化 即通过图形的方式展现两个离散变量之间的组合关系 读者可以借助于seaborn模块中的heatmap函数 完
  • skopt下载

    在pycharm中直接下载skopt时失败 网上有如下解决办法 在python当前位置执行下载 1 先安装scikit optimize pip install scikit optimize 后直接在pycharm中安装skopt成功 若
  • fastJson注解@JSONField指定字段的顺序

    使 ordinal指定字段的顺序 public class BasePackage JSONField ordinal 1 private int id JSONField ordinal 2 private int direction J
  • mysql数据库管理-FEDERATED存储引擎远程链接MYSQL+ORACLE

    一 FEDERATED存储引擎 01 从5 1 26开始 默认MySQL不启用federated存储引擎 所以需要在my cnf中加入federated选项 02 或是在命令行用 federated选项启动mysqld 1 1 说明 mys
  • ubuntu下修改用户的默认目录

    linux系统下 不同的用户有对应的默认目录设置 这些设置都被保存在配置文件 etc passwd中 由上我们可以看出 对于用户名为JACK的用户 其系统默认目录为 home JACK 那么有时候我们可能在JACK目录下新建了一个目录 co
  • 大模型:如何利用旧的tokenizer训练出一个新的来?

    背景 我们在用chatGPT或者SD的时候 发现如果使用英语写提示词得到的结果比我们使用中文得到的结果要好很多 为什么呢 这其中就有一个叫做tokenizer的东西在作怪 训练一个合适的tokenizer是训练大模型的基础 我们既可以从头开
  • actuator--基础--6.3--端点解析--loggers端点

    actuator 基础 6 3 端点解析 loggers端点 代码位置 https gitee com DanShenGuiZu learnDemo tree master actuator learn actuator01 1 介绍 用于
  • 使用Selenium自动化测试web程序

    Selenium 是目前用的最广泛的Web UI 自动化测试框架 核心功能就是可以在多个浏览器上进行自动化测试 支持多平台 windows linux MAC 支持多浏览器 ie ff safari opera chrome 多语言C ja
  • GB28181设备接入侧如何支持H.265?

    技术背景 一直以来 GB28181 2022之前的规范版本让人诟病的一点 没有明确针对H 265的说明 特别是监控摄像机 H 265已然成为标配 GB T28181 2022规范 终于针对H 265做了明确的说明 让我们来一起解读下规范 基
  • differential privacy 差分隐私入门 (二)

    书接上回 对差分隐私比较感兴趣 看了几篇文章 了解一下大概的思想 现在决定重新看一下 发现有些文章内容不是很懂 干脆就一边翻译一边看了 不懂的地方我会加下划线 如果有人看到了 还请不吝指教 注 文章是Cynthia Dwork的 Di er