欢迎来到第壹文秘! | 帮助中心 分享价值,成长自我!
第壹文秘
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 第壹文秘 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    个人隐私脱敏算法能力评估、分类示例、可逆性、信息偏差性、损失性、复杂性的计算方法、脱敏算法能力评估报告示例.docx

    • 资源ID:1239908       资源大小:75.25KB        全文页数:17页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    个人隐私脱敏算法能力评估、分类示例、可逆性、信息偏差性、损失性、复杂性的计算方法、脱敏算法能力评估报告示例.docx

    附录A资料性)脱蚀算法能力评估示例概述本附录以k-匿名算法对文本类医疗数据的脱敏能力评估为例,介绍针对脱敏算法能力评估指标体系的使用方法,供进行脱敏算法能力评估时参考,脱收算法能力评估过程的关键处理环节包括脱被算法评估维度权重确定、敏感信息属性确定、评估指标选定、可逆性评估、信息偏差性评估、信息损失性评砧、更杂性评估以及评估报告生成.脱敏算法评估维度权重确定根据数据的使用场景、来就、脱敏意图等因案,定义脱技。法评估维度的权重.本示例中数据的应用场景为医疗问诊场景,数据模态为结构化数据,使用的k-匿名W法(脱坡参数k=3)屈于泛化技术,参考表A.1建议的不同脱敏算法类别(泛化、匿名、置换、差分或私处理文本类医疗数据时的评估指标维度权重,将可逆性、信息偏差性、信息损失性、女杂性四个维度的对应权重分别为0.2、0.2、0.5,0.1.不同脱敏算法类别处理文本类医疗数据时的评估指标维度权重叁考'ii信恩偏整性信息抠失性i性圜评估点番号权31褥估点方考权St参考ttR押估京普考权成化术泛技脱政算法是否可逆0.1脱收前后数据均值.04值息息整O1.0.5时间fi!fS0.05脱敏前后效据方经.(M还吼信息的港确性0.05脱收IW后数期均方於0.03K1.ift度0.03空同纪杂度0.05还原佑息的误差性0.05欧氏即悉0.03平均绝时值0.03的名技术脱敏算法是否可逆0.1脱故前后致据均值0.04信息嫡尤值0.5时间乂杂度0.05脱敏前后数据力差0.04还Ki信总的於确性0.05IftfeiWJfrft据均方差0.03K1.1.tt度0.03空间复汆慢0.05还瞭怡息的谯差性0.05Bfc氏手离0.03平均绝对值0.03*m技术脱或算法是否可逆03脱敏前4数据均依0.04倡总息案位0.2时间纭杂度0.05脱政前后数1«方差0.04还原信息的推碗性0.1脱收前后数据均方差0.03K1.般度0.03空网0.05还原侑对的误差性0.1欧氏神离0.03手均绝对他0.03脱政算法是否可逆0.1脱地前后数M均值0.08信息燧差僮0.2时间乂杂度0.05弟分的私技术脱於前后攻据方整0.08还Iei伯息的涯确性0.05脱敏前E数累均方差0.08K1.11¾0.08空间0.05还原信息的误差性0.05欧氏即感0.09平均绝对低0.09敏感信息属性谈定收集并整理待评测的原始数据和经过k-匿名修法处理后的数据,在本示例中,原始数据如表A.2所示.k匿名算法处理后的数据如表A.3所示.确定本次脱敏操作的敏感信息M性为“年龄”.原始数据序号IW编年龄期症I4767729QK烧24760222心脏晒34767«27心脏病44790543流期54790952心脏饶64790647癌在7476()530-C-IRVi476173694760732麻丘脱敏后数盘序号邮箱年舲I476”2*<91:01247632«心脏切3476t*2<心肚出44790*2054790*240心脏病6479(尸40癌施7476t*3.心脏病8476«*3癌症9476"3.媪评估指标选定a)确定可逆性的评估为W法的可逆程度,脱触算法参数以及信息的还原性.坪怙指标为脱邮:算法是否为不可逆算法,脱加:算法的参数对于原始数据数据规模的脱敏强度是否合出,通过脱政后的隐私信息还原出原始隐私信息的程度:b)确定信息偏差性的评估为原始数据与脱敏后数据之间的平均绝对误差和欧氏乐离.评估指标为脱敏前后数据间的平均绝对误基0-2.13时为偏差性较低,2.I3-4.63时为偏差性中等,4.63以上为偏差性较高。脱敏前后数据间的欧氏距离07.g时为偏差性较低,7O4938时为偏差性中等,9.38以上为偏差性较而;C)确定信息损失性的评估为原始数据与脱敏后数据之间的信息烷差侪和互信息.评估指标为脱敏前后数据间的信息端整i0-0.06时为信息损失性低,0.064M时为信息损失性中等,4.36以上信息损失性高。脱敏前后数据间的互信息为0.8-1.0时为信息损失性低,0.40.8为信息损失性中等,00.4为信息损失性高;d)确定复杂性的评估为脱敏算法的时间更杂度和空间更杂度.评估指标为脱敏鸳法的时间更杂度小于O(Iogn)为红杂性低0(1.ogn)O(n)间为复杂性中等.大于。(")为红杂性高.脱敏算法的空间更杂度小干等干。(1)为更杂性低,为。(n)为复杂性中等,大于OOF)为复杂性高:可逆性评估本次脱敏使用的脱敏算法类别为泛化技术,使用k匿名律法.判断该脱敏律法为不可逆算法,参数k=3,数刖6为9条,通过脱敏后的陷私信息还原出原始陷私信息的概率为O.I.故本次脱敢任务中的可逆性低。信息儡差性评估计停得到脱败前后数据的平均绝对误差为13.4%依据评估指标34>4.8I,脱敏前后数据的欧氏距离为11.0。,依据评估指标11.00>938,故本次脱敢效果中的偏差性高。信息损失性评估计算知到脱陂函数捌的信,&淄为3.17.脱敏后数据的估息雌为1.58.脱敏的后数据的信息烟差值为1.59,依据评估指标006G.59<4.36,脱敏前后数据的互信息为0.48,依据评估指标0.4<0,18<0.8,故本次脱敏效果中的信息损失性中等.复杂性评估分析k-限名灯法的时间杂侬为O(n<dog(n),空间红杂度为O(n),故本次脱败效果中的配杂性离。评估报告生成对可逆性评估结果、信息假养性评估结果、信息报失性评估结果、复杂性评估结果进行加权操作,得出算法能力的综合评估结果,附录8(奥科性)脱敏算法分类示例概述本附录以脱收算法的按需选择为例.根据脱敏算法的实现原埋、应用场景、处埋数据方式等因素,可以分为差分的私、泛化、匿名、巴换四类技术,在本示例中,分别介绍般f差分盼私技术的脱收算法描述示例、基于泛化的脱故算法描述示例、基于匿名的脱敏立法描述示例和基于置换的脱敏灯法描述示例.供执行脱敏算法选择操作时参考.姑于差分隐私技术的脱敏算法衣BJ给出了27林基于差分隐私技术的脱故算法描述示例.友B.1基于差分隐私技术的脱敏算法描述示例序号名称编号功能使用方式11.ap1.aceMtx1.iaiiianA1.1.添加拉普拄斯嚎J*.返P1.添加曝声后的数值列表将入:数值列K输出:S(Ui列表»tt:隐私保护01别Wsk含义:选取班私用算2ReportNoisyMax1.-1.J1.PbCCA-1.-2添加拉普拉斯唯声,返I可添加n次魄加后的城大位索引列表轴入:数位列表输出:数位列表sfsk:酹私保护级别,乘样次数n器软;V义I选取融款招。,对输入的数值列&添加噪声的次数3RcponNoixyMaX3A-1.-3泽加拉甘拄期嗓声,返回添加n次噢出后的域大位列*输入:故值列表悔出:数次列表Stt.心品保护国别.采柞次数nStt选取越私预立,对输入的数值列表添加噪声的次数4SnappingMochnnismA-1-4滓加拉普依斯味声.这也I武斯后的故俶列发输入:散位列表输出:数优列表被断边界B,采样次数。梦欲含义,数值列表中敏据的载断边界,对脩入的数值叫我淞加啖尚的次数5IM-CodCr1.A-1-5为图片添加捡甘拄斯噪声.这回加味后的图片输入I图片检出r图片参微Ia私保护级别畛数含义:或取送私1。6dpAJ沁A-1-6时小纹特征添加拉希拉斯*声.返回加噪后的音频输入I*«输出Ift®参微隐私保护级网ttZ.选取K1.私及以7dpGraphA-1.-7为图形IS据渐加拉普拉斯嚎出怖入I图形输出I图形参微隐私保护级期参(含义I选双跄私预算8dpDacA-I-S为日期数据滓加拉普拉斯味祖.SiM加味后的U期数组输入IH期列&输出IH期列表参微隘私保护蝮期参数含义,选取防私预。9IM-Coder2A-1-9为图像渗加拉。拉斯噪MM后的图像输入I图像输出I图恢参数I隘私保护级别选取S3私预算IOExponcntia1.Meciiani、mA-2-1.返回一姐数值中期个数位被选中的“率.这回斛个致使被选中的察率幡入I数值列表输出I数次列表»ft隘私保护SS别参数含义:选取魁私用口I1.Rco<xNoisyMax2-EXporKnIia1.A-2-2向致武添加指数噪声后.返回涿N1.n次垛声H最大值的索引输入I数值列表输出I数i列表rtk除私保护级别,采样次数ntkX.选取徵私预算,对输入的数值列表济加啖出的次数12ReportNgiKyMax4A23向故阻涔加指w声后.返回添加n次噪评后效炮的城大M列入输入:数值列表:数值列表参数:购私保护级别.采样次三(nWti含义:选取融私ff1.i?.对输入的散位列技添加噪小的次数13SpreVectorTCChnique1.A-M幡琉向量技术.数X1.佻和阙iftt加喋后避行比较.返回n个比较结果列表将入:数值列收输出:数他列表警放:酹私保护级别,采样次致n,MtfU.ittc黎软含义I选取除以残口,对输入的数价列表添加噪声的次ft.用于比较的肉力i.返同应拧的计数C14SparseVev1.orTcchniqc2.1?稀织向策技术,致出也和肉Crt(加噪后避行比较.返回n个比较结果列次输入:M值列表输出:数也列表Stt.MS私保护级别,采样次数n,KffIt.计数CStt>选取跄款孩以,对输入的数值列表添加噪声的次ft.川干比较的阈火,返M应答的计数C15S1rcVccinrTechniquc3A-3稀破向用技术,给IHf1.ift和网值t加11后进行比较.&n个比较结果列表幡入I数值列表输出I数值列表tk.Ia私保护级别,采样次数n.M(f(c.计数C含义:选取K1.私预算.对输入的数值列表添加嗔出的次数.用于比收的阳位1.返阿应答的计数C16SparseVectorTcchnique4A-M树武向小技术,给数组例和储值t加啖后进行比较.½Hn个比仅结果列表输入I数值列表输Hh牧何列表¾-r,:除稻保护级别.栗样次数n.Mtfi1.Jtic参数含义:选取跄想色界对检入的数值列表滋加鹏声的次畋,用于比较的阈U,返网应答的计数C17SpcrneVcviorTcc

    注意事项

    本文(个人隐私脱敏算法能力评估、分类示例、可逆性、信息偏差性、损失性、复杂性的计算方法、脱敏算法能力评估报告示例.docx)为本站会员(p**)主动上传,第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第壹文秘(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 1wenmi网站版权所有

    经营许可证编号:宁ICP备2022001189号-1

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!

    收起
    展开