您当前的位置：首页品牌正文

苹果研究人员提出集成反演技术，可从不同机器学习模型中重建训练数据

2021-12-15 15:36:33

近几年，模型反演（Model inversion, MI）攻击备受关注。MI 攻击是指滥用经过训练的机器学习（ML）模型，并借此推断模型原始训练数据中的敏感信息。遭受攻击的模型经常会在反演期间被冻结，从而被攻击者用于引导训练生成对抗网络之类的生成器，最终重建模型原始训练数据的分布。

因此，审查 MI 技术对正确建立模型保护机制至关重要。

借助单一模型高质量地重建训练数据的过程非常复杂，然而，现有的 MI 相关文献并没有考虑到多个模型同时被攻击的可能性，这类情况中攻击者可以找到额外的信息和切入点。

如果攻击成功，原始训练样本泄露，而其训练数据中如果包含个人的身份信息，那么数据集中的数据本体的隐私将会受到威胁。

集成反演技术

苹果的研究人员提出了一种集成反演的技术，借助生成器来估计模型原始训练数据的分布，而该生成器则被限制在一系列共享对象或实体的训练模型之中。

对比使用单一机器学习模型的 MI，使用该技术生成的样本质量得到了显著的提升，并具备了区分数据集实体间属性的能力。这证明了如果借助与预期训练结果相类似的辅助数据集，可以在不使用任何数据集的情况下依旧可以得到高质量结果，改善反演的结果。通过深入研究集成中模型多样性对结果的影响，并添加多重限制以激励重建样本获得高精确度和高激活度，训练图片的重建准确程度得到了提升。

对比针对单一模型的 MI 攻击，该研究所提出的模型在重建性能上展现了明显的提升。该研究不仅利用最远模型采样法（FMS）进行集成中模型多样性的优化，还创建了一个模型间等级对应关系明确的反演集成，模型的输出向量中的增强信息也被用来生成更优的限制条件，以更好地确定目标质量的高低。

通过随机训练的形式，小批量随机梯度下降（SGD）这类的主流动态卷积神经网络（DCNN），可以使用任意的大型数据集进行训练。DCNN 模型对训练数据集中最初的随机权重和统计上的噪音非常敏感，而由于学习算法的随机性，同一训练集可能会生成侧重特征不同的模型。因此，为减少差异性，研究者一般会使用集成学习，一种简单的技巧来提升 DCNN 辨别式训练的性能。

上一篇：电竞椅是不是智商税？中国椅业之乡的老板们告诉你

下一篇：斯坦福抢开“元宇宙”第一课，上起来还真不便宜

推荐搜索：苹果研究人员提出

“如果发现本网站发布的资讯影响到您的版权，可以联系本站！同时欢迎来本站投稿！

虚拟

喜马拉雅主播洛宾：播客拓宽了脱口秀的表演空间

2021-12-22
数字认证亮相2021中数联盟大会，赋能国企数字化转型

2021-12-22
首届雄安绿色高性能混凝土技术创新论坛成功举办

2021-12-21
牛客网发布2021秋招白皮书：28%应届生将“新一线城市”定为就业首选

2021-12-21
浪潮奔涌、玩家思变共享充电将走向何方？

2021-12-21

苹果研究人员提出集成反演技术，可从不同机器学习模型中重建训练数据

虚拟

未来

华中农业大学2021 MapGIS杯地理信息科学专业技能大赛圆满举办

怡升科技向39所学校捐赠47套健康饮水设备

“关爱农村留守老人”全国优秀案例学习推广活动在北京启动

宝可梦与小众包包的联名，你买账么？

青云科技联合麒麟软件推出“全维信创云解决方案”

译青春获得2021新个体创业诚信示范平台