正如人们需要保护自己的敏感数据(如社会安全号码)一样,制造企业也需要保护自己的敏感企业数据。目前对专有制造信息的保护较少,这使得它成为窃取企业数据(如设计模型)的成熟环境。
宾夕法尼亚州立大学的一组研究人员和研究生在美国测试与材料学会(American Society for Testing and Materials)上报告称,一种被称为差别隐私的特殊方法可能能够更好地保护制造商的业务、敏感的设计细节和公司整体声誉。
“网络攻击越来越多地出现在制造业,”工业工程教授杨辉说。这给常规操作带来了意想不到的中断,造成了数十亿美元的损失。例如,对手经常试图从用于创建分析模型的训练数据集中推断样本,或者使用已发布的模型来推断目标的敏感性,而该目标的其他背景信息是可用的。由于制造系统是一个国家经济增长的关键基础设施的支柱,因此迫切需要保护制造企业的隐私信息,并将模型反转攻击的风险降到最低。”
企业经常对大型数据集进行数据挖掘,以了解能够增加利润、降低成本、降低风险等的模式。数据挖掘可能会无意中暴露私人数据,对制造商构成重大安全威胁,因为客户身份、生产规格和机密业务信息等机密数据可能会受到损害。
差异隐私是一种新兴的保护数据不被任何可能暴露系统内敏感数据的尝试的方法。差异隐私可以解决这个问题,方法是创建一个方案,迫使系统在最需要保护的数据周围制造“噪音”,并优化这些不同类型数据的隐私参数。
“保护隐私的想法已经存在,但现在它得到了更多的关注,”工业工程学院艾伦E.皮尔斯和艾伦M.皮尔斯教授Soundar Kumara说。“不同的隐私方法能够衡量在不同情况下需要多少隐私,这对公司非常有用。”有些信息就是不那么敏感,比如宠物的名字和信用卡信息。有应用程序旨在微分隐私智能制造和数据挖掘,以及我们提出的方法适用于数据功能的显示了巨大的潜力,智能和可持续的生产。”
研究人员仔细地用噪音校正了一个模型,以获取具体的、更敏感的原始数据。经过策划、调控的噪声包含了一些数值,这些数值位于真实信息之间,从而在系统中制造干扰或随机性,从而模糊攻击者可能看到的内容。
小组使用测试数据来评估和验证提出的隐私保护数据挖掘框架。他们特别关注计算机数控(CNC)车削过程中的电力消耗建模。
根据团队,数控车削是一个精确的和复杂的制造过程中,旋转工件在地方举行,而刀具形状的材料。这类信息对于制造企业来说是至关重要的,因为在竞争激烈的市场中,这些信息可能适用于他们的特定产品。
“一个简单的例子是,一家拥有500名患者的医院,根据患者的基因型和人口背景训练出的数据挖掘模型来指导治疗,”工业工程博士生胡千宇(音)说。“如果系统外的人想知道病人的具体属性,比如他们的基因标记,他们就会攻击这个模型。在正常数据的情况下,不受噪声的保护,攻击者只要掌握一些背景信息,就可以获得患者基因组属性的知识。这些知识可以通过各种方式对他们产生不利的影响。在这个例子中,根据我们的模型,在数据挖掘过程中加入噪声,可以降低隐私泄露的风险。”
该团队指出,在他们未来的研究中,他们计划继续测试提出的数据挖掘框架到一个协作制造商网络。