分享自:

隐私保护特征检索的私有集合交集协议研究

期刊:IEEE Transactions on Information Forensics and SecurityDOI:10.1109/TIFS.2023.3343973

类型a:这篇文档报告了一项原创研究,以下为学术报告:

主要作者与机构及发表期刊信息
本研究的主要作者包括Guowei Ling、Fei Tang、Chaochao Cai、Jinyong Shan、Haiyang Xue、Wulu Li、Xinyi Huang(IEEE会员)以及Weidong Qiu(IEEE会员)。他们分别来自上海交通大学网络安全与工程学院、重庆邮电大学计算机科学与技术学院、Sudo科技公司、香港理工大学计算系、中国建设银行金融科技公司,以及香港科技大学(广州)。该研究于2023年12月18日被接收,并于2024年1月5日正式发表在《IEEE Transactions on Information Forensics and Security》第19卷。

学术背景
本研究属于信息安全与隐私保护领域,特别是多方安全计算(MPC, Multi-Party Computation)中的私有集合交集(PSI, Private Set Intersection)协议。随着数据隐私保护法规(如GDPR和CCPA)的实施,企业在进行数据分析时必须确保用户隐私不被泄露。然而,在实际应用中,企业往往需要根据特定条件筛选数据,例如银行希望找到符合条件的信用用户,但又不愿向第三方透露筛选条件。现有的PSI协议虽然能够安全地计算交集,但无法满足这一需求。因此,本研究提出了隐私保护特征检索私有集合交集(P2FRPSI, Privacy-Preserving Feature Retrieved Private Set Intersection)的概念,旨在解决上述问题。

详细研究流程
本研究包含以下几个关键步骤:

  1. 定义P2FRPSI协议
    首先,研究者形式化定义了P2FRPSI协议的功能和安全性要求。客户端可以选择一个谓词(predicate),并仅获取满足该谓词的交集结果,而无需泄露谓词本身或额外数据。研究还详细说明了输入、输出和协议的安全性目标。

  2. 设计新的两方计算协议(S3R)
    为了实现P2FRPSI协议的安全性要求,研究者提出了一种名为“安全秘密共享检索”(S3R, Secure Secret Shared Retrieval)的新协议。S3R的核心在于通过加法秘密共享(Additive Secret Sharing)和同态加密(AHE, Additively Homomorphic Encryption)等技术,使服务器能够在不知道谓词的情况下判断其数据是否满足客户端的条件。S3R协议分为四个子协议:

    • 安全比较协议(SC, Secure Comparison):用于比较客户端提供的检索值与服务器的数据特征值。
    • 多项式变换协议(P2T, Predicate Transformation):将比较结果转换为布尔值,以判断是否满足谓词。
    • 维度间乘法协议(IM, Interdimensional Multiplication):将多个特征维度的结果综合为单个记录的判断结果。
    • 私有相等测试协议(PEQT, Private Equality Test):最终生成交集结果的掩码。
  3. 基于DH和OT的P2FRPSI协议实现
    研究者分别设计了基于Diffie-Hellman(DH)和基于Oblivious Transfer(OT)的两种P2FRPSI协议。DH协议易于实现且通信成本低,而OT协议则具有更高的计算效率。这两种协议均利用了S3R协议作为核心组件,并结合布谷鸟哈希(Cuckoo Hashing)和批处理相关密钥不经意伪随机函数(BARK-OPRF)等技术来优化性能。

主要研究结果
1. S3R协议的有效性
实验表明,S3R协议能够在半诚实模型下安全运行,并实现了高效率。对于输入规模为2^20的情况,S3R协议的完成时间不到1秒,通信量约为120MB。

  1. DH和OT协议的性能对比

    • DH协议在单线程下每小时可处理约2200K至2500K条数据,使用四线程时可达7000K条数据。例如,当输入规模为2^10时,使用四线程仅需0.83秒即可完成匹配。
    • OT协议在单线程下每小时可处理约1000K条数据,完成时间为3.8秒。此外,OT协议还隐藏了交集基数(cardinality),进一步增强了隐私保护。
  2. 与现有PSI协议的对比
    与经典的KKRT16、CM20和RS21等PSI协议相比,本研究提出的P2FRPSI协议虽然在通信开销上略高,但在功能上实现了谓词保护和特征值隐私保护,这是现有PSI协议所不具备的。

研究结论及其意义
本研究提出了一种全新的P2FRPSI协议,解决了现有PSI协议无法同时保护谓词和特征值隐私的问题。该协议在金融、医疗等领域具有重要的应用价值。例如,银行可以通过P2FRPSI协议从信用局获取符合条件的用户,而无需透露筛选条件;金融机构可以与数据源公司合作训练机器学习模型,同时保护双方的商业意图。此外,该研究还为隐私保护计算提供了新的思路和技术手段。

研究亮点
1. 提出了P2FRPSI协议的概念,并首次形式化定义了其功能和安全性要求。
2. 设计了S3R协议,这是一种通用性强、独立价值高的两方计算协议。
3. 实现了基于DH和OT的两种高效P2FRPSI协议,其中OT协议还隐藏了交集基数。
4. 在实验中展示了协议的高效性和实用性,为实际部署提供了有力支持。

其他有价值内容
研究者指出,尽管高效的VOLE协议在理论上可能进一步提升P2FRPSI协议的性能,但由于其安全性仍需验证,本研究未深入探讨这一方向。未来的研究可以探索更高效的密码学工具,以进一步优化P2FRPSI协议的性能和安全性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com