分享自:

大数据处理的硬件/软件自适应加密加速研究

期刊:Hindawi Security and Communication NetworksDOI:10.1155/2018/7631342

基于硬件/软件协同设计的自适应加密加速系统在大数据处理中的应用研究

作者及机构
本研究的核心作者团队来自重庆大学计算机科学系(Department of Computer Science, Chongqing University)和教育部信息物理社会可信服务计算重点实验室(Key Laboratory of Dependable Service Computing in Cyber Physical Society of Ministry of Education),包括Chunhua Xiao、Lei Zhang、Yuhua Xie、Weichen Liu和Duo Liu。研究成果于2018年8月27日发表在开放获取期刊《Security and Communication Networks》(卷2018,文章ID 7631342,共24页),遵循知识共享许可协议(Creative Commons Attribution License)。


学术背景与研究目标
随着大数据时代的到来,网络数据量呈爆炸式增长,电子商务和网络银行等敏感信息传输对安全性提出了更高要求。SSL/TLS协议作为主流安全解决方案,其核心加密功能(如对称密钥密码)计算密集,传统软件实现(如OpenSSL库)难以满足高速安全连接的需求。尽管硬件加速器能提升加密效率,但现有研究多聚焦专用硬件设计,缺乏对硬件资源高效调度的探索。此外,英特尔AES-NI(Advanced Encryption Standard New Instructions)指令集的普及使得软件加密性能接近硬件加速水平,但两者协同优化的潜力尚未充分挖掘。

本研究提出了一种基于加速器的自适应加密系统(Adaptive Crypto System based on Accelerators, ACSA),通过硬件/软件协同设计实现动态加密模式切换,旨在解决以下问题:
1. 如何降低硬件加速器的调用开销(如中断和上下文切换);
2. 如何根据请求特征和系统负载自适应分配加密任务;
3. 如何在大数据高并发场景下最大化资源利用率。


研究流程与方法
1. 系统架构设计
- ACSA框架:采用半同步/半异步(half-sync/half-async)模式,分为同步层(处理客户端请求)和异步层(硬件加速加密)。通过同步/异步通信层连接两者,支持动态中断聚合和数据聚合优化。
- 硬件平台:基于16核ARM Cortex-A57服务器和10个硬件加速组件(HACs),支持AES-CBC、3DES等算法,通过处理队列(PQ)实现任务调度。

  1. 关键技术开发

    • 动态中断聚合:通过设置中断阈值和超时机制,将多次加密任务的中断合并为单次通知,减少上下文切换开销。实验显示,中断频率降低后,系统开销从(C1 = n \times (2C{cs} + C_{irq}))降至(C2 = 2C{cs} + n \times C_{irq})。
    • 请求过滤与数据聚合:根据数据块大小选择加密模式(AES-NI或硬件加速)。例如,AES-256-CBC的阈值设为16 KB,大于此值的数据通过硬件加密,并通过聚合多个16 KB数据块减少调用次数。
  2. 资源分配策略(MM算法)

    • 目标:在16核ARM服务器上,通过最大化资源利用率与最小化管理开销(Maximize utilization with Minimal overhead, MM),动态分配CPU和加速器资源。
    • 流程
      • 测试不同CPU数量下软件加密(AES-NI)和硬件加密的带宽;
      • 计算性能差异(P{ij} = HP{ij} - SP_i),确定最优CPU和进程分配。例如,AES-256-CBC测试中,13个进程用于硬件加密,19个用于软件加密,总带宽提升44.58%。
  3. 实验验证

    • OpenSSL性能测试:对比软件加密(SW)、AES-NI(SW-NI)、纯硬件加密(HW)和协同设计(HW-SW)的带宽。结果显示,HW-SW在AES-256-CBC中比SW-NI提升20.11%,在3DES-CBC中比纯软件快12倍。
    • 端到端测试:通过40 Gbps网络模拟高并发场景,使用Nginx和Apache Benchmark(ab)评估HTTPS服务性能。例如,512 KB页面的请求处理速度(RPS)提升20.11%,同时释放15%-23%的CPU资源。

主要结果与结论
1. 性能提升
- AES-256-CBC:HW-SW模式比纯硬件加密带宽提升52.39%,比AES-NI提升20.07%。
- 3DES-CBC:硬件加速使带宽达3.7 GB/s,较软件加密提升12倍。

  1. 资源优化

    • MM算法可动态调整CPU占用率,例如在低负载时释放21.67%的CPU资源,高负载时优先保障加密性能。
  2. 系统可靠性

    • 故障检测模块确保硬件失效时无缝切换至软件加密,保障服务连续性。

科学价值与应用意义
1. 方法论创新:首次提出硬件/软件协同的自适应加密框架,为异构计算平台资源调度提供通用设计范式。
2. 工程实践:在ARM服务器上的实现验证了其在大数据中心的适用性,为能效优化提供新思路。
3. 行业影响:适用于金融、医疗等高安全需求领域,支持高性能HTTPS服务部署。


研究亮点
1. 动态适应性:ACSA能根据数据块大小和系统负载实时切换加密模式,平衡性能与开销。
2. 中断优化:提出的动态中断聚合技术降低高并发下的系统开销,理论分析显示开销减少与中断次数成反比。
3. 跨平台兼容性:设计方法不依赖特定CPU或加速器类型,可扩展至x86等其他架构。

其他价值
- 提出的MM算法和ACSA设计流程可推广至其他安全协议加速场景,如IPSec或物联网嵌入式系统。
- 开源实现(如修改的OpenSSL和Nginx配置)为后续研究提供可复现的基础。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com