分享自:

大数据处理的硬件/软件自适应加密加速研究

期刊:Hindawi Security and Communication NetworksDOI:10.1155/2018/7631342

本文档属于类型a(单篇原创研究论文),以下是针对该研究的学术报告:


硬件/软件自适应的密码学加速系统在大数据处理中的应用研究

作者及单位
Chunhua Xiao(肖春华)¹², Lei Zhang(张磊)¹, Yuhua Xie(谢雨华)¹, Weichen Liu(刘伟宸)¹², Duo Liu(刘铎)¹²
1. 重庆大学计算机科学系(Department of Computer Science, Chongqing University)
2. 教育部信息物理社会可信服务计算重点实验室(Key Laboratory of Dependable Service Computing in Cyber Physical Society)
发表信息
期刊:*Security and Communication Networks*(Hindawi出版社)
时间:2018年8月27日
DOI:10.1155/2018/7631342


学术背景

研究领域
本研究属于网络安全与高性能计算交叉领域,聚焦于大数据环境下HTTPS访问的加密加速问题。

研究动机
随着大数据时代的到来,网络数据传输量爆炸式增长,电子商务、在线银行等场景对安全传输的需求日益迫切。SSL/TLS协议是当前主流的加密解决方案,但其核心加密操作(如对称密钥算法)计算密集,纯软件实现(如OpenSSL库)难以满足高并发、低延迟的需求。尽管已有硬件加速器(如AES-NI指令集或专用加密芯片)的研究,但现有工作多集中于硬件设计本身,缺乏对硬件与CPU协同调度的优化,导致资源利用率不足。

研究目标
提出一种自适应加密系统ACSA(Adaptive Crypto System based on Accelerators),通过软硬件协同设计实现动态加密模式选择,结合数据聚合、中断优化和资源分配策略,最大化加密带宽并降低CPU开销。


研究流程与方法

1. 系统架构设计

研究对象
- 硬件平台:基于ARM Cortex-A57的服务器(16核)、10个硬件加密加速器(HACs),支持AES-CBC、3DES等算法。
- 软件栈:Nginx Web服务器、OpenSSL-1.0.2j、Linux内核扩展模块(Cryptodev、HAC驱动)。

关键设计
- 分层架构:分为同步层(Web服务)与异步层(硬件加速),通过同步/异步通信层交互。
- 动态中断聚合:通过阈值控制中断频率,减少高并发下的上下文切换开销(公式:C_interrupt = 2C_cs + C_irq)。
- 故障检测模块:硬件失效时无缝切换至软件加密。

2. 自适应调度算法

核心方法
- 请求过滤:根据数据块大小选择加密模式(阈值设为16KB,基于AES-128-CBC的耗时对比实验)。
- 数据聚合:将多个小数据块合并为单一请求,减少硬件调用次数(如256KB数据从8次调用降至1次)。
- MM算法(Maximize Utilization with Minimal Overhead):动态分配CPU与加速器资源,优化整体吞吐量。

实验验证
- OpenSSL基准测试:对比纯软件(SW)、AES-NI(SW-NI)、纯硬件(HW)及ACSA的性能。
- 端到端测试:40Gbps网络环境下模拟高并发HTTPS请求,测量RPS(每秒请求数)和CPU空闲率。


主要结果

1. 加密性能提升

  • 3DES算法(无AES-NI支持):硬件加速比纯软件快12倍(带宽从271 MB/s提升至3.7 GB/s)。
  • AES算法
    • 相比纯硬件加密,ACSA提升52.39%带宽(16KB数据块)。
    • 相比AES-NI,ACSA在256KB数据块下仍有20.11%优势(见图16)。

2. 资源优化

  • CPU占用率:通过MM策略,ACSA可释放21.67%~23.83%的CPU资源(见图21)。
  • 中断开销:动态聚合使中断频率降低至1/n,系统开销减少(公式:C2 = 2C_cs + n×C_irq)。

3. 端到端测试

  • ECDHE-RSA-AES256-SHA384:在512KB页面下,ACSA的RPS比AES-NI高20.11%(图23)。
  • ECDHE-RSA-DES-CBC3-SHA:硬件加速使RPS提升60%~112%,同时保持13%~89% CPU空闲(图26)。

结论与价值

科学价值
1. 首个软硬件协同的自适应加密系统:ACSA动态调度加密模式,解决了传统方案中硬件调用成本高的问题。
2. 通用设计方法论:MM算法和中断优化策略可推广至其他异构加速架构(如FPGA、ASIC)。

应用价值
- 大数据中心:适用于高并发HTTPS服务,如云计算、金融交易。
- 能效优化:基于ARM的架构为数据中心提供x86之外的能效解决方案。


研究亮点

  1. 创新性方法
    • 动态中断聚合:通过阈值调整平衡延迟与开销。
    • 数据聚合策略:将OpenSSL的粒度从16KB扩展至n×16KB,减少硬件调用次数。
  2. 全面验证:覆盖算法级(OpenSSL)和系统级(40Gbps网络)测试,数据详实。
  3. 跨平台潜力:方法不依赖特定CPU或加速器类型,支持ARM与x86架构。

其他补充

  • 局限性:客户端解密可能成为瓶颈(如3DES端到端测试中仅2倍提升)。
  • 未来方向:探索异构数据中心下的能效优化,如结合GPU或量子加密硬件。

(全文约2400字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com