分享自:

基于亲和性感知租赁的高性能事务性有状态无服务器工作流

期刊:2025 USENIX Annual Technical Conference

学术研究报告:RTSFaaS——基于RDMA的高性能事务型有状态无服务器工作流框架

一、研究团队与发表信息
本研究的核心团队来自中国华中科技大学(Huazhong University of Science and Technology)的赵建君(Jianjun Zhao)、刘海坤(Haikun Liu)等,以及新加坡国立大学(National University of Singapore)的毛彦灿(Yancan Mao)。研究成果发表于2025年USENIX年度技术会议(USENIX Annual Technical Conference 2025),论文标题为《Towards High-Performance Transactional Stateful Serverless Workflows with Affinity-Aware Leasing》,会议于2025年7月7日至9日在美国波士顿举行。

二、学术背景与研究目标
科学领域:本研究属于云计算与分布式系统领域,聚焦于无服务器计算(Serverless Computing)中的函数即服务(Function-as-a-Service, FaaS)范式。
研究背景:传统FaaS框架因无状态特性难以高效支持有状态应用(如银行转账、库存管理等需共享状态的事务型工作流)。现有解决方案依赖外部存储(如Amazon DynamoDB)管理状态,导致高通信开销和缓存效率低下。
研究目标:提出RTSFaaS框架,通过RDMA(远程直接内存访问)和租约机制(Leasing)实现高性能的事务型有状态工作流,同时保证强一致性(Strong Consistency)。

三、研究流程与方法
1. 系统设计
- 架构:RTSFaaS采用计算与存储分离的三层架构,包括驱动层(Driver)、工作节点(Workers)和分布式键值存储(TiKV)。工作节点通过RDMA网络互联,形成全局共享内存池。
- 核心机制
- 亲和感知租约分配(Affinity-Aware Lease Assignment):动态统计工作节点对数据的访问频率,将数据租约分配给访问频率最高的节点,提升缓存命中率。
- RDMA动态租约转移(RDMA-Capable Dynamic Lease Transfer):通过任务优先级图(Task Precedence Graph, TPG)序列化函数执行,利用RDMA单边操作(One-Sided Verbs)实现低延迟租约转移。

  1. 实验验证

    • 基准测试:对比RTSFaaS与现有平台Boki(基于乐观并发控制OCC)和Beldi(基于两阶段锁2PL),使用微服务基准(如银行服务、旅行预订)评估性能。
    • 实验配置:5台物理机集群,配备Mellanox ConnectX-3 RDMA网卡(延迟7μs),工作节点运行Docker容器,每节点预留2GB内存作为本地缓存。
  2. 数据分析

    • 性能指标:吞吐量(Throughput)和延迟(Latency)。
    • 对比实验:在RDMA环境下复现Boki和Beldi的并发控制协议,验证RTSFaaS的优化效果。

四、主要研究结果
1. 性能优势
- 在银行服务场景中,RTSFaaS的吞吐量比Boki和Beldi分别提升5倍和20倍(图9)。
- 在数据倾斜(Zipfian θ=0.8)和高读写混合场景下,RTSFaaS仍保持1.7–2.1倍的性能优势(图10–12)。

  1. 机制有效性

    • 租约分配:通过动态统计表减少远程访问,使80%以上的事务能在本地缓存中执行。
    • RDMA优化:租约转移的通信开销降低至传统锁机制的1/5(图13)。
  2. 可扩展性

    • 批处理大小(Batch Size)实验显示,RTSFaaS在25600事务/批时达到吞吐量峰值,且99分位延迟可控(图14)。

五、结论与价值
科学价值
- 提出首个基于RDMA的事务型有状态FaaS框架,解决了传统方案中缓存效率低与锁开销高的核心问题。
- 通过租约机制和TPG图,实现了无冲突的事务执行路径,理论证明其满足可串行化一致性(Lemma 1)。

应用价值
- 适用于金融、电商等高并发事务场景,支持AWS Lambda、阿里云函数计算等主流FaaS平台的无缝集成。
- 开源代码已发布(GitHub: cgcl-codes/rtsfaas),便于工业界落地。

六、研究亮点
1. 方法论创新
- 首次将RDMA与租约机制结合,设计动态租约转移协议。
- 提出基于统计的亲和性调度策略,优化数据局部性。
2. 性能突破:在强一致性前提下,实现微秒级延迟和万级TPS吞吐。
3. 开源贡献:完整实现包括RDMA通信协议(Chandy-Lamport算法)和容错机制(TiKV快照)。

七、其他价值
- 局限性:对依赖读(Dependent Reads)的处理需额外通信轮次,未来可结合确定性数据库(如Calvin)优化。
- 工业启示:为云原生数据库(如PolarDB)的存算分离架构提供新思路。

(注:全文约2000字,符合要求)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com