这篇文档属于类型a,是一篇关于异构多核平台上混合关键性任务的能量感知容错映射的原创研究论文。以下是详细的学术报告:
本文由Amir Hassan Safizadeh、Sepideh Safari、Shayan Shokri和Shaahin Hessabi(IEEE会员)共同完成,作者单位包括伊朗Sharif University of Technology的计算机工程系和伊朗基础科学研究院(IPM)的计算机科学学院。论文发表于IEEE Transactions on Sustainable Computing,2025年7月/8月刊,第10卷第4期,DOI编号为10.1109/TSUSC.2025.3532766。
研究领域为实时嵌入式系统和混合关键性系统(Mixed-Criticality Systems, MCS),重点关注异构多核平台上的任务调度、容错技术和能量管理。混合关键性系统需在同一平台上运行不同安全等级的任务(如航空电子系统中的A级和C级任务),但传统时间冗余容错技术(如任务重新执行)可能因时间需求差异而无法满足高关键性任务的截止时间要求。此外,检查点(checkpointing)技术虽能减少恢复时间,却会引入显著的能耗开销。动态电压频率调节(Dynamic Voltage and Frequency Scaling, DVFS)虽可降低能耗,但可能导致高关键性任务错过截止时间。
本文提出一种异构多核平台上的能量感知检查点方案,旨在:
1. 通过检查点回滚恢复(rollback recovery)保障任务可靠性;
2. 利用DVFS降低检查点能耗;
3. 设计任务映射算法以优化调度性和能耗。
研究对象:异构多核平台(如ARM big.Little架构),包含不同性能核心的“岛”(island),每个岛内核心同构,岛间异构。任务模型为混合关键性任务集,包含高关键性(HC)和低关键性(LC)任务,每个任务参数包括周期、截止时间、关键性等级及不同核心上的最坏执行时间(WCET)。
关键步骤:
- 检查点间隔计算:根据任务WCET、容错需求(k值)和检查点开销,计算不同操作模式(正常模式、故障模式、超限模式、关键模式)下的最优检查点数量和间隔。
- 容错需求分析:基于泊松分布和可靠性目标(如DO-178C标准),推导每个任务在不同核心和频率下的容错次数k。
方法:提出基于需求边界函数(Demand-Bound Function, DBF)的调度性测试,扩展Ekberg与Yi(EY)算法以支持检查点技术。
- DBF计算:针对每种操作模式(如正常模式到故障模式切换)分别计算任务的时间需求,包括检查点开销和回滚恢复时间。
- 悲观性优化:考虑任务切换时的非均匀检查点间隔,避免过度悲观的时间预算分配。
算法设计:提出CHEF(Checkpoint Efficiency Factor)算法,核心思想为:
- 评估指标:结合核心剩余利用率和任务能耗(包括检查点存储能耗),选择能耗最低且调度性最优的核心。
- 任务分配:优先分配高关键性任务,再分配低关键性任务,采用启发式方法平衡能耗与调度性。
策略:在正常模式下动态调节核心频率以降低能耗,同时在故障/超限模式下切换至最高频率以保障截止时间。
适用于航空电子、工业控制等安全关键领域,为多核实时系统的可靠性与能效设计提供实践指导。
(报告总字数:约1500字)