基于状态-动作模型的中继卫星操作规划问题建模

分享自：
基于状态-动作模型的中继卫星操作规划问题建模

工程学
信息科学
航空航天工程
人工智能
自动化
期刊:系统工程与电子技术DOI:10.3969/j.issn.1001-506x.2010.05.026
【点击此处】阅读全文、收藏及针对性提问
本文由国防科学技术大学机电工程与自动化学院的程思微、张辉、沈林成、吴冰合作完成，发表于《系统工程与电子技术》2010年5月第32卷第5期。该论文的研究主题为“基于状态-动作模型的中继卫星操作规划问题建模”，旨在针对跟踪与数据中继卫星（Tracking and Data Relay Satellite, TDRS）操作指令自动生成的复杂规划问题，提出一种新型的、具有更强描述能力的建模方法，并引入领域知识以提高问题求解效率。
中继卫星系统是现代航天测控与通信网络的核心组成部分，为各类在轨航天器提供关键的测控与数据中继服务。其操作规划问题，特别是操作指令的自动生成，是一个融合了经典人工智能规划与实时调度要素的复杂问题。它涉及卫星平台、多副天线、电源、存储器等多种资源，并受到严格的时序、持续时间和数值资源约束。传统的规划建模方法（如经典的STRIPS模型）在表达这些复杂、连续的约束方面存在明显不足，难以直接应用于中继卫星这类实际工程问题。同时，该问题搜索空间巨大，直接求解效率低下。因此，开发一种能够精确描述领域约束并能高效求解的建模方法，对于实现中继卫星自动化、智能化运行管理具有重要的理论意义和实际应用价值。本研究的目标即在于此：提出并构建一个基于状态-动作模型的中继卫星操作规划模型，并利用领域知识设计层次任务分解策略，以降低问题求解复杂度。
本研究的工作流程主要包含两个核心部分：一是新型规划建模方法的提出与模型构建；二是基于领域知识的求解策略设计。研究并未涉及传统的实验对象或样本，其“研究对象”是抽象的规划问题本身及其中包含的动作、状态和约束。研究过程侧重于模型的描述、定义与验证。
首先，在建模方法部分，作者深入分析了中继卫星操作规划的特点，借鉴了经典规划表示中的状态-事件模型、分层任务网络模型和活动模型的思想，提出了一种“基于状态-动作模型”的建模方法。该方法以国际规划竞赛的标准语言——规划领域定义语言（Planning Domain Definition Language, PDDL）作为描述工具。研究的关键步骤在于如何利用PDDL及其扩展特性来描述中继卫星领域特有的复杂约束。作者详细阐述了三种关键约束的表达方案：第一，针对动作的持续时间约束，采用了PDDL 2.1中引入的“持续动作”（durative-action）描述格式，通过“:duration”字段来定义动作的执行时间，该时间可以是静态常数，也可以是依赖于参数的函数计算结果（如天线转向时间）。第二，针对资源的数值约束（如电源容量、存储器空间），通过定义数值函数（如(power_capacity ?s)）并在动作的前提条件（:precondition）和效果（:effect）中添加数值比较与增减算子来实现。例如，在执行一个耗电动作前，需检查当前电源容量是否大于所需值；动作执行后，需减少可用电源容量并增加已消耗电量。第三，针对一类特殊的、确定性的外部事件约束（如必须在地面站可见时间窗口内进行数据传输），采用了“时间初始文字”（timed initial literals）的方法，在问题文件的初始状态中直接声明特定时间点的事件发生状态，从而框定了动作可执行的时间范围。
基于上述建模方法，作者构建了具体的中继卫星操作规划模型。该模型基于一系列合理假设，例如考虑星上电源和存储器约束、动作具有持续时间、通信链路无中断等。模型的核心要素包括：1. 动作模型：定义了10个基本动作，如星际链路天线转向瞄准（turn-point）、捕获跟踪（acquire-track）、数据接收/发送（isls_receive_data, sgls_send_data等）、天线开关（antenna_on/off）等。每个动作均以扩展的PDDL持续动作格式进行精确定义，包含了参数、持续时间、前提条件和效果。论文以“turn-point”和“acquire-track”两个动作为例，展示了其完整的PDDL描述代码，其中包含了持续时间函数、电源消耗计算等细节。2. 状态变量：定义了16个描述卫星系统状态的谓词，如(isls_antenna_avail)、(pointing-at ?tdrs ?us)、(acquire-tracking ?isls_a)等，用于表征天线可用性、瞄准状态、跟踪状态、数据持有状态等。这些状态变量在动作的前提和效果中被引用和改变，构成了规划问题的状态空间。
其次，在求解策略部分，为了应对规划问题搜索空间巨大的挑战，作者没有专注于设计新的搜索算法，而是从模型和领域知识本身出发，提出了一种“基于领域知识的层次任务分解策略”。该策略源于对中继卫星工作模式的深入分析。中继卫星的基本任务可分为前向链路（地面站->中继星->用户星）和返向链路（用户星->中继星->地面站）两大类，每类链路又可进一步分解为数据接收和数据发送子任务。基于此，作者将顶层的中继卫星任务（tdrs_task）逐层分解为前向/返向链路任务，以及更细粒度的数据接收/发送任务。关键创新在于，为每一类子任务预先定义了其“可选动作集合”。例如，一个“前向链路数据发送任务”只可能涉及“星地链路天线开启”、“星地链路数据发送”、“星地链路天线关闭”等少数几个动作，而与其他无关动作（如星际链路天线转向）隔离。通过这种分解，在求解具体子任务时，规划器的搜索空间从全局的10个动作大幅缩减到子任务相关的5个或更少动作。假设规划解的长度为L，则计算复杂度从O(10^L)降低到O(5^L)，显著提高了求解效率。
为了验证所建模型的有效性和描述能力，论文提供了一个简单的模型示例。该示例系统包含一颗中继卫星（配备收、发天线各一副）、一颗用户卫星和一个地面站。任务要求是在用户星与中继星可见的时间窗口内，中继星接收用户星的图像数据并实时转发至地面站。作者根据所建立的PDDL领域模型和具体问题实例（定义了初始状态、资源数量、时间窗口等），生成了对应的规划解。结果显示，规划器成功输出了一个无冲突的、满足所有时序和资源约束的操作序列（规划方案）。该方案详细列出了每个动作的开始时间，例如在321.0秒开启星际链路天线，323.0秒执行转向瞄准，328.0秒开始捕获跟踪，335.0秒开始接收数据等，并在任务结束后关闭天线。这个示例虽然简单，但完整地演示了模型如何同时处理持续时间约束（动作耗时）、数值资源约束（电源、存储器消耗）和外部时间窗口约束，证明了所提建模方法能够满足中继卫星操作规划问题的基本描述要求。
本研究的主要结论是，提出的基于状态-动作模型并采用PDDL语言描述的建模方法，相较于传统规划建模方法，在描述能力上具有显著优势，能够有效表达中继卫星操作规划中动作的持续时间、复杂资源数值以及确定性外部事件等关键约束。同时，结合基于工作模式的层次任务分解策略，能够有效利用领域知识缩减问题求解的搜索空间，为提高规划效率提供了一条有效途径。该建模方法不仅适用于中继卫星，其机理也具有通用性，可扩展应用于其他具有类似复杂约束的航天器操作规划问题建模。
本研究的亮点和价值主要体现在以下几个方面：第一，方法创新性：将适用于经典人工智能规划的标准PDDL语言，创造性地应用于航天工程中的中继卫星操作规划这一复杂时序-资源规划问题，并系统性地解决了三类实际工程约束的表述难题，架起了人工智能理论方法与航天工程应用之间的桥梁。第二，模型描述能力强：明确指出了传统规划模型在持续时间、资源数量描述上的短板，并通过PDDL的持续动作、数值函数、时间初始文字等特性给予了完整解决方案，使模型更贴近工程实际。第三，求解策略的实用性：提出的层次任务分解策略并非复杂的算法，而是基于对领域工作模式的深刻理解，通过任务分类和动作集预筛选来“剪枝”搜索空间，思路清晰、易于实现，对处理大型、复杂规划问题具有启发意义。第四，成果的示范性与可扩展性：研究不仅给出了方法论，还构建了具体的中继卫星规划模型（包含10个动作、16个状态变量），并提供了验证示例，为后续研究提供了可参考的模板和基础。论文指出，后续工作将在此模型基础上，针对更复杂的任务场景进行仿真试验，进一步验证和拓展模型与方法的实用性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问