钟金成, 马浩宇, 龙明盛, 王建民
中国科学: 信息科学, 2024, 54(6): 1441-1457
摘要
飞机装配是飞机制造中的关键环节,如何对飞机装配脉动生产线进行合理调度,实现降本增效,是智能制造领域的重要科学问题.然而,飞机装配脉动生产线场景复杂,装配单架飞机就包含上万道工序,这为飞机装配调度问题的形式化建模和高效求解带来新的挑战,因而当前生产实践中主要依靠人类专家经验进行手工调度.本文聚焦降低人力负载的优化目标,提出两种领域特定的技术以解决飞机装配调度问题.首先,将飞机装配脉动生产线调度问题建模为两个马尔可夫(Markov)决策过程,通过双重强化学习智能体决策生成飞机装配的近似调度方案.其次,针对强化学习决策鲁棒性不足的缺陷,提出领域知识迁移方法,将强化学习的求解知识迁移到整数规划约束剪枝中,最后利用整数规划求解器优化得到综合性能优异的调度方案.在飞机装配生产线的真实数据上完成了实验验证,结果表明本文提出的基于深度强化学习和知识迁移的调度方法能够成功扩展到年产量近百架次的飞机装配脉动生产线调度问题,将组合优化方法难以求解的问题优化到分钟级求解,相较于基线方法取得显著性能优势.
关键词
飞机装配; 智能调度; 组合优化; 强化学习; 知识迁移; aircraft assembly; intelligent scheduling; combinatorial optimization; reinforcement learning; knowledge transfer
引用格式
钟金成, 马浩宇, 龙明盛, 等. 基于深度强化学习和知识迁移的飞机装配脉动生产线调度方法. 中国科学: 信息科学, 2024, 54(6): 1441-1457, doi: 10.1360/SSI-2023-0197
Jincheng ZHONG, Haoyu MA, Mingsheng LONG, et al. Scheduling approach for aircraft assembly pulsation production lines with deep reinforcement learning and knowledge transfer. Sci Sin Inform, 2024, 54(6): 1441-1457, doi: 10.1360/SSI-2023-0197
李弘扬, 李阳, 王晖杰, 曾嘉, 徐慧琳, 蔡品隆, 陈立, 严骏驰, 徐丰, 熊璐, 王井东, 朱福堂, 许春景, 汪天才, 夏飞, 穆北鹏, 彭志辉, 林达华, 乔宇
中国科学: 信息科学, 2024, 54(6): 1283-1318
摘要
随着自动驾驶技术的不断成熟与应用,系统性梳理开源自动驾驶数据集有利于产业生态良性循环.现有自动驾驶数据集可大致分为两代,第一代数据集的传感模态复杂度相对较低、数据集规模相对较小,且大多局限于感知级任务,以发布于2012年的KITTI为代表.相比于第一代数据集,第二代数据集的特征为传感模态复杂度较高、数据集规模与多样性较丰富、所设置任务从感知扩展到预测、规控上,以2019年前后提出的nu Scenes, Waymo为代表.本文联合学术界、产业界同仁,首次系统性梳理了国内外70余种开源自动驾驶数据集,对如何构建高质量数据集、数据在算法闭环体系中发挥的核心作用、如何利用生成式大模型规模化生产数据等进行了总结.此外,就未来第三代自动驾驶数据集应该具备的特质和数据规模,以及需要解决的科学与技术问题,进行了详细分析与讨论.希望本文的归纳与展望能促进新一代自动驾驶数据集与生态体系的建设、推动关键领域自主原创与科技自强的发展.
关键词
自动驾驶; 数据算法闭环; 基础模型; 数据集与挑战赛; autonomous driving; data pipeline; foundation model; dataset and challenge
引用格式
李弘扬, 李阳, 王晖杰, 等. 自动驾驶开源数据体系: 现状与未来. 中国科学: 信息科学, 2024, 54(6): 1283-1318, doi: 10.1360/SSI-2023-0313
Hongyang LI, Yang LI, Huijie WANG, et al. Open-sourced data ecosystem in autonomous driving: the present and future. Sci Sin Inform, 2024, 54(6): 1283-1318, doi: 10.1360/SSI-2023-0313
童小宝, 熊鹏文, 宋爱国, 刘小平
中国科学: 信息科学, 2024, 54(1): 191-209
摘要
非接触式传感器相比接触式触觉传感器可以避免与物体直接接触过程中产生的噪声,因而能够获取更有价值的原始数据表征物体内在属性;然而针对非接触式传感器感知的物体属性数据而言,现有算法难以实现单样本学习下的物体准确识别.为解决这一问题,本文提出一种新颖的单样本学习下时序约束稀疏表示方法 (one-shot learning with temporally constrained sparse representation, OSL-TCSR)用于识别5种不同材料下的50个物体类别.首先将两种原始数据(Lumini光谱和SCiO光谱)并行投影至共享子空间,并且使用聚类典型关联分析法(cluster canonical correlation analysis, C-CCA)计算两种原始数据的聚类相关性特征;其次通过稀疏表示分别计算得到聚类相关性特征数据以及原始数据的编码向量,并利用原始数据的编码向量对相关性特征数据的编码向量进行二次投影映射;然后将两次映射后的原始数据和相关性特征数据进行重构,以充分耦合化两种光谱数据,解决了单样本学习下的数据稀缺问题;进一步地,设计新颖的时序约束稀疏表示方法计算重构后的原始数据和相关性特征数据,以充分考虑每个光谱序列的时序特征;最后与最新的物体识别方法进行实验对比,结果表明提出的OSL-TCSR方法提高了单样本学习情况下的物体识别结果.此外, OSL-TCSR还可灵活迁移至多种应用场景,比如材料识别或纹理识别等.
关键词
物体识别; 聚类相关性特征; 单样本学习; 时序约束正则化; object recognition; clustering correlation characteristics; one-shot learning; temporally constrained regularization
引用格式
童小宝, 熊鹏文, 宋爱国, 等. 单样本学习下时序约束稀疏表示的物体识别方法. 中国科学: 信息科学, 2024, 54(1): 191-209, doi: 10.1360/SSI-2022-0256
Xiaobao TONG, Pengwen XIONG, Aiguo SONG, et al. Object recognition based on one-shot learning with temporally constrained sparse representation. Sci Sin Inform, 2024, 54(1): 191-209, doi: 10.1360/SSI-2022-0256
李亚飞, 高磊, 蒿宏杰, 靳远远, 王可, 徐明亮
中国科学: 信息科学, 2023, 53(12): 2493-2510
摘要
舰载机保障作业是航空母舰航空保障系统的重要组成部分,其调度效率不仅影响舰载机出动架次率,而且严重制约航空母舰作战效能发挥.在多舰载机保障的动态甲板作业环境下,安全高效地为舰载机分配保障资源,最大限度地减少舰载机因资源分配冲突产生的时间开销,是提高舰载机保障作业调度效率的关键途经.现有基于启发式、机器学习等方法舰载机保障作业调度策略,存在计算量大、鲁棒性差、训练效率低等问题.为此,本文将舰载机保障作业调度问题建模为分布式多智能体协同控制的顺序决策问题,构建了一种新颖的基于人机协同的多智能体作业调度决策框架HCMTPF(human-machine collaborative multi-agent task planning framework),有效地提高了保障作业调度决策模型的学习效率.在此基础上,提出了一种基于人类行为可信度的自适应作业分配方法,进一步提高了智能体自主探索能力和人类指导经验利用率.经大量仿真实验验证,本文提出的舰载机保障作业人机协同决策方法比其他方法在计算性能和学习效率方面具有明显优势.
关键词
舰载机; 人机协同; 深度强化学习; 任务分配; 资源分配; carrier aircraft; human-machine collaboration; deep reinforcement learning; task allocation; resource allocation
引用格式
李亚飞, 高磊, 蒿宏杰, 等. 舰载机保障作业人机协同决策方法. 中国科学: 信息科学, 2023, 53(12): 2493-2510, doi: 10.1360/SSI-2022-0403
Yafei LI, Lei GAO, Hongjie HAO, et al. Human-machine collaborative decision-making for carrier aircraft support operations. Sci Sin Inform, 2023, 53(12): 2493-2510, doi: 10.1360/SSI-2022-0403
郝建业, 邵坤, 李凯, 李栋, 毛航宇, 胡舒悦, 王震
中国科学: 信息科学, 2023, 53(10): 1892-1923
摘要
博弈智能是一个涵盖博弈论、人工智能等方向的交叉领域,重点研究个体或组织间的交互作用,以及如何通过对博弈关系的定量建模进而实现最优策略的精确求解,最终形成智能化决策和决策知识库.近年来,随着行为数据的海量爆发和博弈形式的多样化,博弈智能吸引了越来越多学者的研究兴趣,并在现实生活中得到广泛应用.本文围绕博弈智能这一研究领域,分别从3个方面进行了系统的调研、分析和总结.首先,回顾了博弈智能的相关背景,涵盖了单智能体马尔可夫(Markov)决策过程,基于博弈论的多智能体建模技术,以及强化学习、博弈学习等多智能体求解方案.其次,依照智能体之间的博弈关系不同,将博弈分为合作博弈、对抗博弈以及混合博弈这三大类范式,并分别介绍了每种博弈智能范式下的主要研究问题、主流研究方法以及当前典型应用.最后,总结了博弈智能的研究现状,以及亟待解决的主要问题与研究挑战,并展望了学术界和工业界的未来应用前景,为相关研究人员提供参考,进一步推动国家人工智能发展战略.
关键词
博弈智能; 博弈论; 人工智能; 多智能体系统; 强化学习; 均衡求解; game intelligence; game theory; artificial intelligence; multiagent systems; reinforcement learning; equilibrium computing
引用格式
郝建业, 邵坤, 李凯, 等. 博弈智能的研究与应用. 中国科学: 信息科学, 2023, 53(10): 1892-1923, doi: 10.1360/SSI-2023-0010
Jianye HAO, Kun SHAO, Kai LI, et al. Research and applications of game intelligence. Sci Sin Inform, 2023, 53(10): 1892-1923, doi: 10.1360/SSI-2023-0010
张倩倩, 赵云波, 吕文君, 陈谋
中国科学: 信息科学, 2023, 53(9): 1768-1783
摘要
共享控制存在于众多由人类智能和机器智能共同参与的序贯决策场景.由于人的决策范围和智能机器的决策范围尚未予以明确划分,需要加以实时仲裁从而达到人机共存并且共享决策权限.为此本文提出了一种仲裁优化方法,该方法的独特之处在于引入自主性边界概念,优化了共享控制中人机决策动作的仲裁机制.本文为自主性边界的计算和更新维护提供了思路,能够基于贝叶斯规则的意图推理分析人机共享系统可能要实现的目标,从而确定仲裁参数.此外,本文还分析了自主性边界的不确定性以促进边界信息对共享控制中决策质量的优化效果.实验结果表明,所提出的方法在累积奖励、成功率、撞击率方面表现出色,这些说明了本文提出的共享控制中的仲裁优化方法在求解人机序贯决策问题时的有效性和价值.
关键词
共享控制; 仲裁优化; 自主性边界; 人机序贯决策; 强化学习; shared control; arbitration optimization; autonomous boundary; human-machine sequential decision-making; reinforcement learning
引用格式
张倩倩, 赵云波, 吕文君, 等. 面向人机序贯决策实现共享控制下的仲裁优化. 中国科学: 信息科学, 2023, 53(9): 1768-1783, doi: 10.1360/SSI-2022-0295
Qianqian ZHANG, Yun-Bo ZHAO, Wenjun LV, et al. Shared control with optimized arbitration for human-machine sequential decision-making. Sci Sin Inform, 2023, 53(9): 1768-1783, doi: 10.1360/SSI-2022-0295
赵斐然, 游科友
中国科学: 信息科学, 2023, 53(6): 1027-1049
摘要
随着通信技术和新一代人工智能的迅速发展,强化学习这一数据驱动的控制方法引起了极大的关注.本文回顾了强化学习中的一类典型方法——策略优化法——在系统控制律设计上的最新研究进展.主要讨论了其在各种重要线性最优控制问题上的收敛性及样本复杂度,例如线性二次控制、输出反馈控制、■控制、分布式控制等.此外,对策略优化法在网络化系统控制中的应用作了展望.
关键词
线性系统; 最优控制; 策略梯度法; 强化学习; 数据驱动控制; linear system; optimal control; policy gradient method; reinforcement learning; data-driven control;
引用格式
赵斐然, 游科友. 数据驱动的策略优化控制律设计最新研究综述. 中国科学: 信息科学, 2023, 53(6): 1027-1049, doi: 10.1360/SSI-2022-0455
Feiran ZHAO, Keyou YOU. Survey of recent progress in data-driven policy optimization for controller design. Sci Sin Inform, 2023, 53(6): 1027-1049, doi: 10.1360/SSI-2022-0455
王龙, 陈芳, 陈星如
中国科学: 信息科学, 2023, 53(4): 623-646
摘要
在博弈论中,单个个体控制全部个体的收益通常被认为是不可能的.一个例外是20世纪末在重复囚徒困境中提出的均衡器策略:使用这种策略的个体可以将对手的收益设置为由收益函数所决定的某个区间内的任意值.十余年后发现的零行列式策略通过单方面设置个体收益的线性关系,将该结果一般化.在此基础上,关于博弈收益控制的研究取得了一系列成果.本文概述了博弈收益控制的研究现状;介绍了单次博弈和重复博弈中的收益控制技术;从收益控制的基本概念、能控制的收益关系、收益控制策略的形式和收益控制策略的演化特性等方面总结了博弈中收益控制的主要进展和成果;并讨论了博弈收益控制的未来发展趋势.
关键词
博弈论; 收益控制; 零行列式策略; 演化博弈论; 策略设计; game theory; payoff control; zero-determinant strategy; evolutionary game theory; strategy design;
引用格式
王龙, 陈芳, 陈星如. 博弈收益控制研究进展. 中国科学: 信息科学, 2023, 53(4): 623-646, doi: 10.1360/SSI-2022-0263
Long WANG, Fang CHEN, Xingru CHEN. Payoff control in game theory. Sci Sin Inform, 2023, 53(4): 623-646, doi: 10.1360/SSI-2022-0263
王尔申, 刘帆, 宏晨, 郭靖, 何宁, 赵琳, 薛健
中国科学: 信息科学, 2022, 52(12): 2254-2269
摘要
随着无人机智能化水平的提高和集群控制技术的发展,无人机集群对抗智能决策方法将成为未来无人机作战的关键技术.无人机集群对抗学习环境具有维度高、非线性、信息有缺失、动作空间连续等复杂特点.近年来,以深度学习和强化学习为代表的人工智能技术取得了很大突破,深度强化学习在解决复杂环境下智能决策问题方面展现出了不俗能力.本文受多智能体集中式训练–分布式执行框架和最大化策略熵思想的启发,提出一种基于非完全信息的多智能体柔性行动器–评判器(multi-agent soft actor-critic, MASAC)深度强化学习方法,建立基于多智能体深度强化学习的无人机集群对抗博弈模型,构建连续空间多无人机作战环境,对红蓝双方无人机集群的非对称性对抗进行仿真实验,实验结果表明MASAC优于现有流行的多智能体深度强化学习方法,能使博弈双方收敛到收益更高的博弈均衡点.进一步对MASAC的收敛情况进行实验和分析,结果显示MASAC具有良好的收敛性和稳定性,能够保证MASAC在无人机集群对抗智能决策方面的实用性.
关键词
深度强化学习; 多智能体; 对抗博弈; MASAC; 无人机集群; deep reinforcement learning; multi-agent; confrontation game; MASAC; UAV clusters;
引用格式
王尔申, 刘帆, 宏晨, 等. 基于MASAC的无人机集群对抗博弈方法. 中国科学: 信息科学, 2022, 52(12): 2254-2269, doi: 10.1360/SSI-2022-0303
Ershen WANG, Fan LIU, Chen HONG, et al. MASAC-based confrontation game method of UAV clusters. Sci Sin Inform, 2022, 52(12): 2254-2269, doi: 10.1360/SSI-2022-0303
李守义, 陈谋, 王玉惠, 吴庆宪, 贺建良
中国科学: 信息科学, 2022, 52(12): 2239-2253
摘要
在真实的空战对抗环境中,不确定性广泛存在.本文考虑人机对抗场景中的空战决策问题,提出了一种非完备策略集下的博弈决策方法.首先,将对抗的无人机群和有人机群的动态博弈过程分解为不同的决策阶段,并将当前的决策阶段建模为一个零和博弈模型.所建模型考虑了有人机群的策略不完全可知的情形,并用一个不确定效用矩阵来描述这种非完备策略.随后,基于矩阵博弈中的最大最小策略概念,提出了非完备策略下博弈模型的求解方法,从而给出了无人机群的决策序列.最后通过仿真实验验证了所提方法的有效性.
关键词
无人机; 空战决策; 人机对抗; 非完备策略集; 博弈论; 最大最小策略; unmanned air vehicle(UAV); air combat decision-making; human-computer gaming; incomplete strategy set; game theory; maximum-minimum strategy;
引用格式
李守义, 陈谋, 王玉惠, 等. 非完备策略集下人机对抗空战决策方法. 中国科学: 信息科学, 2022, 52(12): 2239-2253, doi: 10.1360/SSI-2022-0222
Shouyi LI, Mou CHEN, Yuhui WANG, et al. Human-computer gaming decision-making method in air combat under an incomplete strategy set. Sci Sin Inform, 2022, 52(12): 2239-2253, doi: 10.1360/SSI-2022-0222
王欢, 周旭, 邓亦敏, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2225-2238
摘要
在空战研究领域,战术决策旨在提高博弈对抗收益,进而提升战机攻击效率.现有战术决策算法大多基于规则方法设计,当应用于多机空战的复杂环境时则存在设计难度大,难以求解最优解等问题.本文提出一种分层决策多机空战对抗方法,首先,在训练初始阶段借鉴已有人类专家经验,指导模型训练;其次,根据战术动作类型设计分层动作决策网络,降低动作决策空间维度;最后,将训练产生的对抗经验按阶段分解,降低策略学习难度.在多机空战仿真环境中进行了实验验证,相比于现有多机空战决策方法,本文提出的方法在训练收敛性和决策性能方面均具有更好的表现.
关键词
多机空战; 动作决策网络; 博弈; 分层强化学习; 决策收益; multi-aircraft air combat; action decision-making network; game; hierarchical reinforcement learning; decision gain;
引用格式
王欢, 周旭, 邓亦敏, 等. 分层决策多机空战对抗方法. 中国科学: 信息科学, 2022, 52(12): 2225-2238, doi: 10.1360/SSI-2022-0185
Huan WANG, Xu ZHOU, Yimin DENG, et al. A hierarchical decision-making method for multi-aircraft air combat confrontation. Sci Sin Inform, 2022, 52(12): 2225-2238, doi: 10.1360/SSI-2022-0185
黄蕾, 朱进, 段福庆
中国科学: 信息科学, 2022, 52(12): 2178-2194
摘要
非完全信息下的人机对抗通常可以通过双人零和博弈模型加以描述,反事实后悔最小化(counterfactual regret minimization, CFR)是处理非完全信息双人零和博弈的一种流行算法.然而现有CFR及其变体算法在迭代过程中使用固定的后悔值计算和策略更新类型,在非完全信息扩展式博弈下表现各有优劣,泛化性能薄弱.针对这一问题,本文将强化学习近端策略优化(proximal policy optimization,PPO)算法与CFR算法相结合,提出一种PPO-CFR算法,通过训练出理性的智能体,从而实现CFR迭代过程后悔值计算和策略更新类型的自适应选择,以提高算法的泛化性能,并实现非完全信息扩展式博弈的策略优化.本文采用通用的扑克博弈实验验证所提算法,并制定逐步奖励函数训练智能体的动作策略,实验结果表明,与现有方法相比, PPO-CFR算法具有更好的泛化性能和更低的可利用度,迭代策略更为逼近纳什均衡策略.
关键词
非完全信息; 扩展式博弈; 反事实后悔最小化; 近端策略优化; 博弈决策; incomplete information; extensive game; counterfactual regret minimization; proximal policy optimization; game decision-making;
引用格式
黄蕾, 朱进, 段福庆. 非完全信息下基于PPO-CFR的扩展式博弈决策. 中国科学: 信息科学, 2022, 52(12): 2178-2194, doi: 10.1360/SSI-2022-0216
Lei HUANG, Jin ZHU, Fuqing DUAN. Extensive game decision based on the PPO-CFR algorithm under incomplete information. Sci Sin Inform, 2022, 52(12): 2178-2194, doi: 10.1360/SSI-2022-0216
游诗艺, 康宇, 赵云波, 张倩倩
中国科学: 信息科学, 2022, 52(12): 2165-2177
摘要
在人机共享自主中,人和智能机器以互补的能力共同完成实时控制任务,以实现双方单独控制无法达到的性能.现有的许多人机共享自主方法倾向于假设人的决策始终“有效”,即这些决策促进了任务的完成,且有效地反映了人类的真实意图.然而,在现实中,由于疲劳、分心等多种原因,人的决策会在一定程度上“无效”,不满足这些方法的基本假设,导致方法失效,进而导致任务失败.本文提出了一种新的基于深度强化学习的人机共享自主方法,使系统能够在人类决策长期无效的情况下完成正确的目标.具体来说,我们使用深度强化学习训练从系统状态和人类决策到决策价值的端到端映射,以显式判断人类决策是否无效.如果无效,机器将接管系统以获得更好的性能.我们将该方法应用于实时控制任务中,结果表明该方法能够及时、准确地判断人类决策的有效性,分配相应的控制权限,并最终提高了系统性能.
关键词
人机系统; 共享自主; 非全时有效决策; 深度强化学习; 仲裁; human-machine system; shared autonomy; non-full-time effective decision; deep reinforcement learning; arbitration;
引用格式
游诗艺, 康宇, 赵云波, 等. 非全时有效人类决策下的人机共享自主方法. 中国科学: 信息科学, 2022, 52(12): 2165-2177, doi: 10.1360/SSI-2022-0225
Shiyi YOU, Yu KANG, Yun-Bo ZHAO, et al. Human-machine shared autonomy approach for non-full-time effective human decisions. Sci Sin Inform, 2022, 52(12): 2165-2177, doi: 10.1360/SSI-2022-0225
黄煌, 李谋, 刘磊, 汤亮, 刘昊, 谢心如, 刘乃龙, 魏春岭, 邢琰, 姜甜甜, 胡海东, 常亚菲, 胡勇, 杨孟飞
中国科学: 信息科学, 2022, 52(11): 2093-2105
摘要
以卫星、飞船、深空探测器为代表的航天器是一类典型的无人系统,经历了从自动化到自主化的不断发展.为提升航天器对未知空间环境和复杂空间任务的适应能力和智能自主水平,以空间无人系统为研究对象设计了具有学习和推理能力的无人系统智能架构,给出架构的组成及功能;接着分析该架构中学习和推理能力的运作机制,并针对架构所需的动作库和知识库的构建、更新与扩展方法等关键技术提出解决方案;最后通过地外星表巡视采样任务示例,具体说明在该智能架构下的新知识生成、基于知识的推理和自主执行任务的过程,以及过程中知识库、环境、任务和动作库之间的交互关系.
关键词
学习和推理能力; 空间无人系统; 智能架构; 动作库; 知识库; learning and reasoning capabilities; space unmanned system; intelligent architecture; action library; knowledge library;
引用格式
黄煌, 李谋, 刘磊, 等. 具有学习和推理能力的空间无人系统智能架构. 中国科学: 信息科学, 2022, 52(11): 2093-2105, doi: 10.1360/SSI-2022-0036
Huang HUANG, Mou LI, Lei LIU, et al. Intelligent architecture of space unmanned system with learning and reasoning capabilities. Sci Sin Inform, 2022, 52(11): 2093-2105, doi: 10.1360/SSI-2022-0036
代学武, 程丽娟, 崔东亮, 俞胜平, 袁志明, 应志鹏
中国科学: 信息科学, 2022, 52(5): 890-906
摘要
随着我国高速铁路建设成网,行车密度不断提高,在出现突发事件导致列车晚点时,行车调度的复杂性和难度急剧增加,如何动态调整列车群运行,以减少晚点,提高准点率是运行调整的核心.本文提出了一种适用于突发事件下高速列车群运行调整的无模型强化学习方法.首先将多个列车在多个车站和闭塞区间的运行调整建模为受约束的资源占用和配置的多阶段序贯决策过程,提出了基于动态时空拓扑矩阵的车站和区间统一化建模方法.针对高铁列车群时空关联强的特点,首次提出了一种包含车辆位置、路网资源等时空分布信息的强化学习状态空间、动作空间和回报函数,构建了有效的奖励反馈机制.然后,针对高铁运行系统搜索空间巨大的难点,提出了启发式动作子空间自适应生成方法,利用部分显式静态约束构建启发式规则减少搜索空间,有效减少了无模型强化学习的试错次数,提高了求解效率,也保留了无模型通用性好的优点.最后,基于京广高铁实际案例的仿真分析表明,在发生不同时空范围的大风限速,导致多车延误的事件下,所提出的算法均能较好收敛,明显减少列车群内晚点传播,与MILP, ACO, FCFS方法相比,列车群的平均晚点时间可减少2%~20%.
关键词
强化学习; 时空拓扑矩阵; 列车运行调整; FCFS算法; 优化; reinforcement learning; spatio-temporal topology matrix; train rescheduling; FCFS algorithm; optimization;
引用格式
代学武, 程丽娟, 崔东亮, 等. 基于强化学习的高速列车群运行调整方法. 中国科学: 信息科学, 2022, 52(5): 890-906, doi: 10.1360/SSI-2021-0073
Xuewu DAI, Lijuan CHENG, Dongliang CUI, et al. Rescheduling of high-speed trains: a reinforcement learning approach. Sci Sin Inform, 2022, 52(5): 890-906, doi: 10.1360/SSI-2021-0073
王加根, 辛斌, 李冠呈
中国科学: 信息科学, 2024, 54(6): 1458-1473
摘要
火力与制导资源联合分配问题是军事运筹学研究中典型的NP完全问题,其求解具有较高的实时性要求.精确求解算法难以适用,而近来提出的构造算法的时间开销也相对较大,严重影响算法的实际应用.为了解决该问题,本文将其建模为多阶段传感器–武器–目标分配(sensor-weapon-target assignment, S-WTA)问题,并分解成两类作战资源分配子问题.在武器分配阶段采用了一种基于威胁值确定分配优先级的快速构造算法,在传感器分配阶段提出了一种新的基于阶段顺序确定分配优先级的快速构造算法,该算法能充分利用约束条件,大幅度减小时间开销.本文在两种基本构造算法与基于边际损失的构造算法的基础上进一步提出了构造算法序列化组合,对多阶段S-WTA问题进行求解.计算实验验证了新提出的基本构造算法的快速性以及构造算法序列化组合相比于各种基本构造算法的性能优势.
关键词
异构资源联合分配; 传感器 – 武器 – 目标分配; 启发式算法; 构造算法; 协同作战; heterogeneous resources co-allocation; sensor-weapon-target assignment; heuristic algorithms; constructive algorithms; cooperative engagement
引用格式
王加根, 辛斌, 李冠呈. 火力与制导资源联合分配的快速构造算法组合设计. 中国科学: 信息科学, 2024, 54(6): 1458-1473, doi: 10.1360/SSI-2023-0253
Jiagen WANG, Bin XIN, Guancheng LI. Combinatorial design of fast construction algorithms for joint allocation of firepower and guidance resources. Sci Sin Inform, 2024, 54(6): 1458-1473, doi: 10.1360/SSI-2023-0253
罗余, 王建波, 李平, 杜占玮, 许小可
中国科学: 信息科学, 2024, 54(4): 944-959
摘要
如何定量评估复杂网络中节点的影响力是一个重要的研究课题,因为它有助于深入理解网络的结构和功能.现有的多数方法主要基于网络固有拓扑的分析建立,缺少对多阶邻居节点的传播性质和拓扑信息的综合利用,然而它们对影响力节点识别有重要影响.为此,本文提出了一种综合多阶邻居传播度量和拓扑特征(multi-order neighbor propagation metrics and topological features, MNPMTF)的算法来有效识别复杂网络中的影响力节点.首先,该算法结合传播模型和最短路径来刻画邻居节点的传播概率,从而量化节点之间信息传播的可能性.其次,考虑多阶邻居中的邻居重叠比形成邻居重叠度,进而量化信息在邻居网络中的传播路径.再次,利用节点的k壳、h指数和聚类系数构成新指标KHC系数,以此来描述节点的拓扑特征.最后,算法综合3阶邻居范围内的传播概率、邻居重叠度和拓扑特征以评估节点的影响力.在9个真实网络上的大量实验表明,所提算法在排序准确性、有效性和区分能力等多方面均优于7种具有代表性的方法,为复杂网络中节点影响力评估提供了一种新的思路.
关键词
传播概率; 邻居重叠度; KHC系数; 影响力节点; 复杂网络; propagation probability; neighbor overlap; KHC coefficient; influential nodes; complex networks
引用格式
罗余, 王建波, 李平, 等. 基于多阶邻居传播度量和拓扑特征的高影响力节点识别. 中国科学: 信息科学, 2024, 54(4): 944-959, doi: 10.1360/SSI-2023-0201
Yu LUO, Jianbo WANG, Ping LI, et al. Identification of high-influential nodes based on multi-order neighbor propagation metrics and topological features. Sci Sin Inform, 2024, 54(4): 944-959, doi: 10.1360/SSI-2023-0201
周进, 李博, 陆君安, 史定华
中国科学: 信息科学, 2024, 54(3): 708-718
摘要
随着网络科学的发展,普通网络无法描述多个个体间的交互作用,这就有必要引入高阶网络.高阶网络能够刻画普通网络无法描述的网络特征,其中单纯形(2阶以上)扮演着关键角色.牵制控制具有“四两拨千斤”的作用,在高阶网络中只需牵制一部分单纯形就能达到同步.但如何选取合适的单纯形进行牵制控制,是一个充满挑战而又全新的课题.本文给出高阶网络达到同步的自适应牵制控制律,并提出如何选择合适的单纯形进行牵制,选择方式由高阶网络广义Laplacian矩阵次小特征值对应的单位特征向量分量决定.数值仿真结果表明该方法简单有效,牵制控制效果与单纯形选择方式一致.
关键词
复杂网络; 高阶网络; 牵制控制; 同步; 单纯形; complex networks; higher-order networks; pinning control; synchronization; simplexes
引用格式
周进, 李博, 陆君安, 等. 高阶网络牵制控制中单纯形的选择. 中国科学: 信息科学, 2024, 54(3): 708-718, doi: 10.1360/SSI-2023-0142
Jin ZHOU, Bo LI, Jun-An LU, et al. Selection of simplexes in pinning control of higher-order networks. Sci Sin Inform, 2024, 54(3): 708-718, doi: 10.1360/SSI-2023-0142
李志强, 李文鸽, 何秋锦, 宋金利, 杨俊起
中国科学: 信息科学, 2022, 52(7): 1302-1316
摘要
合作博弈中的参与人只将合作、不合作作为自己的策略,而双合作博弈是合作博弈的一般化,参与者以合作、不合作和弃权作为自己的策略,以获得自己所在的联盟利益的最大化,从而使自己的收益达到最优.与合作博弈一样,如何分配参与者联盟获得的总收益是双合作博弈的一个重要研究问题.本文利用矩阵半张量积工具,研究了双合作博弈的Shapley值计算问题.首先构造了双合作博弈的Shapley矩阵,然后将双合作博弈的Shapley值计算转化为双合作博弈的特征函数矩阵与Shapley矩阵乘积形式.本文得到的Shapley值矩阵计算公式形式简洁,不但简化了计算,而且为双合作博弈的研究提供了新的工具.
关键词
合作博弈; 双合作博弈; Shapley值; Shapley矩阵; 矩阵半张量积; cooperative game; bicooperative game; Shapley value; Shapley matrix; semi-tensor product of matrices;
引用格式
李志强, 李文鸽, 何秋锦, 等. 基于半张量积的双合作博弈Shapley值计算. 中国科学: 信息科学, 2022, 52(7): 1302-1316, doi: 10.1360/SSI-2021-0337
Zhiqiang LI, Wenge LI, Qiujin HE, et al. The Shapley value for bicooperative games based on the semi-tensor product. Sci Sin Inform, 2022, 52(7): 1302-1316, doi: 10.1360/SSI-2021-0337
李梢, 张鹏, 古槿, 江瑞, 李衍达
中国科学: 信息科学, 2022, 52(5): 856-869
摘要
在生物医学大数据时代,如何全面有效地发现致病基因、药物靶标等关键要素,从整体上理解宏观表型的微观本质,是目前信息科学与中西医学交叉研究面临的重大共性挑战之一.生物系统是典型的复杂系统,克服上述挑战的关键是:如何通过深入理解复杂生物系统的“关系”本质,解决复杂系统多层次信息融合难题以及生物医学大数据中广泛存在的维度高、噪声大、样本少等难点.“生物网络”是构成复杂生物系统的基础,反映人体内部基因和基因产物等各种生物分子的相互关系、生物分子与疾病和药物等不同层次的关系,生物网络已被广泛用于生物医学大数据的分析.李梢课题组从20余年前开始中西医药与生物网络的关联研究,率先提出“网络靶标”假说,并进行方法构建与应用.本文对基于生物网络的关系推断理论与方法进行总结与思考.首先,从原理上,发现疾病宏观表型与微观分子在复杂生物网络中存在“层次模块化关系”,即宏观层次的涌现在微观上具有局域模块性,宏观表型越相似,微观致病基因或药物靶标在网络上的模块性关联越强.其次,从方法上,给出基于生物网络从生物医学大数据、少量目标样本中推断关键生物要素的“关系推断”一般性方法框架:以层次模块化关系为基础,从全局角度进行关系网络构建、关系表示与建模、未知关系推断,实现关系的实体化、数学化、整体化.进而,从应用上,基于生物网络的关系推断方法在致病基因与药物靶标预测、疾病标志物识别、中医药机制解析等方面表现出很好的性能.综上,关系推断方法能够为从系统角度和分子水平揭示中西医药科学原理提供系统解决方案,也为网络药理学等新兴学科提供重要的原理和方法学支撑.
关键词
复杂生物网络; 模块化; 多层次关联; 关系推断; 小样本推断; 网络药理学; complex biological network; modularity; multilevel relationship; relationship inference; small-sample inference; network pharmacology;
引用格式
李梢, 张鹏, 古槿, 等. 基于生物网络的关系推断原理、方法与应用. 中国科学: 信息科学, 2022, 52(5): 856-869, doi: 10.1360/SSI-2021-0243
Shao LI, Peng ZHANG, Jin GU, et al. Principle, method and application of relationship inference based on biological networks. Sci Sin Inform, 2022, 52(5): 856-869, doi: 10.1360/SSI-2021-0243
时侠圣, 孙长银, 穆朝絮
中国科学: 信息科学, 2024, 54(4): 911-926
摘要
针对一般异构线性多智能体系统的分布式资源分配问题,结合智能体动力学特性设计一类分布式优化算法,旨在实现扰动抑制的同时完成资源的最优分配.面对扰动模型已知干扰信号,本文利用智能体状态信息设计一种自适应分布式优化算法,其中拉格朗日(Lagrange)乘子对偶变量控制参数自动增加,直至拉格朗日乘子对偶变量达到一致.当智能体状态信息不可测时,本文将上述算法修改为基于输出反馈的分布式优化算法.当全局成本函数强凸时,借助拉萨尔(LaSalle)不变性引理证明上述所提算法渐近收敛到全局最优解.面对未知扰动信号,本文利用扩张状态观测器技术设计一种分布式优化算法.当未知扰动信号为常数或其微分趋于零时,利用李雅普诺夫(Lyapunov)理论证明上述算法渐近收敛至全局最优解.最后利用数值仿真验证上述算法有效.
关键词
异构多智能体系统; 资源分配; 自适应通信权重; 状态反馈; 输出反馈; 未知扰动; heterogeneous multi-agent systems; resource allocation; adaptive communication weight; state feedback; output feedback; unknown disturbance
引用格式
时侠圣, 孙长银, 穆朝絮. 扰动线性多智能体系统的分布式资源分配算法. 中国科学: 信息科学, 2024, 54(4): 911-926, doi: 10.1360/SSI-2023-0093
Xiasheng SHI, Changyin SUN, Chaoxu MU. Distributed resource allocation algorithms for linear multi-agent systems with disturbances. Sci Sin Inform, 2024, 54(4): 911-926, doi: 10.1360/SSI-2023-0093
吴温文, 朱善迎, 刘帅, 关新平
中国科学: 信息科学, 2024, 54(3): 692-707
摘要
针对通信噪声干扰下的资源分配问题,本文提出了基于对偶梯度追踪的分布式算法以实现资源的最优配置.通过设计新的噪声追踪策略与引入抑制系数,本文算法对噪声干扰具有更好的鲁棒性,并且支持各节点使用非协同步长进行迭代更新.理论分析证明了对于非Lipschitz光滑甚至不可微的强凸目标函数,算法在噪声干扰下仍能收敛到最优解邻域并且具有O(1/k)收敛速率.最后,在IEEE14母线和IEEE 118母线系统上验证了本文所提出分布式算法的有效性和可拓展性.
关键词
分布式优化; 对偶问题; 噪声抑制; 资源分配; 非协同步长; distributed optimization; dual problem; noise suppression; resource allocation; uncoordinated stepsizes
引用格式
吴温文, 朱善迎, 刘帅, 等. 具有非协同步长的噪声鲁棒分布式资源分配算法. 中国科学: 信息科学, 2024, 54(3): 692-707, doi: 10.1360/SSI-2023-0022
Wenwen WU, Shanying ZHU, Shuai LIU, et al. Noise-robust distributed resource allocation with uncoordinated step-sizes. Sci Sin Inform, 2024, 54(3): 692-707, doi: 10.1360/SSI-2023-0022
马苗苗, 李钰梅, 崔婧, 刘向杰
中国科学: 信息科学, 2023, 53(7): 1392-1403
摘要
针对具有约束和扰动的多区域互联电力系统负荷频率控制(load frequency control, LFC)问题,本文提出了一种事件触发分布式模型预测控制(event-triggered distributed model predictive control,ET-DMPC)策略.将大规模互联电力系统分解成多个动态耦合的子系统,考虑发电机变化率约束(generation rate constraint, GRC)和调速器阀门位置限制,建立分布式预测控制优化问题.为了降低系统计算负担,减少计算资源的消耗和浪费,基于预测值和系统实际状态的误差构造事件触发条件.在事件触发机制下,只有子系统满足相应的事件触发条件时,控制器才传输状态信息和求解优化问题,并与邻域子系统交互最优解作用下的关联信息.仿真结果表明,本文提出的控制策略在负荷扰动和系统参数不确定的情况下具有良好的鲁棒性,同时极大地降低了系统的计算负担.
关键词
负荷频率控制; 分布式模型预测控制; 事件触发; 互联电力系统; 发电机变化率约束; load frequency control; distributed model predictive control; event-triggered; interconnected power system; GRC;
引用格式
马苗苗, 李钰梅, 崔婧, 等. 基于事件触发的互联电力系统分布式负荷频率预测控制. 中国科学: 信息科学, 2023, 53(7): 1392-1403, doi: 10.1360/SSI-2022-0343
Miaomiao MA, Yumei LI, Jing CUI, et al. Event-triggered distributed model predictive load frequency control of an interconnected power system. Sci Sin Inform, 2023, 53(7): 1392-1403, doi: 10.1360/SSI-2022-0343
徐占伯, 周春翔, 吴江, 刘坤, 管晓宏
中国科学: 信息科学, 2023, 53(3): 517-534
摘要
建筑能源系统能耗总量巨大且用能弹性高,具有很大的节能优化潜力,其提效节能被认为是降低能源电力系统终端碳排放、实现“2030碳达峰、2060碳中和”国家战略目标的重要途径之一.然而,建筑能源系统节能优化面临人员行为与系统能耗交互影响、多种能源介质时空多尺度耦合与供需能量平衡等建模挑战,以及系统决策空间随建筑规模指数增长的维数灾计算复杂性挑战.针对上述挑战,本文从信息物理融合的角度出发,提出了基于节点–流量模型的建筑能源系统分布式优化模型,刻画了电、气、热等能源物理网络与信息网络的交互影响,实现了局部数据采集和计算的一体化结构设计,支撑边云协同计算体系.进而,设计了基于边云协同的分布式迭代优化算法,证明了算法的收敛性,可实现建筑能源系统供需协同优化,并大大降低了对全局信息的依赖性和通信需求.本文以6种不同规模下实际建筑系统的数值测试结果,验证了所提方法的性能和有效性,特别在大规模建筑能源系统上具有良好的应用前景.
关键词
建筑能源系统; 信息物理融合系统; 边云协同计算; 供需协同优化; 系统优化; building energy system; cyber-physical system; edge-cloud computing; supply-demand coordination; system optimization;
引用格式
徐占伯, 周春翔, 吴江, 等. 基于边云协同的建筑能源系统分布式供需协同优化. 中国科学: 信息科学, 2023, 53(3): 517-534, doi: 10.1360/SSI-2022-0053
Zhanbo XU, Chunxiang ZHOU, Jiang WU, et al. Edge-cloud framework-based distributed optimization of a building energy system with supply-demand coordination. Sci Sin Inform, 2023, 53(3): 517-534, doi: 10.1360/SSI-2022-0053
李庆奎, 高雪峰, 彭晨, 张蕴隆, 易军凯
中国科学: 信息科学, 2023, 53(2): 325-343
摘要
产品与供应链协同演进系统(product and supply chain synchronous evolution system, PSCSE)是一类复杂的分布式信息物理系统(cyber-physical system, CPS),含有大量的未建模动态与不确定性.剧烈的需求波动及突发的网络事件,使系统结构参数极易发生变化.产品设计变更是维持PSCSES稳定、满足用户需求及保证经济效益的重要手段.本文研究基于分布式CPS的PSCSES在受到DoS攻击下的应急变更控制问题.首先,针对PSCSES在网络攻击下数据包丢失问题,利用每条子链的历史数据设计基于循环神经网络(recurrent neural network, RNN)的预测器以弥补因网络攻击造成的库存数据丢失;其次,利用博弈论思想将H∞一致性控制问题转化为多人零和图博弈问题,提出一种应急变更补偿机制;进而基于Q-learning的策略迭代技术设计了模型未知的控制器求解算法,实现了系统的库存状态H∞一致性.最后,仿真实验验证了所提方法的有效性.
关键词
网络攻击; 数据驱动; 供应链; 变更控制设计; 多智能体; cyber-attacks; data-driven; supply chain; change control design; multi-agent;
引用格式
李庆奎, 高雪峰, 彭晨, 等. 网络攻击下产品与供应链协同演进系统数据驱动变更控制设计. 中国科学: 信息科学, 2023, 53(2): 325-343, doi: 10.1360/SSI-2021-0435
Qingkui LI, Xuefeng GAO, Chen PENG, et al. Data-driven change control design for product and supply chain synchronous evolution systems under cyber-attacks. Sci Sin Inform, 2023, 53(2): 325-343, doi: 10.1360/SSI-2021-0435
孟祥正, 吴爱国, 梅杰, 马广富
中国科学: 信息科学, 2023, 53(1): 81-96
摘要
本文主要研究有向图中含弹性关节多机械臂系统的一致性问题,利用模型参考自适应一致性方法,将含弹性关节多机械臂系统的一致性问题转化成参考模型的一致性和单个机械臂系统的轨迹跟踪问题两个子问题.考虑到机械臂的相对角速度信息难以获取的情况,提出了无需相对角速度信息的线性参考模型.在轨迹跟踪算法设计上,利用反步法对单个机械臂系统设计了跟踪控制算法,使得系统达到关节角度趋于一致的结果.
关键词
含弹性关节机械臂; 一致性; 分布式控制; 多智能体系统; 有向图; manipulator with elastic joints; consensus; distributed control; multi-agent systems; directed graph;
引用格式
孟祥正, 吴爱国, 梅杰, 等. 有向图中含弹性关节多机械臂系统的分布式一致性. 中国科学: 信息科学, 2023, 53(1): 81-96, doi: 10.1360/SSI-2021-0349
Xiangzheng MENG, Aiguo WU, Jie MEI, et al. Consensus of multiple manipulators with elastic joints under a directed graph. Sci Sin Inform, 2023, 53(1): 81-96, doi: 10.1360/SSI-2021-0349
王荣笙, 张琦, 张涛, 林鹏, 丁舒忻, 袁志明
中国科学: 信息科学, 2022, 52(11): 2121-2140
摘要
针对突发事件导致的车站封锁情况,本文以列车运行图为问题对象,以进化计算框架为基础,提出基于问题知识的运行图实时调整方法,通过减小列车总晚点时间,保证高铁运营的安全高效和旅客的满意舒适.首先,基于调整列车发车次序的运行图调整策略提出排列编码方法,用于减少解空间的无效搜索.之后,根据“紧追踪”的列车运行追踪方式,设计启发式解码方法消除所有行车作业约束,提升算法求解效率.最后,将调度员调整运行图的经验作为问题知识,用于初始化进化计算的初始种群,由此提出基于问题知识的启发式种群初始化方法,加快算法前期的收敛速度并提高求解方案质量.以京津高速线为例,在北京南站设置车站封锁下20~150 min不同封锁时长的9个典型场景,选择加强精英保留遗传算法和差分进化算法,分别应用实整数编码和排列编码,与随机种群初始化和启发式种群初始化的不同组合进行仿真实验.仿真结果表明,相较于实整数编码难以获取可行解, 2种进化算法应用排列编码方法后,能在9 s的平均时间内给出列车总晚点时间最小的调整方案.在启发式种群初始化的改进下, 2种进化算法能更快地收敛于近似最优解.选取加强精英保留遗传算法应用排列编码和启发式种群初始化的改进变体,作为本文最优改进进化算法.针对CPLEX无法在10 min获得最优解的7个场景,该改进进化算法都能在20 s内给出近似最优解.
关键词
高速铁路; 列车运行调整; 车站封锁; 进化计算; 遗传算法; 排列编码优化; high-speed railway; train rescheduling; station blockage; evolutionary computing; genetic algorithm; permutation-based optimization;
引用格式
王荣笙, 张琦, 张涛, 等. 车站封锁下基于问题知识的高速铁路列车运行实时调整方法. 中国科学: 信息科学, 2022, 52(11): 2121-2140, doi: 10.1360/SSI-2021-0332
Rongsheng WANG, Qi ZHANG, Tao ZHANG, et al. Real-time rescheduling approach of train operation for high-speed railways using problem-specific knowledge under a station blockage. Sci Sin Inform, 2022, 52(11): 2121-2140, doi: 10.1360/SSI-2021-0332
任丽娜, 武瀚, 焦晓红
中国科学: 信息科学, 2022, 52(6): 1098-1113
摘要
电动汽车具有移动储能器的特性,对其充放电行为进行合理调度可以对电网负荷起到削峰填谷作用,并提高电网对风光能源的吸纳能力,为此本文研究了含有电动汽车与电网交互(vehicle-to-grid,V2G)的孤岛微电网分布式能量管理策略.首先通过充放电电价诱导机制,提出一种包含电动汽车聚合商的多智能体微电网效益模型,进而考虑实际能源系统在发电损耗及功率平衡约束下的社会效益最大化问题.其次利用微电网内分布式能源之间信息交互,设计基于多智能体一致性理论的优化求解算法,并进一步考虑系统中存在通信随机时延的情况,最终实现社会效益最大化且系统电价达到一致,并对此研究背景下算法的收敛性进行分析,给出了收敛条件.最后采用标准IEEE-11总线结构对系统进行仿真验证,证明了所提控制策略的有效性.
关键词
V2G; 多智能体系统; 发电损耗; 通信时延; 分布式一致性; V2G; multi-agent system; power loss; time delay; distributed consistency;
引用格式
任丽娜, 武瀚, 焦晓红. 考虑V2G背景下微电网的一致性能量管理策略. 中国科学: 信息科学, 2022, 52(6): 1098-1113, doi: 10.1360/SSI-2021-0218
Lina REN, Han WU, Xiaohong JIAO. Consistency-based energy management strategy for microgrids with V2G. Sci Sin Inform, 2022, 52(6): 1098-1113, doi: 10.1360/SSI-2021-0218
马亚杰, 刘洋, 姜斌, 冒泽慧, 刘剑慰, 刘文静
中国科学: 信息科学, 2024, 54(2): 354-372
摘要
针对工业设备故障诊断知识图谱故障实体属性残缺、故障关系链接缺失的问题,本文提出了一种基于知识图谱异构图注意力网络(knowledge graph heterogeneous graph attention network, KGHAN)模型的工业设备故障诊断知识图谱补全方法,通过对故障实体概念补全和故障关系链接补全完善了工业设备故障诊断知识图谱.所提KGHAN模型在异构图注意力网络模型的基础上,融合了故障知识结构信息和故障图结构信息,有效地表征了故障实体和故障关系的嵌入表示,提高了故障实体概念补全任务的准确率和故障关系链接补全任务的命中率.将所提工业设备故障诊断知识图谱补全方法应用在国内某企业的工业设备故障运维数据上,结果表明,故障实体概念补全任务的准确率提高了约10%,故障关系链接补全任务的命中率提高了约37%,验证了方法的有效性.
关键词
知识图谱补全; 知识图谱; 图神经网络; 故障诊断; 工业设备; knowledge graph completion; knowledge graph; graph neural network; fault diagnosis; industrial equipment
引用格式
马亚杰, 刘洋, 姜斌, 等. 基于异构图注意力的工业设备故障诊断知识图谱补全方法. 中国科学: 信息科学, 2024, 54(2): 354-372, doi: 10.1360/SSI-2022-0440
Yajie MA, Yang LIU, Bin JIANG, et al. Knowledge graph completion method for industrial equipment fault diagnosis based on heterogeneous graph attention. Sci Sin Inform, 2024, 54(2): 354-372, doi: 10.1360/SSI-2022-0440
路石, 杨浩, 姜斌
中国科学: 信息科学, 2024, 54(1): 210-226
摘要
本文基于前景理论在博弈的框架下研究了行为感知概率对网络化系统中攻防资源配置的影响.首先,在理性决策情形下,通过融合物理系统、执行器攻击和资源分配模型,构建了一个新的安全博弈框架.其次,针对决策者依靠感知概率而非真实概率进行主观决策的情形,基于前景理论构造了行为安全博弈模型.然后,建立了安全博弈和行为安全博弈下期望收益函数关于攻防资源凹凸性的充要条件,并深入分析和比较了安全博弈和行为安全博弈下攻防资源最优配置的存在性和唯一性以及行为概率对安全博弈的影响.最后以无人机群为例进行了仿真,验证了所提方法的有效性.
关键词
执行器攻击; 前景理论; 资源分配; 安全博弈; 行为安全博弈; actuator attacks; prospect theory; resource allocation; security game; behavioral security game
引用格式
路石, 杨浩, 姜斌. 基于前景理论的行为安全博弈. 中国科学: 信息科学, 2024, 54(1): 210-226, doi: 10.1360/SSI-2023-0002
Shi LU, Hao YANG, Bin JIANG. Prospect theory-based behavioral security game. Sci Sin Inform, 2024, 54(1): 210-226, doi: 10.1360/SSI-2023-0002
谭建伟, 王继民, 张纪峰
中国科学: 信息科学, 2023, 53(12): 2472-2492
摘要
本文研究了多方参与的随机线性系统的协作安全参数辨识问题,提出了一种基于门限Paillier密码体制的安全多方最小二乘辨识算法.具体地,通过对正负整数的合理编码,将(门限) Paillier密码体制的加密对象及同态特性由非负整数扩展到了整数.利用门限Paillier密码体制和将数据沿时间轴切分的方法,设计了相应的安全多方参数辨识算法.给出了算法正确加解密所需的明文空间大小条件、保证隐私安全性的时间切分长度条件以及一定条件下估计误差与加密量化误差之间的定量关系.证明了,只要选取的时间切分长度合适,对于任意一个参与者,即使其他所有参与者联合起来仍然无法得到其具体的隐私信息.最后,通过数值仿真验证了算法的有效性.
关键词
多方参与的ARX系统; 隐私安全; 系统辨识; 门限Paillier加密体制; 最小二乘方法; multi-participant ARX system; privacy security; system identification; threshold Paillier cryptosystem; least squares method
引用格式
谭建伟, 王继民, 张纪峰. 多方ARX系统的协作安全辨识——一种基于门限Paillier密码体制的最小二乘辨识方法. 中国科学: 信息科学, 2023, 53(12): 2472-2492, doi: 10.1360/SSI-2023-0140
Jianwei TAN, Jimin WANG, Jifeng ZHANG. Cooperative secure parameter identification of multi-participant ARX system — threshold Paillier cryptosystem-based least-squares identification algorithm. Sci Sin Inform, 2023, 53(12): 2472-2492, doi: 10.1360/SSI-2023-0140
张景欣, 周东华, 陈茂银, 吴德浩
中国科学: 信息科学, 2023, 53(11): 2087-2106
摘要
由于原材料、设定点、外界环境等因素变化,工业过程通常具有多个运行工况.多工况过程异常监测技术是保证工业系统安全运行的有效方式,也是过程监测技术的研究热点与难点.首先,对多工况过程异常监测方法进行概述,并将多工况过程的常见处理方式归纳为整体建模、自适应建模、混合建模和多模型建模方法;其次,分别回顾了多工况平稳过程和多工况非平稳过程的研究现状,并分析了各类方法的优缺点;最后,结合实际工业系统特点,指出该领域亟须解决的问题和未来发展方向.
关键词
数据驱动; 多工况过程; 异常监测; 平稳过程; 非平稳过程; 故障检测; data-driven; multimode processes; anomaly monitoring; stationary processes; nonstationary processes; fault detection
引用格式
张景欣, 周东华, 陈茂银, 等. 数据驱动的多工况过程异常监测方法: 综述与展望. 中国科学: 信息科学, 2023, 53(11): 2087-2106, doi: 10.1360/SSI-2022-0404
Jingxin ZHANG, Donghua ZHOU, Maoyin CHEN, et al. Data-driven anomaly monitoring methods for multimode processes: overview and perspectives. Sci Sin Inform, 2023, 53(11): 2087-2106, doi: 10.1360/SSI-2022-0404
姜羽, 陈华, 张小刚, 王炼红, 王鼎湘
中国科学: 信息科学, 2023, 53(9): 1784-1801
摘要
针对信息物理系统的多变量时序数据的异常检测是预防系统故障、保证安全生产的必要手段.由于系统变量间的强耦合性和传播效应,设计异常检测算法时应考虑系统变量间的耦合特性、传播有向性和因果时滞性,从系统结构变化的角度检测早期异常.本文提出一种端到端的启发式时空图神经网络(heuristic spatio-temporal graph neural network, HST-GNN)用于多变量时序数据的异常检测.首先,考虑变量间关系的有向性和集群性,设计一种有向相似性函数和基于启发式聚类算法的图结构学习算法,对多变量时序数据进行图建模以学习变量间的空间耦合关系;其次,使用门控卷积注意单元和多头图注意层作为时空图注意模块,从时空层面同时捕获系统的非线性因果时序和空间耦合深度特征;最后,量化系统的图结构特征,将其作为时空图网络提取的传感器深度特征的补充,输入自编码器中,从系统级别和传感器级别来检测异常.本文在4个公共数据集上验证了HST-GNN的性能.实验结果表明,稀疏有向的图结构有利于系统耦合特性的提取,从系统和传感器级别检测异常增加了模型对不显著的早期异常的敏感度.
关键词
多变量时序数据; 无监督异常检测; 启发式图结构; 时空图注意网络; 系统级图结构特征; multivariable time series data; unsupervised anomaly detection; heuristic graph structure; spatiotemporal graph attention network; system-level graph structure features
引用格式
姜羽, 陈华, 张小刚, 等. 基于启发式时空图神经网络的多变量时序异常检测. 中国科学: 信息科学, 2023, 53(9): 1784-1801, doi: 10.1360/SSI-2022-0425
Yu JIANG, Hua CHEN, Xiaogang ZHANG, et al. Multivariable time series anomaly detection using heuristic spatio-temporal graph neural network. Sci Sin Inform, 2023, 53(9): 1784-1801, doi: 10.1360/SSI-2022-0425
蔡美玲, 汪家喜, 刘金平, 唐朝晖, 谢永芳
中国科学: 信息科学, 2023, 53(5): 972-992
摘要
基于过程中实时采集的多变量时序关联数据进行异常检测是预防工业过程事故、保障系统安全的关键环节之一.然而,工业多变量时间序列异常检测仍面临如下两大难题:(1)时序数据变量间复杂的非线性关联特性缺乏有效的表达方法;(2)正常/异常分布极度不均衡的时间序列间复杂的相关性有待深入挖掘.本文提出一种新的基于多变量时间序列的无监督异常检测方法 ——基于Transformer GAN的多变量时间序列异常检测方法 (TGAN-MTSAD). TGAN-MTSAD采用Transformer网络作为生成对抗网络的基本模型,引入了图注意力层以自动学习时序多元变量间的复杂依赖关系,还应用了patch技巧使模型能够有效捕捉时间窗口内的异常细节信息,并提出了基于重构误差与鉴别误差相结合的异常分数计算方法.采用3个真实世界的数据集对所提方法进行了大量的性能验证与对比实验分析.结果表明, TGAN-MTSAD可以有效检测过程中的时序异常,在大多数情况下优于基线方法,并且具有良好的可解释性,可用于复杂工业异常诊断.
关键词
多变量时间序列; 异常检测; Transformer; 异常分数; 图注意力; multivariate time series; anomaly detection; Transformer; anomaly score; graph attention;
引用格式
蔡美玲, 汪家喜, 刘金平, 等. 基于Transformer GAN架构的多变量时间序列异常检测. 中国科学: 信息科学, 2023, 53(5): 972-992, doi: 10.1360/SSI-2022-0133
Meiling CAI, Jiaxi WANG, Jinping LIU, et al. Transformer-GAN architecture for anomaly detection in multivariate time series. Sci Sin Inform, 2023, 53(5): 972-992, doi: 10.1360/SSI-2022-0133
姜午恺, 周平
中国科学: 信息科学, 2023, 53(5): 946-971
摘要
针对高维不平衡数据的多工况故障诊断难题,提出一种非平衡数据条件下基于动态自适应迁移的宽度学习方法 (TL-BLS),并应用于污水处理过程的多工况故障诊断.首先,针对工业过程中不同工况下存在数据分布差异过大的问题,采用迁移学习流形变换方法拉近源域数据和目标域数据的距离;其次,针对后续自适应迁移中需要伪标签的条件,提出考虑数据不平衡的两阶段目标域伪标签预测方法,第一阶段使用基于类间关系的伪标签方法得到可靠度高的伪标签,第二阶段使用考虑子集差异的集成方法来获得可靠度更高且兼顾数据不平衡问题的伪标签;最终,建立带流形正则化项和具有动态平衡因子的自适应迁移与宽度学习方法,并在宽度学习系统和自适应迁移中引入权重矩阵来解决数据非平衡的问题,实现多工况过程下的故障诊断.污水处理过程数据实验及其比较分析表明所提方法具有更优的故障识别效果和更好的实用性.
关键词
故障诊断; 迁移学习; 宽度学习系统; 流形学习; 集成学习; 污水处理过程; 非平衡数据; fault diagnosis; transfer learning; broad learning system; manifold learning; ensemble learning; sewage treatment process; imbalanced data;
引用格式
姜午恺, 周平. 非平衡数据下基于自适应迁移与宽度学习的多工况故障诊断. 中国科学: 信息科学, 2023, 53(5): 946-971, doi: 10.1360/SSI-2022-0118
Wukai JIANG, Ping ZHOU. Multi-condition fault diagnosis based on adaptive transfer and broad learning under imbalanced data. Sci Sin Inform, 2023, 53(5): 946-971, doi: 10.1360/SSI-2022-0118
柴铮, 汪嘉业, 赵春晖, 丁进良, 孙优贤
中国科学: 信息科学, 2023, 53(5): 821-840
摘要
基于深度迁移学习的工业监控方法在近年来获得了大量研究关注,特别是在以故障诊断、软测量等为代表的工业监控典型监督任务中.通过挖掘与迁移相似源域的知识来完成对目标域的建模,这类方法为实际工业场景中变工况等原因导致的跨域监控问题提供了新的思路.本文系统梳理了面向工业监控典型监督任务的深度迁移学习方法,并将其分为基于模型迁移、基于样例迁移与基于特征迁移的工业监控方法.在此基础上,对不同类方法的基本研究思想在故障诊断与软测量任务中的研究进展进行了详细阐述.随后,从实际工业场景的复杂欠数据问题、可迁移性的量化与负迁移问题、工业过程的动态特性问题等角度,指出了当前基于深度迁移学习的工业监控研究中存在的挑战,并对该领域的未来研究方向做出进一步展望.
关键词
迁移学习; 深度学习; 跨域工业监控; 故障诊断; 软测量; transfer learning; deep learning; cross-domain industrial monitoring; fault diagnosis; soft sensor;
引用格式
柴铮, 汪嘉业, 赵春晖, 等. 面向工业监控典型监督任务的深度迁移学习方法: 现状、挑战与展望. 中国科学: 信息科学, 2023, 53(5): 821-840, doi: 10.1360/SSI-2022-0328
Zheng CHAI, Jiaye WANG, Chunhui ZHAO, et al. Deep transfer learning methods for typical supervised tasks in industrial monitoring: state-of-the-art, challenges, and perspectives. Sci Sin Inform, 2023, 53(5): 821-840, doi: 10.1360/SSI-2022-0328
卞嘉楠, 冒泽慧, 姜斌, 马亚杰, 刘文静
中国科学: 信息科学, 2023, 53(4): 699-714
摘要
针对工业生产关键设备故障数据稀疏的问题和故障诊断的需求,本文提出了一种基于知识图谱和多任务学习的工业生产关键设备故障诊断模型MKFD (multi-task learning for knowledge graphenhanced fault diagnosis),通过对故障根因的推断实现故障诊断.设计了多任务学习框架,并构造了一种改进十字绣单元用于实现框架内子任务之间的信息共享.利用运维数据构建故障现象–故障根因关联矩阵,使用多层感知机搭建知识图谱嵌入模型;分别将关联矩阵嵌入和知识图谱嵌入作为多任务学习框架中的两个子任务,通过子任务的交替学习,优化MKFD模型参数,实现对故障根因的推断,从而达到故障诊断的目的.最后,基于国内某工业企业的运维数据所构建的两个工业生产关键设备故障知识图谱对上述方案进行了验证实验,结果证明所提出的方法具有良好的性能.
关键词
故障诊断; 知识图谱; 多任务学习; 工业生产关键设备; 推荐系统; fault diagnosis; knowledge graph; multi-task learning; critical industrial equipment; recommender system;
引用格式
卞嘉楠, 冒泽慧, 姜斌, 等. 基于知识图谱和多任务学习的工业生产关键设备故障诊断方法. 中国科学: 信息科学, 2023, 53(4): 699-714, doi: 10.1360/SSI-2022-0060
Jianan BIAN, Zehui MAO, Bin JIANG, et al. Fault diagnosis method of critical industrial equipment based on knowledge graphs and multi-task learning. Sci Sin Inform, 2023, 53(4): 699-714, doi: 10.1360/SSI-2022-0060
盛立, 牛艺春, 刘诗洋, 王伟亮, 高明, 周东华
中国科学: 信息科学, 2022, 52(11): 2106-2120
摘要
旋转导向钻井系统是油气开发领域的高端装备,其核心部分——动态指向式旋转导向钻井工具的可靠运行是钻井系统正常工作的重要前提.本文基于模型的方法研究了导向钻井工具装备的微小故障检测,有望为系统的运行维护与健康管理提供重要保障.首先,基于机理建模方法得到了导向钻井工具装备的数学模型.然后,利用移动加权平均方法提高了残差对微小故障的敏感性.基于非中心χ~2分布的性质,实现了对微小故障在统计意义下的可检测性分析,得到了保证误报率与漏报率在允许范围内的窗口长度和权值.最后,在旋转导向钻井工具原理样机上进行实验,实验结果验证了所提方法的有效性.
关键词
旋转导向钻井工具装备; 微小故障检测; 故障可检测性分析; 误报率; 漏报率; rotary steerable drilling tool equipment; incipient fault detection; fault detectability analysis; false alarm rate; missed detection rate;
引用格式
盛立, 牛艺春, 刘诗洋, 等. 旋转导向钻井工具装备的微小故障检测. 中国科学: 信息科学, 2022, 52(11): 2106-2120, doi: 10.1360/SSI-2021-0309
Li SHENG, Yichun NIU, Shiyang LIU, et al. Incipient fault detection of rotary steerable drilling tool equipment. Sci Sin Inform, 2022, 52(11): 2106-2120, doi: 10.1360/SSI-2021-0309
刘颖, 李阳光, 瞿树晖, 董纪昌, 王竞凡
中国科学: 信息科学, 2022, 52(10): 1870-1882
摘要
风机状态预测是风电数字化和智能运维的关键环节.深度学习由于在挖掘复杂高维数据隐藏关系上具有强大潜力,逐渐被应用于风机状态预测中.然而深度学习在实际运行中也存在着推理性和解释性差等局限性,如何将领域知识与智能算法有效结合是智能运维的一个重要方向.本文以多元时间序列图神经网络通用框架(multivariate time series graph neural network, MT-GNN)为基础,提出了一个知识嵌入式图神经网络模型(knowledge-embedded graph neural network, K-GNN),对风机多元时间序列状态数据进行预测.在该模型中,本文将知识嵌入模块与图学习模块相结合,通过嵌入相关、因果、专家经验3种知识矩阵,更好地刻画出状态变量之间的关联关系.结果显示,在3种知识嵌入式K-GNN模型中,嵌入了专家经验矩阵的图神经网络模型在预测上的表现更为出色,说明领域知识能够有效提升图神经网络模型的泛化性能和可解释性.本文的研究成果对于风电预测性维护技术的研发和推广具有参考意义.
关键词
风力发电机; 状态预测; 多元时间序列; 专家经验; 图神经网络; wind turbines; state prediction; multivariate time series; expert experience; graph neural network;
引用格式
刘颖, 李阳光, 瞿树晖, 等. 知识嵌入式图神经网络在风机多元状态预测中的应用. 中国科学: 信息科学, 2022, 52(10): 1870-1882, doi: 10.1360/SSI-2021-0300
Ying LIU, Yangguang LI, Shuhui QU, et al. Application of knowledge-embedded graph neural network for multivariate state prediction of wind turbines. Sci Sin Inform, 2022, 52(10): 1870-1882, doi: 10.1360/SSI-2021-0300
朱哲人, 张新民, 柴毅, 宋执环
中国科学: 信息科学, 2022, 52(10): 1853-1869
摘要
面向系统状态安全的分析与控制,是目前控制领域内的热点研究之一.针对一类具有可行状态集的动态系统,本文深入讨论障碍函数与状态安全判据之间的相关性,通过设计一种新颖的障碍函数,提出了基于障碍函数的状态安全判据,该状态安全判据可用于此类系统的安全分析、诊断与控制.受启发于倒数障碍函数与零障碍函数,本文设计了一类非正障碍函数,并在此基础上提出了面向可行状态集的动态系统状态安全判据,通过验证该可行状态集的前向不变性,从而保证系统的安全性;根据非正障碍函数,建立了控制障碍函数,以此设计面向动态控制系统的状态安全控制器,保障系统的运行安全.上述理论与方法在一类连续搅拌釜反应器的安全运行控制中得以应用,通过仿真验证,证明了理论与方法的有效性,实现了基于障碍函数的安全控制理论在过程控制中的首次尝试.
关键词
非正障碍函数; 动态系统; 状态安全控制; 安全性判据; 控制障碍函数; non-positive barrier function; dynamical systems; state-safety control; safety criteria; control barrier function;
引用格式
朱哲人, 张新民, 柴毅, 等. 非正障碍函数: 面向非线性系统安全控制的一类新颖障碍函数. 中国科学: 信息科学, 2022, 52(10): 1853-1869, doi: 10.1360/SSI-2021-0313
Zheren ZHU, Xinmin ZHANG, Yi CHAI, et al. Non-positive barrier function: a new notion of barrier function for state-safety control of nonlinear dynamical systems. Sci Sin Inform, 2022, 52(10): 1853-1869, doi: 10.1360/SSI-2021-0313
王子骏, 刘杨, 鲍远义, 管晓宏, 吴桐, 卢建刚, 余志文, 袁晓舒, 刘烃
中国科学: 信息科学, 2022, 52(3): 399-429
摘要
电力系统安全仿真是面向电力系统自身故障或外部攻击等安全威胁,通过仿真实验或借助数值计算研究系统行为的技术.随着自动控制、网络通信、人工智能等信息技术的广泛应用,电力系统已发展成为物理系统与信息系统深度耦合的信息物理融合系统.物理破坏或网络攻击产生的故障在电力系统中相互关联,可跨域传播,产生新的安全威胁形态.电力系统安全仿真正在面临新的挑战.本文回顾了历史上影响广泛的电力系统安全事件;从工程安全、网络安全、信息物理综合安全3个维度,分析电力系统安全仿真的需求和技术发展,对代表性的安全仿真平台进行分类和总结;探讨电力系统安全仿真技术面临的挑战和发展趋势.
关键词
信息物理融合系统; 工程安全; 网络安全; 信息物理综合安全; 电力系统安全仿真技术; cyber-physical system(CPS); engineering safety; network security; cyber-physical integrated security; power system security simulation technology;
引用格式
王子骏, 刘杨, 鲍远义, 等. 电力系统安全仿真技术: 工程安全、网络安全与信息物理综合安全. 中国科学: 信息科学, 2022, 52(3): 399-429, doi: 10.1360/SSI-2021-0210
Zijun WANG, Yang LIU, Yuanyi BAO, et al. Power system security simulation technologies: engineering safety, network security and cyber-physical integrated security. Sci Sin Inform, 2022, 52(3): 399-429, doi: 10.1360/SSI-2021-0210
王芳, 张蓝天, 郭雷
中国科学: 信息科学, 2022, 52(10): 1837-1852
摘要
司法大数据已成为法律实证研究和智慧司法工程建设的重要基础,相应地,数据计算结果的可解释性与可靠性等基础性问题愈加重要.为此,我们对非线性递推辨识理论进行了相应创新,并应用于量刑数据分析.具体来讲,依据相关法律建立了更加符合法逻辑的非线性随机量刑模型(S-模型),应用我们提出的非线性递推辨识算法和建立的关于有限数据样本下辨识精度的数学理论,对近20万故意伤害罪判决数据进行了计算分析.研究发现,与传统线性模型及最小二乘算法相比,基于我们的S-模型和非线性递推辨识算法所给出的计算结果,更符合量刑基本原则和具体规则,可以更准确地反映量刑要素的影响及变化,并具有更好的预测能力.
关键词
非线性模型; 递推辨识算法; 辨识精度保证; 量刑; 故意伤害罪; 司法判决数据; nonlinear model; recursive identification algorithm; identification accuracy guarantee; sentencing; crime of intentional injury; judicial documents data;
引用格式
王芳, 张蓝天, 郭雷. 非线性递推辨识理论在量刑数据分析中的应用. 中国科学: 信息科学, 2022, 52(10): 1837-1852, doi: 10.1360/SSI-2022-0325
Fang WANG, Lantian ZHANG, Lei GUO. Applications of nonlinear recursive identification theory in sentencing data analyses. Sci Sin Inform, 2022, 52(10): 1837-1852, doi: 10.1360/SSI-2022-0325
王尔申, 陈纪浩, 宏晨, 刘帆, 陈艾东, 景竑元
中国科学: 信息科学, 2024, 54(7): 1775-1792
摘要
无人机在协同对抗博弈上的应用越来越广泛和深入,尤其是无人机集群在协同探测、全域对抗、策略骗扰等对抗任务中,发挥着越来越重要作用,可靠高效的无人机集群博弈方法是当前的研究热点.本文将反事实基线思想引入到无人机集群对抗博弈环境,提出一种基于反事实多智能体策略梯度(counterfactual multi-agent policy gradients, COMA)的无人机集群对抗博弈方法;在具有无限连续状态、动作的无人机对抗环境中,基于无人机动力学模型,设置符合实际环境的击敌条件和奖励函数,构建基于多智能体深度强化学习的无人机集群对抗博弈模型.红蓝双方无人机集群采取不同的对抗博弈方法,利用多智能体粒子群环境(multi-agent particle environment, MPE)对红蓝双方无人机集群进行非对称性对抗实验,实验结果表明平均累积奖励能够收敛到纳什均衡,在解决4 vs. 8的对抗决策问题方面, COMA方法的平均命中率较DQN和MADDPG分别提升39%和17%,在平均胜率方面比DQN和MADDPG分别提升34%和17%.最后,通过对COMA方法的收敛性和稳定性的深入分析,保证了COMA方法在无人机集群对抗博弈任务上的实用性和鲁棒性.
关键词
无人机集群; 对抗博弈; 多智能体; 深度强化学习; 纳什均衡; UAV swarm; confrontation game; multi-agent; deep reinforcement learning; Nash equilibrium
引用格式
王尔申, 陈纪浩, 宏晨, 等. 引入反事实基线的无人机集群对抗博弈方法. 中国科学: 信息科学, 2024, 54(7): 1775-1792, doi: 10.1360/SSI-2023-0305
Ershen WANG, Jihao CHEN, Chen HONG, et al. UAV swarm adversarial game method with a counterfactual baseline. Sci Sin Inform, 2024, 54(7): 1775-1792, doi: 10.1360/SSI-2023-0305
王常虹, 陈济泽
中国科学: 信息科学, 2023, 53(10): 1965-1981
摘要
本文给出了一种具有高机动性的透射编队控制方法,解决了经典的仿射编队控制受限于平行关系的常约束,无法直接实现战术攻防上常用的前后三角、前后梯形等队形的快速切换问题.该方法受启发于框架理论中的透射不变性原理,通过引入透射像和自应力矩阵来对编队构型进行定义,实现了在仅增加一个领航者且队形凹凸性不变的前提下,任意目标队形的保共线和交比的一致性跟踪,提高了队形的可操作性.所推导的透射可定位条件和队形连续变换条件为透射编队控制的应用提供了理论依据.此外,在攻防切换任务和联合切换任务两种情景下的仿真测试结果也进一步证明了该编队控制方法的可靠性.
关键词
透射变换; 编队控制; 战术任务; 多智能体系统; 自应力矩阵; projective transformation; formation control; tactical tasks; multiagent systems; self-stress matrix
引用格式
王常虹, 陈济泽. 一种基于透射不变性原理的高机动编队控制方法. 中国科学: 信息科学, 2023, 53(10): 1965-1981, doi: 10.1360/SSI-2022-0409
Changhong WANG, Jize CHEN. A high-mobility formation control method based on the principle of projective invariance. Sci Sin Inform, 2023, 53(10): 1965-1981, doi: 10.1360/SSI-2022-0409
仝秉达, 段海滨, 夏洁, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2213-2224
摘要
基于微分对策的追逃博弈和疆土防御问题是多智能体对抗博弈控制的关键问题之一.本文研究了含障碍物的有界区域中多运动体边界防御博弈方法.首先通过对自然界中生物的捕食逃逸行为进行分析,对多运动体边界防御博弈系统进行了建模,得到不同情况下博弈终止条件和价值函数.其次,本文对含障碍环境下博弈双方的主导区域和界栅面进行了分析,并与无障碍情况进行了对比.最后,数值仿真验证了本文提出的多运动体边界防御方法满足微分对策中的鞍点策略条件和有效性.
关键词
捕食逃逸; 协同控制; 边界防御; 微分对策; 鞍点策略; predation and escape; cooperative control; border defense; differential games; saddle point strategy;
引用格式
仝秉达, 段海滨, 夏洁, 等. 障碍环境下基于生物捕食逃逸行为的多运动体边界防御博弈方法. 中国科学: 信息科学, 2022, 52(12): 2213-2224, doi: 10.1360/SSI-2022-0211
Bingda TONG, Haibin DUAN, Jie XIA, et al. Multi-agent border defense differential game based on biological predation and escape behavior in an obstacle environment. Sci Sin Inform, 2022, 52(12): 2213-2224, doi: 10.1360/SSI-2022-0211
胡伟, 雍可南, 陈谋
中国科学: 信息科学, 2022, 52(9): 1711-1726
摘要
无人机在现代战争中已发挥重要作用,为夺取海域制空权,航母配备无人机是必然趋势.面向无人机着舰的高精度控制要求,本文针对存在建模误差与外部干扰的无人机,在动态面控制框架下提出一种基于干扰区间观测器的无人机预设性能着舰飞行控制策略.该策略能够对未知项提供区间估计,在前馈补偿未知项的同时,控制律将根据区间估计的宽度动态调节控制器增益,从而保证无人机的轨迹始终处在着舰轨迹约束范围内.同时,在干扰区间观测器与飞行控制律设计过程中,引入非线性增益,有效地处理了着舰机动中的状态非线性耦合.最后,基于Lyapunov函数方法与不变集理论,给出着舰飞行控制策略的参数设计条件,数值仿真也进一步表明该策略的有效性.
关键词
无人机; 着舰控制; 预设性能控制; 干扰观测器; 区间观测器; unmanned aerial vehicle; carrier landing control; prescribed performance-based control; disturbance observer; interval observer;
引用格式
胡伟, 雍可南, 陈谋. 基于干扰区间观测器的无人机预设性能着舰飞行控制. 中国科学: 信息科学, 2022, 52(9): 1711-1726, doi: 10.1360/SSI-2022-0051
Wei HU, Kenan YONG, Mou CHEN. Disturbance interval observer-based carrier landing control of unmanned aerial vehicles using prescribed performance. Sci Sin Inform, 2022, 52(9): 1711-1726, doi: 10.1360/SSI-2022-0051
程怡新, 许斌, 洪锐
中国科学: 信息科学, 2022, 52(9): 1687-1710
摘要
针对组合动力空天飞行器宽域爬升过程存在的模态转换、气动参数未知以及外界时变干扰等问题,研究了一种基于飞行包线模态划分的切换控制方案.对飞行器六自由度模型和发动机推力模型进行气动和推力特性分析,给出了模态划分结果和模态转换过渡过程.基于切换信号设计建立了空天飞行器切换系统,设计终端滑模软切换控制策略来保证模态的平稳转换,并利用神经网络和非线性扰动观测器协同处理系统不确定性和外界时变干扰.通过多Lyapunov函数方法对闭环切换系统的稳定性进行了分析,且仿真结果验证了所提方法的有效性.
关键词
空天飞行器; 组合动力; 模态转换; 切换控制; 鲁棒自适应控制; aerospace vehicle; combined power; modal transition; switching control; robust adaptive control;
引用格式
程怡新, 许斌, 洪锐. 面向宽域飞行的组合动力空天飞行器切换控制. 中国科学: 信息科学, 2022, 52(9): 1687-1710, doi: 10.1360/SSI-2022-0055
Yixin CHENG, Bin XU, Rui HONG. Switching control of combined power aerospace vehicles for wide-area flight. Sci Sin Inform, 2022, 52(9): 1687-1710, doi: 10.1360/SSI-2022-0055
周同乐, 陈谋
中国科学: 信息科学, 2022, 52(9): 1642-1655
摘要
针对核电站空中动态入侵目标,本文提出了一种基于动态目标概率分布的无人机航路强化学习规划算法,实现了对空中入侵目标的有效拦截.根据入侵目标的状态信息基于概率扩散原理计算目标的概率分布,推理目标可能出现的位置.在此基础上,设计了基于航路点转移规则的行动空间和基于目标概率分布的报酬函数动态更新机制,通过Q-学习不断优化路径,构建了基于目标概率分布和强化学习的无人机航路规划框架,实现了无人机航路强化学习规划.仿真结果表明,该方法能够针对核电站空中入侵目标,实现目标点变化情况下无人机的自主航路规划.
关键词
无人机; 核电站; 航路规划; 动态目标概率分布; 强化学习; UAV; nuclear power plant; path planning; dynamic target probability distribution; reinforcement learning;
引用格式
周同乐, 陈谋. 基于动态目标概率分布的核电站无人机航路强化学习规划. 中国科学: 信息科学, 2022, 52(9): 1642-1655, doi: 10.1360/SSI-2022-0050
Tongle ZHOU, Mou CHEN. Path reinforcement learning planning of nuclear power plant UAVs based on dynamic target probability distribution. Sci Sin Inform, 2022, 52(9): 1642-1655, doi: 10.1360/SSI-2022-0050
张学伟, 田栢苓, 鲁瀚辰, 谌宏鸣, 宗群
中国科学: 信息科学, 2022, 52(9): 1627-1641
摘要
考虑复杂未知多障碍环境对无人机实时轨迹规划性能的影响,提出了基于Tube-MPC和模型预测路径积分(model predictive path integral, MPPI)控制相结合的多无人机分布式实时轨迹规划框架与方法.首先,考虑无人机在多障碍环境下的避碰避障需求,构造代价函数表征轨迹规划过程中的约束条件,将多无人机的轨迹规划问题转化为随机最优控制问题.其次,借鉴Tube-MPC思想,设计并实现了多无人机分布式轨迹规划框架,通过将低频标称控制器与高频辅助控制器串联保证了系统的实时性和鲁棒性.再次,为避免传统方法在求解过程中的维数灾难,提出基于MPPI的多无人机异步轨迹规划方法,该方法通过基于GPU的并行蒙特卡洛(Monte-Carlo)随机前向采样技术,将多无人机随机最优控制问题的求解转化为给定代价函数下对采样轨迹期望的求解,进而获得最优控制序列,其显著特点是求解速度快且避免了基于梯度求解方法对约束条件和代价函数连续性及凸特性的要求.最后,通过Gazebo虚拟仿真平台,在复杂未知多障碍环境下对算法的有效性进行了验证.
关键词
未知多障碍环境; 多无人机; 在线轨迹规划; 模型预测路径积分; GPU并行加速; unknown obstacle-rich environment; multi-UAV; online trajectory planning; model predictive path integral; GPU parallel acceleration;
引用格式
张学伟, 田栢苓, 鲁瀚辰, 等. 面向复杂未知多障碍环境的多无人机分布式在线轨迹规划. 中国科学: 信息科学, 2022, 52(9): 1627-1641, doi: 10.1360/SSI-2022-0048
Xuewei ZHANG, Bailing TIAN, Hanchen LU, et al. Multi-UAV decentralized online trajectory planning in complex unknown obstacle-rich environments. Sci Sin Inform, 2022, 52(9): 1627-1641, doi: 10.1360/SSI-2022-0048
王浩淼, 段海滨, 魏晨
中国科学: 信息科学, 2022, 52(9): 1598-1609
摘要
无人机集群动态资源分配是其任务规划的挑战性关键技术难题.本文提出了一种基于合作竞争机制的动态资源分配方法,将无人机集群与网络进化博弈模型进行对应,建立了基于无人机拓扑网络的博弈模型,通过设计针对特殊个体的调控规则,达到提升系统平均收益的目的.最后,通过无人机博弈模型的仿真实验,根据网络结构、模型参数,以及不同激发机制下系统的稳态结果,验证了本文所提无人机动态资源分配方法的可行性和有效性.
关键词
无人机集群; 公共物品博弈; 动态资源分配; 合作机制; 竞争机制; UAV swarm; public goods game; dynamic resource allocation; cooperative mechanism; competition mechanism;
引用格式
王浩淼, 段海滨, 魏晨. 基于合作竞争公共物品博弈的无人机集群动态资源分配. 中国科学: 信息科学, 2022, 52(9): 1598-1609, doi: 10.1360/SSI-2021-0416
Haomiao WANG, Haibin DUAN, Chen WEI. Dynamic resource allocation of UAV swarms based on cooperative and competitive public goods game. Sci Sin Inform, 2022, 52(9): 1598-1609, doi: 10.1360/SSI-2021-0416
潘豪, 胡瑞光, 宋征宇, 邵梦晗
中国科学: 信息科学, 2022, 52(5): 870-889
摘要
飞行故障在线自主辨识与控制重构是实现航天智能飞行的一个重要标志.本文针对运载火箭飞行中的推力矢量极性错误,研究了基于人工神经网络的故障识别与自主重构方法.在明确故障模式基础上,结合扩张状态观测器(extended state observer, ESO)观测结果,提出了考虑模型偏差的仿真训练样本设计方法,并分别采用基于反向传播(back propagation, BP)神经网络和长短时记忆(long short term memory, LSTM)网络方法进行了故障辨识设计,仿真结果表明,两种方法均具有较高识别准确度,均可实现推力矢量极性错误下的平稳自主重构,相比而言,基于滑窗时间序列的LSTM网络方法更具优势,具有较高的识别准确度.
关键词
极性错误; 自主重构; 扩张状态观测器; 反向传播; 长短时记忆; polarity errors; autonomous reconstruction; extended state observer(ESO); back propagation(BP); long short term memory(LSTM);
引用格式
潘豪, 胡瑞光, 宋征宇, 等. 推力矢量极性错误下的飞行控制自主重构技术. 中国科学: 信息科学, 2022, 52(5): 870-889, doi: 10.1360/SSI-2021-0305
Hao PAN, Ruiguang HU, Zhengyu SONG, et al. Autonomous reconfiguration of flight control under thrust vector polarity errors. Sci Sin Inform, 2022, 52(5): 870-889, doi: 10.1360/SSI-2021-0305
石永霞, 胡庆雷, 邵小东
中国科学: 信息科学, 2022, 52(3): 506-520
摘要
针对角速度受限和通信资源有限的航天器姿态系统,考虑转动惯量难以精确获得并且存在外部干扰的情况,提出一种基于神经网络的自适应事件触发姿态机动控制算法.该算法首先基于预设性能技术,将角速度受限约束转换为性能边界约束,进一步通过误差转换,建立姿态系统的等效误差模型,将存在角速度约束的航天器姿态系统机动控制问题巧妙地转化为无约束误差系统的状态有界稳定控制问题;然后,选用径向基神经网络设计自适应律,在线逼近系统中由未知转动惯量带来的不确定性项.与此同时,考虑到星载通信资源有限的问题,通过建立触发控制信号与实时控制信号之间的显式关系,设计一个统一的时变事件触发机制,当触发条件满足时同步更新控制器和自适应律,大大减少了控制器和执行器之间频繁的网络信号传输.此外,触发机制中时变项的引入严格保证了触发控制无Zeno现象发生.最后,仿真结果表明了所提出的姿态控制算法不但能够保证航天器高精度、高稳定度、高鲁棒性地完成指定姿态机动任务,而且可以减少大约97.50%的控制信号更新,这大大缓解了航天器的通信负担.
关键词
航天器; 角速度受限; 预设性能控制; 通信资源有限; 事件触发机制; spacecraft; angular velocity constraint; prescribed performance control; limited communication resources; event-triggered mechanism;
引用格式
石永霞, 胡庆雷, 邵小东. 角速度受限下航天器姿态机动事件触发控制. 中国科学: 信息科学, 2022, 52(3): 506-520, doi: 10.1360/SSI-2021-0136
Yongxia SHI, Qinglei HU, Xiaodong SHAO. Event-triggered attitude maneuver control of spacecraft under angular velocity constraints. Sci Sin Inform, 2022, 52(3): 506-520, doi: 10.1360/SSI-2021-0136
邓甲, 王付永, 刘忠信, 陈增强
中国科学: 信息科学, 2023, 53(1): 97-110
摘要
针对无向通信拓扑下二阶多智能体系统的一致性问题,本文提出了一种基于自适应动态时钟的新型事件触发控制策略.智能体根据自身的动态时钟来确定触发时刻,在触发时刻向邻居广播自身的状态信息并自适应重置时钟.每个智能体只获取邻居在触发时刻的状态信息,且仅依赖自身的状态和邻居在触发时刻的状态来更新时钟和控制信号,无需使用邻居的实时状态信息,也无需使用通信拓扑的任何全局信息.所设计的控制策略有效避免了连续通信,并且是完全分布式的.利用代数图论以及Lyapunov稳定性分析方法证明了所提出的控制策略能保证系统是渐近稳定的并且不存在Zeno行为.仿真示例进一步验证了所提出控制策略的有效性.
关键词
完全分布式一致性; 多智能体系统; 事件触发控制; 自适应动态时钟; Zeno行为; fully distributed consensus; multi-agent systems; event-triggered control; adaptive dynamic clock; Zeno behavior;
引用格式
邓甲, 王付永, 刘忠信, 等. 基于自适应动态时钟通信的二阶多智能体系统完全分布式一致性. 中国科学: 信息科学, 2023, 53(1): 97-110, doi: 10.1360/SSI-2021-0426
Jia DENG, Fuyong WANG, Zhongxin LIU, et al. Fully distributed consensus control for second-order multi-agent systems based on adaptive dynamic clock communication. Sci Sin Inform, 2023, 53(1): 97-110, doi: 10.1360/SSI-2021-0426
宿浩, 张宝琳, 籍艳, 蔡智辉, 薛健, 马慧, 郑元世
中国科学: 信息科学, 2022, 52(12): 2195-2212
摘要
为提高移动多智能体系统的覆盖控制效率,通常要求移动智能体在覆盖控制过程中进行多信息甚至全信息交互.在此情形下,覆盖控制成本和能耗将大幅增加.如何在提高移动智能体覆盖效率的同时,尽可能降低控制成本一直是移动智能体覆盖控制领域的重要课题之一.本文研究非完全信息条件下的移动多智能体覆盖控制方法,提出了基于虚拟排斥力的移动多智能体覆盖控制合作博弈算法.首先,将移动多智能体集群分解为若干个子集群,群中每个智能体只能观测到各自周围一定范围内其他智能体的信息,将移动多智能体集群的覆盖控制问题转化为非完全信息条件下移动多智能体子群的合作博弈分布覆盖问题;其次,给出了各移动智能体子群的博弈规则,并提出了一种基于虚拟排斥力的智能体分布覆盖博弈决策策略,用以计算并确定集群中每个智能体在覆盖控制过程中的新候选位置;第三,将移动多智能体系统覆盖控制问题分解为以刚性虚拟结构为参照系的覆盖控制问题,简化了多智能体系统覆盖控制中位移路径的规划设计.仿真算例表明,本文提出的基于虚拟排斥力的覆盖控制合作博弈算法,可以实现不完全信息条件下移动多智能体系统的分布覆盖控制任务,有效节约移动智能体的覆盖控制成本;同时,和已有的覆盖控制算法相比,本文提出的动态合作博弈覆盖算法,覆盖控制过程中智能体移动次数更少,覆盖率更高.
关键词
动态博弈; 网络覆盖; 分布算法; 多智能体系统; 虚拟排斥力; dynamic game; network coverage; distributed algorithms; multi-agent systems; virtual repulsive force;
引用格式
宿浩, 张宝琳, 籍艳, 等. 基于虚拟排斥力的移动多智能体覆盖控制动态博弈算法. 中国科学: 信息科学, 2022, 52(12): 2195-2212, doi: 10.1360/SSI-2022-0219
Hao SU, Bao-Lin ZHANG, Yan JI, et al. Dynamic game coverage control algorithms for multiple mobile agents through virtual repulsive force. Sci Sin Inform, 2022, 52(12): 2195-2212, doi: 10.1360/SSI-2022-0219
徐广通, 孟子阳, 龙腾, 王祝, 孙景亮
中国科学: 信息科学, 2022, 52(8): 1527-1541
摘要
针对通信距离受限下无人机集群轨迹规划时效性与安全性问题,本文构建了分布式滚动规划框架,提出了局部优先级解耦的序列凸优化方法 (local-priority-decoupled sequential convex programming,LPD-SCP),将集群轨迹规划问题分解为一系列短时域单机凸优化子问题,在保证求解效率的基础上确保了轨迹的安全性.本文推导了确保飞行安全的可行规划时域长度,设计了通信距离受限的局部优先级解耦机制,根据通信状态动态调整邻域内无人机规避优先级,实现通信距离受限下的机间避撞.更进一步,定制了轨迹时间一致协调策略,通过更新飞行时间下边界约束,实现邻域内无人机飞行时间一致性.理论分析了所提LPD-SCP能够通过多次滚动规划获得满足约束的集群轨迹.数值仿真试验结果表明:LPD-SCP能够在通信距离受限条件下规划出满足飞行动力学、机间避碰与时间一致约束的协同轨迹,且15架无人机短时域集结轨迹生成时间不大于4 s.
关键词
集群轨迹规划; 通信距离受限; 滚动规划架构; 局部优先级解耦; 序列凸优化; trajectory planning of swarms; communication distance limitation; receding planning framework; local priority decoupling; sequential convex programming;
引用格式
徐广通, 孟子阳, 龙腾, 等. 通信距离受限下无人机集群轨迹分布式滚动规划. 中国科学: 信息科学, 2022, 52(8): 1527-1541, doi: 10.1360/SSI-2021-0251
Guangtong XU, Ziyang MENG, Teng LONG, et al. Trajectory distributed receding planning for UAV swarms subject to limited communication distance. Sci Sin Inform, 2022, 52(8): 1527-1541, doi: 10.1360/SSI-2021-0251
徐雍, 饶红霞, 王卓, 鲁仁全, 李宗
中国科学: 信息科学, 2022, 52(8): 1513-1526
摘要
本文研究了离散不确定非线性时滞系统在网络传输不可靠情况下的状态估计问题.针对网络传输丢包问题,采用伯努利(Bernoulli)随机模型,建立了控制信号和输入信号的不可靠传输模型.本文通过状态扩展的方法处理不确定非线性项,得到了扩展状态系统.基于不可靠的控制和测量信息,设计了状态预测器和估计器,并给出相应的误差系统.通过设计最优估计器增益,本文给出了状态预测误差协方差的迭代公式.为了进一步提高状态估计器的精度,设计了一种新型的参数迭代优化方法.针对状态预测误差协方差,本文得到了其稳定性的判别准则.最后,通过一例数值仿真,验证了所得结论的有效性.
关键词
网络化控制系统; 扩展状态估计; 时滞; 不确定非线性; 丢包; networked control system; extended state estimation; time delay; nonlinear uncertainty; packet dropout;
引用格式
徐雍, 饶红霞, 王卓, 等. 网络化不确定非线性时滞系统的状态估计. 中国科学: 信息科学, 2022, 52(8): 1513-1526, doi: 10.1360/SSI-2021-0228
Yong XU, Hongxia RAO, Zhuo WANG, et al. State estimation for networked uncertain nonlinear systems with time-delays. Sci Sin Inform, 2022, 52(8): 1513-1526, doi: 10.1360/SSI-2021-0228
邵晋梁, 石磊, 李彤, 张希琳
中国科学: 信息科学, 2022, 52(8): 1500-1512
摘要
本文提出分布式符号簇一致协议,研究合作竞争网络下的多智能体系统链路故障检测问题.首先,应用符号图理论和非负矩阵理论的相关知识分析智能体在符号簇一致性协议下的渐近收敛性和最终收敛状态.其次,通过观察链路发生故障前后智能体收敛状态的变化,给出精确判断故障链路的方法.该方法同时适用于单链路故障和多链路故障的情形.最后,通过数值模拟验证该方法的有效性.
关键词
多智能体系统; 合作竞争网络; 链路故障检测; 一致性; 分布式协议; multi-agent systems; cooperation-competition networks; link failure detection; consensus; distributed protocol;
引用格式
邵晋梁, 石磊, 李彤, 等. 合作竞争网络下的多智能体系统链路故障检测. 中国科学: 信息科学, 2022, 52(8): 1500-1512, doi: 10.1360/SSI-2021-0120
Jinliang SHAO, Lei SHI, Tong LI, et al. Link failure detection for multi-agent systems on cooperation-competition networks. Sci Sin Inform, 2022, 52(8): 1500-1512, doi: 10.1360/SSI-2021-0120
马乐乐, 刘向杰, 高福荣
中国科学: 信息科学, 2024, 54(7): 1752-1774
摘要
迭代学习模型预测控制(iterative learning model predictive control, ILMPC)作为一种广泛应用于批次生产过程的数据驱动智能控制策略,能够在沿批次逐步提高跟踪性能的同时沿时间不断抑制实时干扰.现有ILMPC算法的点对点学习机制依赖于批次运行工况的强一致性,以此保证当前批次与历史批次间的有效信息传递.然而,生产需求和生产环境的变化通常会导致各批次的操作轨迹和操作周期存在差异,从而使得历史批次提供的先验知识对于后续批次呈现出不精确性和不完整性.为了提高ILMPC在变运行工况条件下的适应性和灵活性,本文提出了一种具有知识迁移机制的数据驱动ILMPC策略.建立自适应深度神经网络(deep neural network, DNN)沿批次学习ILMPC控制行为,实现历史控制经验在当前批次工况下的全面转换.为抑制DNN前期估计误差的影响,在知识迁移机制下进一步构建Tube控制结构下的ILMPC算法,保证ILMPC系统的时域稳定性和迭代域收敛性.针对非线性注塑过程的仿真实验验证了在操作轨迹和操作周期同时变化时,所提方法在跟踪精度和收敛速度方面具有明显优势.
关键词
迭代学习模型预测控制; 知识迁移; 数据驱动; 变运行工况; iterative learning model predictive control; knowledge transfer; data-driven; trial-varying operating conditions
引用格式
马乐乐, 刘向杰, 高福荣. 基于知识迁移的数据驱动迭代学习模型预测控制. 中国科学: 信息科学, 2024, 54(7): 1752-1774, doi: 10.1360/SSI-2023-0279
Lele MA, Xiangjie LIU, Furong GAO. Data-driven iterative learning model predictive control based on knowledge transfer. Sci Sin Inform, 2024, 54(7): 1752-1774, doi: 10.1360/SSI-2023-0279
向飞宇, 薛文超, 陈森, 张言军
中国科学: 信息科学, 2023, 53(6): 1163-1180
摘要
推力矢量飞行器具有气动舵、推力矢量等改变本体姿态的多类控制输入,这使得推力矢量飞行器具备在日益复杂的空天环境下的高机动控制能力.同时,推力矢量飞行器的控制系统模型为非仿射非线性结构,并且包含复杂的不确定性,这使得其控制问题具有挑战性.本文针对三自由度推力矢量飞行器的角速度跟踪控制问题,采用自抗扰控制方法,实现了飞行过程中不确定性的主动补偿;基于气动舵优先和误差最小的准则,得到了控制输入最优解具有显式表达式的条件;针对控制输入最优解无法得到显式表达式的情况,证明了最优解一定在约束边界上,且可通过有限步求解;结合实际控制分配,定量给出了闭环系统的跟踪误差和估计误差的特性.在典型仿真环境下,本文提出的控制方法表现出有效性和鲁棒性,能够在强非线性和大范围不确定性下实现角速度跟踪目标.
关键词
推力矢量飞行器; 自抗扰控制; 扩张状态观测器; 控制分配; 自由度; thrust-vectored aircraft; active disturbance rejection control; extended state observer; control allocation; degree of freedom;
引用格式
向飞宇, 薛文超, 陈森, 等. 基于自抗扰的三自由度推力矢量飞行器的控制分配方法与理论. 中国科学: 信息科学, 2023, 53(6): 1163-1180, doi: 10.1360/SSI-2022-0018
Feiyu XIANG, Wenchao XUE, Sen CHEN, et al. ADRC-based control allocation method and theory for 3-DOF thrust-vectored aircraft. Sci Sin Inform, 2023, 53(6): 1163-1180, doi: 10.1360/SSI-2022-0018
孙霄阳, 周平
中国科学: 信息科学, 2023, 53(4): 715-736
摘要
PID控制一直是应用最广泛的工业控制技术.但是基本PID控制算法仅考虑了动态系统输入–输出的外部特性,缺乏对系统内部状态信息的运用,因而在控制非线性耦合动态系统时往往难以获得满意的控制性能.本文在不改变原有PID控制设置的基础上,提出一种通过未知状态估计与神经网络控制补偿的增强PID (enhanced PID, En-PID)控制方法,可显著增强原有PID控制的性能.首先,采用扩展卡尔曼(Kalman)滤波技术对未知关键状态进行精确估计,并将状态估计值作为神经网络补偿控制器的输入,从而将基本PID控制算法并未使用的过程状态信息引入到控制输入;其次,采用K均值聚类算法求取历史输入数据的聚类中心,以此作为径向基函数(radial basis function, RBF)神经网络补偿器隐含层的中心向量;构建关于控制误差熵的优化性能指标,采用梯度下降算法对神经网络补偿器输出层权值向量进行优化和修正;最后,将RBF网络求取的补偿控制输入与原有PID控制器的基本控制输入进行综合,并共同作用于实际被控系统,实现高性能控制.理论分析和污水处理过程控制实验验证了所提方法的先进性和实用性.
关键词
增强PID控制; 扩展卡尔曼滤波; 径向基函数神经网络; 控制补偿; 熵; enhanced PID control; extended Kalman filtering; RBF neural network; control compensation; entropy;
引用格式
孙霄阳, 周平. 基于未知状态估计与神经网络补偿的增强PID控制方法. 中国科学: 信息科学, 2023, 53(4): 715-736, doi: 10.1360/SSI-2022-0084
Xiaoyang SUN, Ping ZHOU. Enhanced PID control method based on unknown state estimation and neural network-based compensation. Sci Sin Inform, 2023, 53(4): 715-736, doi: 10.1360/SSI-2022-0084
李鸿一, 王琰, 姚得银, 周琪, 鲁仁全
中国科学: 信息科学, 2023, 53(1): 66-80
摘要
针对一类具有外部干扰的多四旋翼无人机姿态系统,研究其在无向拓扑下的姿态跟踪问题,提出一种基于事件触发机制的鲁棒自适应滑模控制方法.首先,建立多四旋翼无人机的姿态动力学模型,并引入干扰观测器,对系统受到的未知外部干扰进行估计.其次,为了节约四旋翼无人机的网络传输资源,本文在传感器和控制器之间引入事件触发机制,并结合鲁棒滑模控制算法,设计基于事件触发的鲁棒自适应滑模控制器.此外,通过Lyapunov稳定性理论证明闭环系统中所有信号最终有界,并证明所设计的事件触发机制能够有效避免Zeno行为.最后,仿真结果验证所提控制方法的有效性.
关键词
滑模控制; 事件触发机制; 干扰观测器; 姿态跟踪; 多四旋翼无人机系统; sliding mode control; event-triggered mechanism; disturbance observer; attitude tracking; MQUAVs;
引用格式
李鸿一, 王琰, 姚得银, 等. 基于事件触发机制的多四旋翼无人机鲁棒自适应滑模姿态控制. 中国科学: 信息科学, 2023, 53(1): 66-80, doi: 10.1360/SSI-2021-0358
Hongyi LI, Yan WANG, Deyin YAO, et al. Robust adaptive sliding mode attitude control of MQUAVs based on event-triggered mechanism. Sci Sin Inform, 2023, 53(1): 66-80, doi: 10.1360/SSI-2021-0358
范利蓉, 王芳, 周超, 王坤
中国科学: 信息科学, 2022, 52(7): 1287-1301
摘要
本文针对非线性多智能体系统一致性跟踪控制问题,设计自适应事件触发控制策略.首先,通过引入非对称障碍Lyapunov函数,使输出误差满足非对称约束条件.其次,采用Lyapunov-Krasovskii(L-K)泛函和Young不等式消除状态时延的影响.利用模糊逻辑系统逼近未知非线性函数.再次,结合有界估计法和光滑函数有效补偿执行器故障和网络引起的误差.基于Lyapunov稳定性理论证明闭环系统半全局有界稳定.最后,通过仿真验证所设计控制策略的有效性.
关键词
多智能体系统; 状态时延; 事件触发控制; 非对称误差约束; 执行器故障; multi-agent systems; state time-delays; event-triggered control; asymmetric error constraints; actuator faults;
引用格式
范利蓉, 王芳, 周超, 等. 执行器故障和非对称误差约束下的时延多智能体系统自适应事件触发控制. 中国科学: 信息科学, 2022, 52(7): 1287-1301, doi: 10.1360/SSI-2020-0391
Lirong FAN, Fang WANG, Chao ZHOU, et al. Adaptive event-triggered control for time-delay multi-agent systems with actuator faults and asymmetric error constraints. Sci Sin Inform, 2022, 52(7): 1287-1301, doi: 10.1360/SSI-2020-0391
姚慧颖, 赵志良, 陈森, 柴天佑
中国科学: 信息科学, 2022, 52(3): 483-505
摘要
本文针对一类具有强耦合不确定性因素的连续时间多输入多输出非线性系统,提出了基于历史采样数据的不确定性因素补偿控制策略(sampled-data-based compensation control, SDBCC).与基于观测器的不确定性因素补偿控制不同,本文首先利用当前以及历史采样数据计算出由系统非线性耦合未建模动态和外部扰动构成的总扰动在前一采样周期内某时刻的精确值,然后利用该精确值在反馈环节对总扰动进行补偿以消除它的不利影响.连续时间系统在数据驱动的反馈控制作用下构成了一个混杂闭环控制系统,这连同系统的强耦合非线性不确定性因素为控制闭环系统的稳定性收敛性分析带来了挑战.为克服这一难题,本文发展了基于特征值和迭代序列的分析方法,证明了当系统跟踪目标为有界函数时,跟踪误差可随采样周期的减小而任意小,进而当跟踪目标为常数,并且系统的非线性项为时不变连续可微函数时,跟踪误差随时间趋于无穷大而趋近于零.二自由度无人机姿态控制的仿真结果验证了本文所提出方法的有效性和优越性.
关键词
不确定性; 非线性; MIMO系统; PID控制; 数据驱动控制; uncertainty; nonlinearity; MIMO system; PID control; data-driven control;
引用格式
姚慧颖, 赵志良, 陈森, 等. 非线性多输入多输出连续时间系统基于历史采样数据的不确定性因素补偿控制. 中国科学: 信息科学, 2022, 52(3): 483-505, doi: 10.1360/SSI-2021-0222
Huiying YAO, Zhiliang ZHAO, Sen CHEN, et al. Sampled-data-based uncertainty compensation control for a class of continuous-time nonlinear MIMO systems. Sci Sin Inform, 2022, 52(3): 483-505, doi: 10.1360/SSI-2021-0222
严锐驰, 李帅, 王晨, 吴琦, 孙基男, 张世琨, 谢广明
中国科学: 信息科学, 2024, 54(7): 1709-1729
摘要
随着无人机技术的发展,无人机集群对抗已成为国内外研究热点.现有决策算法的研究主要集中于同构无人机集群对抗场景,且当应用于更复杂对抗场景时,存在奖励函数设计难度大、决策实时性难以满足等问题.为此,本文针对异构无人机集群对抗的实时机动决策问题展开研究.首先,构建了一个长机–僚机异构无人机集群的对抗仿真环境,其中,长机和僚机具有不同的机动和攻击能力,且对胜负具有不同影响力.其次,本文提出了一种基于多智能体强化学习的分布式无人机集群协同机动控制算法,并设计了一套结合课程学习和自博弈的策略训练与优化方法.通过设计简单的稀疏奖励结合课程学习方法即可学到异构无人机集群协同机动策略;引入自博弈对抗方式,使得对手无人机的策略更具针对性,以提升对抗的强度,从而进一步优化机动策略,使其更贴近实际需求.最后,仿真验证了本文所提方法的有效性和可扩展性.
关键词
集群对抗; 协同决策; 自博弈; 多智能体强化学习; 无人机; swarm confrontation; cooperative decision-making; self-play; multi-agent reinforcement learning; UAV
引用格式
严锐驰, 李帅, 王晨, 等. 基于自博弈强化学习的异构无人机集群协同对抗决策方法. 中国科学: 信息科学, 2024, 54(7): 1709-1729, doi: 10.1360/SSI-2023-0267
Ruichi YAN, Shuai LI, Chen WANG, et al. Cooperative decision-making for heterogeneous UAV swarm confrontation based on self-play reinforcement learning. Sci Sin Inform, 2024, 54(7): 1709-1729, doi: 10.1360/SSI-2023-0267
张新钰, 国纪龙, 李骏, 李德毅, 张世焱, 沈思甜, 吴凡, 刘华平
中国科学: 信息科学, 2024, 54(6): 1419-1440
摘要
智能驾驶汽车已成为人们关注的热点话题之一.然而,现有的智能驾驶技术仍面临一系列挑战,如交通障碍物的遮挡所引起的模型漏检,以及当汽车驶入隧道等光线骤变的场景时所引起的传感器感知精度下降导致的误检问题等.为保证复杂场景下车辆的感知安全,智能驾驶多模态感知技术应运而生.然而,现有的多模态融合方法仍局限于对检测精度的提升,缺乏感知过程的可解释性,并缺少对模型感知过程的评价指标.本文从信息论角度出发,按照通信模型的构建方法对感知模型进行设计,提出了一种基于信源信道联合编码理论的多模态融合感知模型,从理论上对模型的感知过程进行解释.同时,提出了一种新的评价指标——平均信息熵变(average entropy variation, AEV),用AEV来实时反映模型与外界感知交互过程中的稳定性.进而,对多模态模型的感知过程进行量化分析,增加模型的可解释性.最后,与其他的感知模型在KITTI数据集的评估结果进行比较,我们的模型在经过相似的网络结构时平均信息熵变下降到0.5904,更好地保证了检测任务的感知安全.
关键词
可解释性; 信息论; 信源信道联合编码; 多模态融合; 智能驾驶; interpretability; theory of information; joint source-channel coding; multimodal fusion; intelligent driving
引用格式
张新钰, 国纪龙, 李骏, 等. 基于信息论的智能驾驶可解释多模态感知. 中国科学: 信息科学, 2024, 54(6): 1419-1440, doi: 10.1360/SSI-2023-0086
Xinyu ZHANG, Jilong GUO, Jun LI, et al. Information-theoretic-based interpretable multimodal perception for intelligent vehicles. Sci Sin Inform, 2024, 54(6): 1419-1440, doi: 10.1360/SSI-2023-0086
刘梅, 尚明生
中国科学: 信息科学, 2024, 54(4): 960-975
摘要
冗余机器人在智能制造、救灾抢险与太空探索等领域扮演着重要角色.然而,对结构信息不准确或未知的冗余机器人进行运动规划是一个棘手的问题.此外,若不考虑冗余机器人末端执行器的姿态约束,可能会因姿态的不可控性导致任务失败.为解决该问题,在考虑末端姿态保持和多层关节物理限制的基础上,本文针对模型未知的冗余机器人提出了一种基于数据驱动技术的双层运动规划方案.该方案在关节角加速度层求解的同时能实现最小化关节角速度范数的要求.进而,构建一个离散神经动力学求解器以在线求解该方案.理论分析、仿真和物理实验验证了所提数据驱动的冗余机器人双层运动规划方案的可行性和有效性.
关键词
冗余机器人; 姿态保持; 数据驱动; 神经动力学; 非线性优化; redundant robots; orientation maintaining; data-driven; neural dynamics; nonlinear optimization
引用格式
刘梅, 尚明生. 数据驱动的冗余机器人双层运动规划. 中国科学: 信息科学, 2024, 54(4): 960-975, doi: 10.1360/SSI-2023-0100
Mei LIU, Mingsheng SHANG. Data-driven double-level motion planning for redundant robots. Sci Sin Inform, 2024, 54(4): 960-975, doi: 10.1360/SSI-2023-0100
张冲, 伍益明, 徐明, 郑宁
中国科学: 信息科学, 2024, 54(4): 927-943
摘要
针对多智能体系统通信网络遭受欺骗攻击与隐私窃取问题,本文提出了一种新的具备隐私保护能力的多智能体系统弹性一致性算法.首先考虑到多智能体系统在信息传输环节直接将真实状态信息暴露给外界的问题,设计了一种基于状态分配思想的节点状态信息处理机制,来保证系统中节点状态信息隐私的安全性.其次考虑到外部攻击者对系统收敛的影响,在状态分配机制上进一步引入了检测环节,从而保证系统安全收敛.然后通过数学理论分析证明了算法能够有效保护节点初始状态信息隐私的同时能够保证系统实现弹性一致性收敛.最后通过数值仿真实验与对比实验,进一步验证了本文算法的有效性.
关键词
多智能体系统; 弹性一致性; 欺骗攻击; 隐私保护; 网络安全; multi-agent systems; resilient consensus; deception attack; privacy-preserving; cyber security
引用格式
张冲, 伍益明, 徐明, 等. 隐私保护下的多智能体系统弹性一致性控制. 中国科学: 信息科学, 2024, 54(4): 927-943, doi: 10.1360/SSI-2023-0124
Chong ZHANG, Yiming WU, Ming XU, et al. Resilient consensus control of multi-agent systems under privacy protection. Sci Sin Inform, 2024, 54(4): 927-943, doi: 10.1360/SSI-2023-0124
郭胜辉, 罗世坚, 黄大荣, 宋家锋
中国科学: 信息科学, 2024, 54(2): 394-412
摘要
针对含有未知输入和外部干扰的非线性自动驾驶车辆时变跟驰队列系统,研究系统部分状态可测情况下的车辆道路跟驰和状态一致性控制问题.基于车辆跟驰和二自由度动力学模型,得到含有外部干扰和未知输入的离散化状态方程,利用前导跟驰特性,得到自动驾驶车辆跟驰队列系统;利用比例积分状态观测器解决系统部分状态不可测问题,提出一种基于观测器实现含有未知输入和外部干扰的自动驾驶车辆状态一致性控制协议;将观测器估计效果和一致性控制问题转化为误差系统的稳定性问题,由此构造Lyapunov-Krasovkii函数,利用离散系统稳定性理论推导出一个充分条件;通过求解线性矩阵不等式(linear matrix inequality, LMI)得到跟驰系统的增益矩阵和参数矩阵,利用H_∞性能指标分析系统鲁棒性.仿真结果表明:所设计观测器能够估计未知输入、外部干扰和系统状态,并且基于观测器设计能够使自动驾驶车辆道路跟驰和状态达到一致.
关键词
智慧交通; 自动驾驶车辆; 道路跟驰; 多智能体系统; 一致性控制; 外部干扰; intelligent transportation; autonomous vehicle system; path following; multiagent system; consistency control; external disturbance
引用格式
郭胜辉, 罗世坚, 黄大荣, 等. 自动驾驶车辆道路跟驰与状态一致性控制. 中国科学: 信息科学, 2024, 54(2): 394-412, doi: 10.1360/SSI-2022-0424
Shenghui GUO, Shijian LUO, Darong HUANG, et al. Path following and status consistency control of autonomous vehicles. Sci Sin Inform, 2024, 54(2): 394-412, doi: 10.1360/SSI-2022-0424
姚陈鹏, 石文博, 刘成菊, 陈虹, 陈启军
中国科学: 信息科学, 2023, 53(12): 2303-2324
摘要
作为移动机器人的核心技术之一,导航技术涉及感知、决策、控制等多层架构,包含建图、定位、规划等主要模块,兼容经典控制与机器学习等多样算法,其相关研究涉及面广,时间跨度大,联系较为不明显.为梳理不同工作间关联,帮助快速了解移动机器人导航技术发展与挑战,本文从“导航”的词语释义与数学描述出发,以“导”与“航”两个主要目标为线索贯穿全文.通过分析不同环境下的导航应用局限,探究环境的空间复杂性与时间不确定性对导航技术产生的影响,阐明复杂场景应用下的研究现状与关键挑战.全文借助对近几十年来相关文献的归类梳理,寻找不同研究间的相关联系、研究初衷以及可能方案,拟在帮助读者加深对导航技术理解的同时,为后续研究提供思路参考.
关键词
移动机器人; 导航技术; 导航效率; 导航安全; 复杂环境; mobile robot; navigation technologies; navigation efficiency; navigation safety; complex environment
引用格式
姚陈鹏, 石文博, 刘成菊, 等. 移动机器人导航技术综述. 中国科学: 信息科学, 2023, 53(12): 2303-2324, doi: 10.1360/SSI-2022-0420
Chenpeng YAO, Wenbo SHI, Chengju LIU, et al. An overview of mobile robot navigation technology. Sci Sin Inform, 2023, 53(12): 2303-2324, doi: 10.1360/SSI-2022-0420
吴磊, 郭斌, 徐若楠, 刘思聪, 丁亚三, 党朝辉
中国科学: 信息科学, 2023, 53(11): 2107-2151
摘要
模块化机器人具备鲁棒、低成本和多功能性等优势,近年来得到研究人员的广泛关注,并在多领域不断替代或拓展传统的单体机器人.随着模块化机器人技术的发展,以及其与泛在计算、群体智能等前沿技术的紧密融合,将不断拓展在太空探测、智能制造、灾难救援等领域的应用,成为人机物三元融合空间中无处不在的新型智能终端.本文基于泛在计算新视角,对近年来群智模块化机器人领域的工作进行了系统性研究,构建并拓展其概念空间体系,阐释其自重构、自组织、自适应、持续演化等六大关键技术及最新发展趋势,进而介绍其在典型领域的创新应用.最后,对群智模块化机器人的未来发展方向及开放性挑战进行了分析和展望.
关键词
模块化机器人; 群体智能; 泛在计算; 自重构; 自组织; modular robots; crowd intelligence; ubiquitous computing; self-reconfiguration; self-organizing
引用格式
吴磊, 郭斌, 徐若楠, 等. 泛在计算视角下的群智模块化机器人. 中国科学: 信息科学, 2023, 53(11): 2107-2151, doi: 10.1360/SSI-2022-0385
Lei WU, Bin GUO, Ruonan XU, et al. Emergence of crowd modular robotics: a ubiquitous computing perspective. Sci Sin Inform, 2023, 53(11): 2107-2151, doi: 10.1360/SSI-2022-0385
潘泉, 郭亚宁, 吕洋, 李扬, 谈政
中国科学: 信息科学, 2023, 53(8): 1608-1628
摘要
自主与安全平衡是无人机技术与产业健康、快速发展的战略需求和核心关键.在同时面对“不断提升的无人自主飞行性能”与“日趋严峻的物理、信息、智能等多域安全威胁”的挑战下,仅借鉴有人机安全体系,适度拓展适航飞行和感知规避为核心的安全架构已不能满足现在和未来无人机系统的安全需求,构建无人机自主安全新架构显得十分必要和迫切.本文从自主性这一无人机固有的本质属性出发,初步研究了无人机自主安全架构,重点定义和表征了“无人机自主安全”新概念、构建了面向多域安全威胁和系统高度自主的无人机系统自主安全新模型、提出了无人机系统自主安全能力分级,为我国无人机行业健康快速发展提供基础支撑,为其他无人系统安全体系建立提供借鉴.
关键词
无人机系统; 多域威胁; 自主安全; 资源配置; unmanned aerial system; multi-domain threat; autonomous safety and security; resource configuration;
引用格式
潘泉, 郭亚宁, 吕洋, 等. 无人机系统自主安全: 定义、建模与分级. 中国科学: 信息科学, 2023, 53(8): 1608-1628, doi: 10.1360/SSI-2022-0338
Quan PAN, Yaning GUO, Yang LYU, et al. Autonomous safety and security of UAV systems: definition, modeling, and gradation. Sci Sin Inform, 2023, 53(8): 1608-1628, doi: 10.1360/SSI-2022-0338
中国科学: 信息科学, 2023, 53(7): 1233-1261
摘要
无人机是多样化的民生应用及临地安防技术领域的重要成员,“无人机到底能飞多久?”这个疑问已经在行业内引起了广泛的思考.作为无人机的心脏,其动力系统与无人机的飞行性能有着重要的关系,已成为航空领域最重要的发展方向之一.根据无人机动力系统的分类,本文分析了油动无人机、电动无人机、光动无人机的研究现状以及需要解决的技术问题,并特别关注了如何通过信号处理的方式达到智能飞行器长航时的目标,为无人机的续航能力及其动力的发展提供参考.
关键词
无人机; 智能飞行器; 续航能力; 油动无人机; 电动无人机; 光动无人机; UAVs; intelligent aircraft; endurance; oil-powered UAVs; electric UAVs; optics-driven UAVs;
引用格式
李学龙. 无人机续航能力. 中国科学: 信息科学, 2023, 53(7): 1233-1261, doi: 10.1360/SSI-2023-0130
Xuelong LI. Endurance of unmanned aerial vehicles. Sci Sin Inform, 2023, 53(7): 1233-1261, doi: 10.1360/SSI-2023-0130
肖宏远, 刘成菊, 陈启军
中国科学: 信息科学, 2022, 52(10): 1822-1836
摘要
示教学习是解决仿人机器人动态轨迹规划问题的高效方法.示教轨迹作为一种函数型数据,天然地具有耦合的时空特征,需要在函数型数据分析的理论框架下进行研究.传统的示教学习成果以“预处理”的形式解决上述耦合问题,不能充分利用示教轨迹的函数型数据本质.为了充分利用这一本质,本文采用弹性分析方法,将示教轨迹视作函数型数据,解决它们的时–空特征解耦问题.基于解耦后的示教轨迹,本文建立函数型回归模型并将其应用于动态轨迹的生成,实现示教轨迹在不同任务参数下的泛化.在实验中, JACO-2机械臂学习形态各异的技能并在不同的任务参数下完成任务,验证了提出方法的有效性.本文在统一的数学框架下,基于函数型数据分析的数学方法,解决一类仿人机器人的示教轨迹学习与泛化问题,具有较好的理论统一性与可实践性.
关键词
示教学习; 轨迹生成; 函数型数据; 弹性分析; 函数回归模型; learning from demonstration; trajectory generation; functional data; elastic analysis; functional regression model;
引用格式
肖宏远, 刘成菊, 陈启军. 基于弹性分析与函数回归模型的示教轨迹学习与泛化方法. 中国科学: 信息科学, 2022, 52(10): 1822-1836, doi: 10.1360/SSI-2021-0259
Hongyuan XIAO, Chengju LIU, Qijun CHEN. Learning and generalizing demonstration trajectories based on elastic analysis and the functional regression model. Sci Sin Inform, 2022, 52(10): 1822-1836, doi: 10.1360/SSI-2021-0259
孙永斌, 马宝忠, 贺威, 何修宇, 付强
中国科学: 信息科学, 2022, 52(9): 1656-1671
摘要
仿生扑翼飞行器作为一种新型的飞行器,具有噪声小、隐蔽性好、机动性强、能量利用效率高等优势,在民用和军用领域具有广阔的应用前景.仿生扑翼飞行器的自主飞行能力是高效执行飞行任务的关键.目前,国内外飞行器的自主飞行研究已经取得了一些成果,然而鲜有以仿生扑翼飞行器为载体的研究.仿生扑翼飞行器特有的驱动结构给自主飞行控制研究带来了较大的挑战.本文以仿猎鹰扑翼飞行器作为研究平台设计了自主飞行控制系统.由于仿猎鹰扑翼飞行器的负载较小,本文采用了重量较轻的STM32微型计算平台作为主控芯片设计了硬件系统.由于微型计算平台的算力有限,本文综合考虑制导精度和运算速度,提出了一种线性/非线性切换制导算法,并通过仿真实验与线性制导、非线性制导算法进行了对比,证明了其更加适合于仿猎鹰扑翼飞行器.考虑到仿猎鹰扑翼飞行器的机构滞后问题,对其滚转角和高度设计了一个串级PID控制器.结合面向仿猎鹰扑翼飞行器的地面站软件,最终实现了基于仿猎鹰扑翼飞行器的自主定高圆弧轨迹跟踪任务.
关键词
仿生扑翼飞行器; 自主飞行; 线性制导; 非线性制导; 轨迹跟踪; bionic flapping-wing aircraft; autonomous flight; linear guidance; nonlinear guidance; trajectory tracking;
引用格式
孙永斌, 马宝忠, 贺威, 等. 仿猎鹰扑翼飞行器自主飞行控制系统设计. 中国科学: 信息科学, 2022, 52(9): 1656-1671, doi: 10.1360/SSI-2022-0067
Yongbin SUN, Baozhong MA, Wei HE, et al. Design of an autonomous flight control system for imitation falcon flapping-wing aircraft. Sci Sin Inform, 2022, 52(9): 1656-1671, doi: 10.1360/SSI-2022-0067
李鸿一, 陈锦涛, 任鸿儒, 鲁仁全
中国科学: 信息科学, 2022, 52(9): 1610-1626
摘要
本文面向高层消防救援提出一种基于随机采样的多无人机协同搜索规划方法.首先,受随机树状采样搜索算法启发,提出一种搜索点最优分布方法,利用其在复杂环境下对有限空间重复搜索的特性,同时解决多无人机的路径点分布问题和任务分配问题.其次,设计一种基于交易规则的搜索点优化方法,以进一步提升搜索覆盖范围.然后,利用改进的和声搜索算法得到每架无人机遍历节点的最优顺序,进而获得各无人机的规划路径.最后,采用多线程方法模拟实际任务中的分布式运算,验证所提出方法的可行性.
关键词
高层消防; 随机采样; 和声搜索算法; 多无人机协同; 路径规划; high-rise firefighting; random sampling; harmony search; multi-UAV cooperation; path planning;
引用格式
李鸿一, 陈锦涛, 任鸿儒, 等. 基于随机采样的高层消防无人机协同搜索规划. 中国科学: 信息科学, 2022, 52(9): 1610-1626, doi: 10.1360/SSI-2022-0038
Hongyi LI, Jintao CHEN, Hongru REN, et al. Random-sampling-based multi-UAV cooperative search planning for high-rise firefighting. Sci Sin Inform, 2022, 52(9): 1610-1626, doi: 10.1360/SSI-2022-0038
李中国, 陈文华, 刘存佳
中国科学: 信息科学, 2022, 52(9): 1579-1597
摘要
自主搜寻在环境保护、灾后搜救和工业监控等方面有重要作用.无人机传感平台凭借其灵活的机动性成为实现自主搜寻的有效途径之一.针对自主搜寻中两个关键任务,即污染源定位和污染边界跟踪,本文分别梳理了相关算法体系,并揭示了其设计思想的本质.对于污染物溯源,控制驱动和信息驱动两类算法是目前的研究主流,但两者的结合却鲜有报道.在边界跟踪方面,本文从单平台和多平台协作两方面总结了现有文献的控制和估计方法.根据双重控制思想,本文分析了相关算法的设计思路,并展望了下一步的研究重点.
关键词
自主搜寻; 无人机; 污染源搜寻; 边界跟踪; 双重控制; 探索与利用; autonomous search; UAV; source seeking; boundary tracking; dual control; exploration and exploitation;
引用格式
李中国, 陈文华, 刘存佳. 无人机污染源自主搜寻算法综述. 中国科学: 信息科学, 2022, 52(9): 1579-1597, doi: 10.1360/SSI-2022-0044
Zhongguo LI, Wen-Hua CHEN, Cunjia LIU. Review of UAV-based autonomous search algorithms for hazardous sources. Sci Sin Inform, 2022, 52(9): 1579-1597, doi: 10.1360/SSI-2022-0044
刘卓清, 孙宁, 吴易鸣, 杨桐, 梁潇, 方勇纯
中国科学: 信息科学, 2022, 52(3): 521-538
摘要
为了提高塔式吊车的实际工作效率,往往需要在驱动旋臂和台车的同时改变绳长,以同步实现负载的运输与起落吊运.然而,目前针对变绳长塔式吊车控制问题的研究非常有限,依然处于起步阶段.对于变绳长塔式吊车而言,如何在保证系统良好暂态性能的基础上,减少运输时间、降低系统能耗,并同时实现综合最优是一个亟待解决的实际问题.为此,本文提出了一种考虑状态约束的五自由度塔式吊车多目标最优轨迹规划方法,首次实现了运输时间和系统能耗的Pareto最优,并可从理论上保证状态变量及其对应速度满足物理约束.具体而言,本文通过微分平坦输出信号构造和B样条曲线设计,实现了目标轨迹的定位和防摆性能,并利用改进的非支配近邻免疫算法(nondominated neighbor immune algorithm, NNIA)解决了多目标优化问题.最后,通过多组实际实验验证了所提方法的有效性.
关键词
塔式吊车; 欠驱动系统; 多目标优化; 轨迹规划; 摆动抑制; tower cranes; underactuated systems; multi-objective optimization; trajectory planning; swing suppression;
引用格式
刘卓清, 孙宁, 吴易鸣, 等. 考虑状态约束的五自由度塔式吊车多目标最优轨迹规划. 中国科学: 信息科学, 2022, 52(3): 521-538, doi: 10.1360/SSI-2021-0106
Zhuoqing LIU, Ning SUN, Yiming WU, et al. Multi-objective trajectory planning for 5-DOF underactuated tower cranes with state constraints. Sci Sin Inform, 2022, 52(3): 521-538, doi: 10.1360/SSI-2021-0106
刘凡, 陈谋
中国科学: 信息科学, 2024, 54(7): 1793-1806
摘要
为解决涡扇发动机大包线内多变量鲁棒控制问题,提出了一种基于干扰观测器的非线性涡扇发动机系统固定时间预设性能模糊自适应控制方法.首先,利用平衡流形建模方法构建了涡扇发动机的仿射非线性数学模型.借助反馈线性化技术,推导了受扰涡扇发动机系统的输出跟踪误差系统.然后利用模糊逻辑系统逼近系统不确定项,并设计非线性干扰观测器估计未知干扰和逼近误差组成的复合干扰.为保证控制系统的瞬态性能和稳态精度,引入固定时间预设性能函数,并通过误差转换函数将系统转化成无约束误差系统,进而设计涡扇发动机复合非线性鲁棒抗扰控制器.仿真结果表明,该控制方法能够使得涡扇发动机系统的转速和压比有效地跟踪参考指令并且跟踪误差始终限制在预设性能边界内.
关键词
涡扇发动机; 非线性干扰观测器; 模糊逻辑系统; 固定时间; 预设性能函数; turbofan engine; nonlinear disturbance observer; fuzzy logic system; fixed time; prescribed performance function
引用格式
刘凡, 陈谋. 固定时间预设性能下涡扇发动机模糊自适应控制. 中国科学: 信息科学, 2024, 54(7): 1793-1806, doi: 10.1360/SSI-2023-0329
Fan LIU, Mou CHEN. Fuzzy adaptive control for turbofan engines with fixed-time prescribed performance. Sci Sin Inform, 2024, 54(7): 1793-1806, doi: 10.1360/SSI-2023-0329
张雨杰, 文利燕, 姜斌, 齐瑞云
中国科学: 信息科学, 2024, 54(7): 1730-1751
摘要
本文考虑四旋翼飞行过程中湍流风扰动的影响,以及因变工况飞行而导致的不确定动态突变问题,提出了基于输入–扰动双补偿器设计的自适应湍流风扰动抑制方案,保证了四旋翼飞行器系统的稳定和输出渐近跟踪性能.首先对风场环境下的四旋翼进行建模,研究各不同工况下的动态特性,并分析研究了四旋翼飞行器变工况飞行时的动态特性突变的表现形式以及所带来的控制难题.进而设计了一种基于输入–扰动双补偿器的系统重构方案,实现了动态系统重构,解决了关联矩阵突变为非对角型时难以解耦控制,以及相对阶结构突变时控制器结构发生突变的问题.基于重构后的系统,设计自适应的湍流风扰动抑制方案,保证四旋翼飞行器的稳定、扰动抑制和渐近输出跟踪性能.最后,对所设计的控制器进行稳定性证明,并通过仿真验证所提出控制算法的有效性.
关键词
四旋翼; 风扰动抑制; 动态特性突变; 系统重构; 自适应控制; quadrotor; wind disturbance suppression; dynamic mutation; system reconstruction; adaptive control
引用格式
张雨杰, 文利燕, 姜斌, 等. 变工况下不确定动态突变四旋翼飞行器系统的自适应湍流风扰动抑制技术. 中国科学: 信息科学, 2024, 54(7): 1730-1751, doi: 10.1360/SSI-2023-0251
Yujie ZHANG, Liyan WEN, Bin JIANG, et al. Adaptive wind disturbance rejection technique of a quadrotor with uncertain dynamic mutations under varying operating conditions. Sci Sin Inform, 2024, 54(7): 1730-1751, doi: 10.1360/SSI-2023-0251
钟小玉, 韩玉艳, 姚香娟, 巩敦卫, 孙永征
中国科学: 信息科学, 2023, 53(4): 737-757
摘要
在实际工业生产中,调度环境的复杂性与不确定性使得调度问题求解难度大大提高.针对加工时间不确定的柔性作业车间调度问题,采用不确定参数描述随机工时波动程度和约束条件允许违背程度,构建工时波动服从指数分布的多目标柔性车间调度模型.基于机会约束规划理论,将不确定调度问题转化为加工时间确定的柔性作业车间调度问题,求解得到一定程度上具有鲁棒性能的调度方案.在执行过程中,采用工序移动调整和重调度方法对作业排产方案进行动态调整.基于双链式编码以及贪婪插入法解码规则,提出了基于变邻域搜索的混合NSGA-Ⅱ算法.针对车间调度问题的多约束性和计算复杂度高等特点,设计了基于机器选择的复合启发式规则,包括依据概率的最小累计机器负载和最短工序加工时间规则,以获取更加接近Pareto前沿的均匀分布初始种群.采用改进工序和设备交叉策略以提高算法的全局搜索能力.此外,基于关键工序和机器选择的多种邻域结构,设计了变邻域搜索策略,以进一步提高算法的局部搜索能力.通过Kacem和Brandimarte标准算例的数值仿真以及与多种代表算法的统计比较,验证了所提算法的有效性.本文所提算法为不确定柔性作业车间调度问题提供了更优的调度方案.
关键词
多目标优化; 柔性作业车间调度; NSGA-II; 变邻域搜索; 不确定工时; 机会约束规划; multi-objective optimization; flexible job shop scheduling; variable neighborhood search; uncertain processing time; chance-constrained programming;
引用格式
钟小玉, 韩玉艳, 姚香娟, 等. 不确定工时下多目标柔性作业车间调度问题的进化求解方法. 中国科学: 信息科学, 2023, 53(4): 737-757, doi: 10.1360/SSI-2022-0017
Xiaoyu ZHONG, Yuyan HAN, Xiangjuan YAO, et al. An evolutionary algorithm for the multi-objective flexible job shop scheduling problem with uncertain processing time. Sci Sin Inform, 2023, 53(4): 737-757, doi: 10.1360/SSI-2022-0017
中国科学: 信息科学, 2023, 53(3): 535-549
摘要
本文研究了一类具有高阶输入–输出时延的非仿射非线性离散不确定系统的自适应输出跟踪控制问题,提出了一种基于隐函数的自适应输出反馈输出跟踪控制方案.该方案主要解决了两个技术问题:一是构造了基于未知参数估计和未来时刻信号估计的隐函数方程解的自适应控制律,解决了因系统高阶时延导致的控制律因果矛盾问题并实现了闭环稳定和渐近输出跟踪;二是针对非仿射非线性控制律难求解问题,提出了基于迭代解的解析自适应控制律,实现了闭环稳定和实用输出跟踪.最后仿真研究证实了所提出控制方案的有效性.
关键词
自适应控制; 非仿射非线性; 闭环稳定; 输出跟踪; adaptive control; non-affine nonlinearity; closed-loop stability; output tracking;
引用格式
张言军. 具有高阶时延的离散非仿射非线性系统的自适应跟踪控制. 中国科学: 信息科学, 2023, 53(3): 535-549, doi: 10.1360/SSI-2022-0007
Yanjun ZHANG. Adaptive tracking control of discrete-time non-affine nonlinear systems with high-order time delays. Sci Sin Inform, 2023, 53(3): 535-549, doi: 10.1360/SSI-2022-0007
王珂, 穆朝絮, 蔡光斌, 汪韧, 孙长银
中国科学: 信息科学, 2022, 52(9): 1672-1686
摘要
障碍规避是无人机等自主无人系统运动规划的重要环节,其核心是设计有效的避障控制方法.为了进一步提高决策优化性和控制效果,本文在最优控制的设定下,提出一种基于强化学习的自主避障控制方法,以自适应方式在线生成安全运行轨迹.首先,利用障碍函数法在代价函数中设计了一个光滑的奖惩函数,从而将避障问题转换为一个无约束的最优控制问题.然后,利用行为–评价神经网络和策略迭代法实现了自适应强化学习,其中评价网络利用状态跟随核函数逼近代价函数,行为网络给出近似最优的控制策略;同时,通过状态外推法获得模拟经验,使得评价网络能利用经验回放实现可靠的局部探索.最后,在简化的无人机系统和非线性数值系统上进行了仿真实验与方法对比,结果表明,提出的避障控制方法能实时生成较优的安全运行轨迹.
关键词
自主无人系统; 避障控制; 强化学习; 神经网络; 经验回放; autonomous unmanned systems; obstacle avoidance control; reinforcement learning; neural networks; experience replay;
引用格式
王珂, 穆朝絮, 蔡光斌, 等. 基于安全自适应强化学习的自主避障控制方法. 中国科学: 信息科学, 2022, 52(9): 1672-1686, doi: 10.1360/SSI-2022-0054
Ke WANG, Chaoxu MU, Guangbin CAI, et al. Autonomous obstacle avoidance control method based on safe adaptive reinforcement learning. Sci Sin Inform, 2022, 52(9): 1672-1686, doi: 10.1360/SSI-2022-0054
李曼, 秦家虎, 王龙
中国科学: 信息科学, 2022, 52(6): 1083-1097
摘要
近年来, Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应用.鉴于此,本文研究了不基于系统模型的Stackelberg博弈均衡点的求解方法.具体地,本文考虑线性二次二人Stackelberg博弈,其中博弈状态演化满足线性方程,且成本函数为二次形式.博弈的两个参与者为能够预测另一个体可能响应的个体(即领导者),和根据领导者策略作出最优响应的个体(即跟随者).因为本文考虑线性形式的状态演化和二次形式的成本函数,且领导者先于跟随者采取行动,故领导者和跟随者的决策问题可建模为两层的线性二次型最优控制问题.本文按照从跟随者到领导者的原则,基于动态规划原理推导出最优控制策略.该策略被证明恰好为Stackelberg均衡策略,但其计算需使用系统模型信息.基于此策略,本文提出一种基于执行器–评价器(actor-critic)结构的Q学习算法,解决了系统动力学模型未知情况下线性二次二人Stackelberg博弈均衡点求解问题.此外,本文理论证明了所提算法能够保证系统状态、执行网络和评价网络权重估计误差一致最终有界,并通过数值仿真实验说明基于Q学习算法所得控制策略能够使系统状态稳定,且估计控制策略下的成本函数偏离均衡策略下的成本函数的幅度较小.
关键词
线性二次二人Stackelberg博弈; 最优控制; 模型未知; 执行器–评价器结构; Q学习; linear-quadratic two-player Stackelberg game; optimal control; model-free; actor-critic structure; Q-learning;
引用格式
李曼, 秦家虎, 王龙. 线性二次二人Stackelberg博弈均衡点求解: 一种Q学习方法. 中国科学: 信息科学, 2022, 52(6): 1083-1097, doi: 10.1360/SSI-2021-0016
Man LI, Jiahu QIN, Long WANG. Seeking equilibrium for linear-quadratic two-player Stackelberg game: a Q-learning approach. Sci Sin Inform, 2022, 52(6): 1083-1097, doi: 10.1360/SSI-2021-0016
肖辉, 魏志宏, 寇纲, 顾先明
中国科学: 信息科学, 2024, 54(2): 373-393
摘要
仿真技术已被广泛地用于评估与优化随机复杂系统,例如生产制造、网络通信、医疗健康等信息物理融合系统.然而,将仿真优化方法用于方案排序问题的研究甚少.本文考虑只能通过系统仿真才能获取性能表现的k个备选方案排序问题,在贝叶斯(Bayes)框架下,构建以寻求最大化后验方案正确排序概率为目标的动态仿真预算优化分配模型.通过将仿真预算分配决策过程表述成一个随机动态规划问题,推导出一种动态计量预算分配策略,并证明了该分配策略的渐进最优性.数值实验以及案例分析的结果表明,本文提出的算法显著地提高了方案排序问题的仿真优化效率.
关键词
仿真优化; 排序选优; 信息物理融合系统; 马尔科夫决策过程; 贝叶斯估计; simulation optimization; ranking and selection; cyber-physical system; Markov decision process; Bayesian estimation
引用格式
肖辉, 魏志宏, 寇纲, 等. 随机复杂系统设计方案排序问题的动态计量预算分配策略. 中国科学: 信息科学, 2024, 54(2): 373-393, doi: 10.1360/SSI-2022-0451
Hui XIAO, Zhihong WEI, Gang KOU, et al. Dynamic computing budget allocation for design ranking in stochastic complex systems. Sci Sin Inform, 2024, 54(2): 373-393, doi: 10.1360/SSI-2022-0451
肖辉, 王子淳, 寇纲, 顾先明, Loo Hay LEE
中国科学: 信息科学, 2023, 53(6): 1147-1162
摘要
排序选优方法已广泛应用于求解离散事件动态系统中的仿真优化问题,但该类方法鲜有研究聚焦于子集排序问题的高效求解,而子集排序问题广泛存在于智能制造、电气工程、供应链管理等众多领域.本文针对k个备选方案的子集排序问题,构建了以最大化子集正确排序概率为目标的仿真预算优化分配模型,推导了该优化问题的渐进最优条件,并提出了相应的序贯仿真算法来实现仿真预算的渐进最优分配规则.数值实验结果表明,本文所提出的算法显著地提高了子集排序问题的仿真优化效率.
关键词
离散事件动态系统; 仿真优化; 最优计量分配方法; 大偏差技术; 排序选优; discrete event dynamic systems; simulation optimization; OCBA; large deviation technology; ranking and selection;
引用格式
肖辉, 王子淳, 寇纲, 等. 基于大偏差技术的子集排序最优仿真预算分配方法. 中国科学: 信息科学, 2023, 53(6): 1147-1162, doi: 10.1360/SSI-2021-0440
Hui XIAO, Zichun WANG, Gang KOU, et al. Optimal simulation budget allocation for subset ranking from a large deviation perspective. Sci Sin Inform, 2023, 53(6): 1147-1162, doi: 10.1360/SSI-2021-0440