模型智能构建代理研究

模型智能构建代理研究

一、模型智能构造Agent研究(论文文献综述)

李斌[1](2021)在《基于社交网络的拍卖机制设计理论研究》文中提出机制设计是人工智能和经济学交叉产生的代表性学科。它利用博弈理论建模多智能体之间的交互,并从系统层面上设计博弈环境,引导智能体完成机制设计者的目标。稀缺资源的有效配置不仅是经济学里的重要议题,也是计算机科学中的重点研究内容。作为机制设计领域里最经典的应用,拍卖是分配稀缺资源最有效的一种方式,被广泛地应用于无线频谱配置、在线广告位的交易,等等。拍卖机制设计研究的主要内容是设计合适的拍卖规则规范竞拍者的竞价行为,实现卖家或者机制设计者的需求。在拍卖机制设计中,社会福利最大化和收益最大化是两个相互冲突的目标。如果卖家想要最大化社会福利,那么他在拍卖中所获得的收益不可能得到最优化。本文探索能够同时提升卖家收益以及整体社会福利的新型拍卖机制。具体而言,本文研究基于社交网络的拍卖机制设计问题,其中卖家和竞拍者为社交网络中的智能体。在模型上,本文把社交网络抽象为图,把智能体建模为图中的节点,并把智能体之间的社交链接建模为图中的边。由于信息不对称,不同节点之间只能经由图中的连边进行信息通信。由于竞拍者之间存在严格的竞争关系,在所有传统的拍卖机制中,比如VCG机制,Myerson最优拍卖等,已经参与拍卖的竞拍者不会把拍卖的信息分享给图中其他的竞拍者,这最终导致了资源只能在局部范围内得到配置。为了打破竞拍者之间的信息壁垒,本文把信息分享融入到原生的拍卖设计中,并通过设计新型拍卖机制激励竞拍者主动地邀请其他竞拍者参与拍卖。通过这种方式,图中所有潜在的竞拍者都能参与到拍卖中,最终资源将能够在全局范围内得到配置。本文针对社交网络上的拍卖机制设计问题进行了形式化描述,并且提供了一套系统性的解决方案。首先,基于机制设计理论,建立了完整的基于图的拍卖博弈框架;然后,在该框架下,刻画了图上的拍卖机制设计基础理论;最后,基于建立的理论,分别在无权图和有权图模型中设计了一系列性能优良的新型拍卖机制。相比于传统的拍卖机制,本文设计的机制能够在理论上同时提高卖家的收益以及整体社会福利。随着大型在线社交网络的普及,本文所提供的解决方案在理论和应用上都有重要的研究价值。

张静怡[2](2021)在《基于观测器的多智能体系统包含控制研究》文中研究表明近年来,由于多智能体系统包含控制在航空、工业、运输等领域的广泛应用,引起许多专家学者的关注。多智能体系统包含控制可以看作一致性和编队问题的特殊情形,是指通过设计包含控制算法,驱使一组跟随者在多个领导者的引领下,最终进入并保持在由领导者所形成的凸包中运动。与传统多智能体系统问题相比,包含控制更能突出分布式协同控制的优势。针对系统收敛速度、智能体状态不可知以及信息传递过程中出现时滞、外界扰动、Do S攻击等情况,本文研究基于观测器的多智能体系统包含控制问题,主要研究内容如下:(1)研究基于状态观测器的多智能体系统有限时间包含控制问题。考虑带有异质跟随者的多智能体系统,利用齐次性理论和现代控制理论等知识,解决有限时间包含-跟踪控制问题。进一步,考虑一般线性多智能体系统,智能体状态不能及时获得的情况,提出基于输出信息的有限时间状态观测器和控制算法,即在包含控制算法加入观测器的估计值。利用Lyapunov稳定性理论和线性矩阵不等式等工具,得到异质和一般线性系统实现有限时间包含控制的充分条件。最后,在数值仿真中,验证两类控制算法的有效性。(2)研究基于扰动观测器的多智能体系统有限时间包含控制问题。考虑具有不确定扰动的二阶多智能体系统,提出基于快速终端滑模控制的算法,通过约束扰动解决系统的有限时间包含控制问题。进一步,考虑系统具有非线性动态的情况,设计非线性有限时间扰动观测器来有效跟踪系统中存在的未知扰动状态,给出基于扰动观测器的复合式快速终端滑模包含控制算法。最后,通过仿真算例验证该扰动观测器和有限时间控制算法的有效性。(3)研究带有时滞的异质多智能体系统在拒绝服务攻击下的H∞二分包含控制问题。在有向符号网络下,针对离散时间一般线性系统,考虑在攻击信号干扰下智能体之间不能正常通信,设计一类分布式状态观测器,通过观测器补偿拒绝服务(Do S,Denial of Service)攻击对系统的干扰。其次,在每个跟随者的控制器设计中,采用分布式动态输出反馈控制方案,通过内外系统加强包含控制的约束条件,使得系统中的跟随者有效渐近跟踪到领导者状态,解决系统的输出调节问题。利用图论、分段Lyapunov泛函和线性矩阵不等式等知识,得到系统渐近收敛的充分条件。最后,通过仿真验证所提算法的有效性。

胡大鹏[3](2021)在《基于强化学习的多智能体协作建模方法研究》文中进行了进一步梳理本文是以《中国制造2025》背景,以达到实现智能制造的要求为目标,通过融合工业场景和互联网技术,在全球化充满不确定的局面下提高中国制造业的竞争力。当前工业中智能制造面临资源难共享、过程难协调、依赖领域专家等普遍问题,本文基于Agent,多Agent系统和强化学习等相关技术,构建了面向工业的多Agent混合式智能控制模型,并对多Agent系统中的Agent协作能力、作业调度策略等关键问题进行研究,以实现工业生产过程智能控制。本文基于多Agent技术,将工业过程的工艺关键点、关键设备抽象成若干Agent,构建了一个三层结构的混合式多Agent智能模型。该模型基于JADE框架从而实现底层基础功能,此外通过一些接口实现基于状态表示学习的多Agent协作方法的智能模块及基于强化学习的多Agent系统作业调度方法的智能模块,从而满足工业需求。本文针对工业中Agent接触的环境复杂,以及Agent对重要特征感知能力差的问题,基于M3DDPG算法,提出了SRL_M3DDPG算法,在保留M3DDPG算法的强鲁棒性特点的同时提高设备Agent对重要特征的获取,从而使设备Agent的动作达到预期效果。改进的算法利用状态表示学习来帮助捕捉特征,通过深度神经网络来构造观测值和状态值的映射,然后M3DDPG中的Actor和Critic网络从新的神经网络中学习,而不是从最初的观察中学习,从而使Agent动作达到预期并且能够适应高维数据。本文针对多Agent系统中的作业调度问题,提出了一种将TS算法和Q-learning相结合的TS_Qlearning算法,该方法通过禁忌搜索算法的禁忌表存储算法的早期训练经验,来指导算法的早期训练。并且,TS_Qlearning算法优化了Q-learning算法解决调度问题中的策略,在保留了Q-learning算法的探索优势的基础上,在训练早期指导算法的训练,从而提高算法训练的质量,从而更好的优化资源配置。

刘恒[4](2021)在《一类非线性系统的自适应迭代学习容错控制》文中提出作为一种智能控制方法,迭代学习控制由于其显着的优点和良好的控制性能,已成为非线性控制领域的热点问题之一,愈发受到众多研究人员的高度重视,并得到了广泛应用。本文以迭代学习控制方法为主要手段,研究了一类非线性参数化系统的自适应迭代学习容错控制问题,在此基础上,将提出的控制器设计方法推广到多智能体系统中,研究了一类多智能体系统的一致性问题。论文的主要工作包括:(1)针对一类包含时滞项和执行器故障的非线性参数化系统,研究了自适应迭代学习容错控制问题。首先,针对单输入单输出(SISO)系统,考虑到系统中存在的时变时滞、非线性化参数以及执行器故障等非线性项,利用参数分离技术,对这些非线性项进行分离转化,在此基础上,构造了自适应迭代学习容错控制器以及迭代域上的参数更新律;其次,将上述SISO系统的迭代学习控制器的设计思想拓展到多入多出(MIMO)系统中,设计了相应的自适应迭代学习可靠控制策略来处理由时滞项和执行器故障所引起的非线性干扰,并且利用矩阵的相关知识处理系统输出信息间的耦合性影响;然后,利用复合能量函数(CEF)分别证明了SISO和MIMO系统的状态跟踪误差沿迭代轴的渐进收敛性和闭环信号有界性;最后,通过数值仿真验证了所提出的控制策略的正确性和有效性。(2)针对一类包含时滞项、输入饱和项和执行器故障的多智能体系统,在系统重复运行的背景下,研究了一致性问题。首先,通过定义多智能体的扩展跟踪误差,并针对多智能体系统中由各类约束条件所引起的不确定性问题,构建了一种具有完全饱和参数更新规律的分布式自适应迭代学习容错控制器。然后,通过构造一种新的复合能量函数,证明了多智能体系统跟踪误差的收敛性。最后,利用典型的迭代学习控制器与本文设计的控制器做对比,验证所提出的控制方案的有效性和正确性。结果表明,本文所提出的自适应迭代学习容错控制器可以有效减少迭代次数和系统跟踪误差。

柴小丰[5](2021)在《多智能体系统事件触发编队控制研究》文中研究表明多智能体系统由多个具备一定感知、计算、执行与通讯功能的智能体组成,和单个个体执行任务相比,多个体协作可以提高任务执行能力与效率,降低单个体成本,增加系统冗余和抗风险能力,因此多智能体系统协同控制问题受到越来越多研究人员的关注。编队控制是多智能体协同控制的重要研究分支之一,目标是使多个智能体根据任务需要,在运动过程中保持或变换队形,其在军事领域和民用领域具有广泛的应用前景,如战斗机编队、卫星编队、无人机表演等。实际系统中,由于通讯带宽和计算资源有限,并且要求系统在指定时间内形成编队,因此研究提高多智能体系统编队控制策略的收敛速度,以及节省有限的计算和通讯资源,具有重要的实际意义。本文主要研究了多智能体系统事件触发编队控制问题,针对一些典型的系统模型与控制目标,设计了不同的分布式控制策略,包括事件触发控制、自触发控制、有限时间控制、固定时间控制与动态事件触发控制等。论文主要研究内容包括以下几个方面:1.针对多智能体系统的时变编队问题,分别设计了基于观测器的事件触发控制策略与自触发控制策略,通过将状态观测误差引入事件触发函数,可以提高状态观测器收敛速度与系统编队精度。两种控制策略均可实现时变编队控制,并且避免Zeno行为,同时自触发策略可以避免智能体之间的连续通讯。2.对于受扰多智能体系统,研究了具有领航者的编队跟踪控制问题,分别设计固定时间事件触发与自触发控制策略。固定时间控制可有效提高系统收敛速度,并且收敛时间与系统初始状态无关;事件触发控制可以降低控制器更新次数,自触发控制可以避免智能体之间的连续通讯。3.针对基于采样数据的多智能体系统,研究了一阶多智能体系统基于采样数据的编队跟踪控制问题,分别设计了有限时间事件触发与自触发策略,后者可以避免连续通讯。4.对于基于采样数据的非线性高阶多智能体系统,研究了基于采样数据的编队控制问题,设计了分布式动态事件触发机制,通过动态调整触发函数参数,可以有效减少系统触发次数。5.目前多智能体协同控制研究多以理论研究与仿真验证为主,本文利用多无人车实验平台,对多智能体编队控制策略进行实验验证,分别设计了基于采样数据的多无人车有限时间事件触发编队跟踪实验与固定时间事件触发编队跟踪实验。通过实验对比,验证了有限时间控制、固定时间控制与事件触发控制与自触发控制的有效性。

张振华[6](2021)在《不同控制机制下几类非线性多智能体系统的脉冲一致性研究》文中进行了进一步梳理进入21世纪以来,得益于世界范围内诸多关键领域科学技术的不断突破,以计算机技术、通信技术以及现代控制理论为核心支撑的多智能体系统被赋予了愈来愈强大的单一智能体所无法企及的功能。由于分布式协同控制技术是多智能体系统领域的研究基础,而一致性问题又是分布式协同控制领域的关键课题,因此多智能体系统的一致性问题受到了专家学者们的广泛关注。为了节约有限的通信资源,降低控制成本以及提高控制速度,研究人员将脉冲控制机制引入到多智能体系统一致性问题的研究中。然而,一方面在很多文献中作者通常预先设定脉冲控制序列,这在一定程度上是偏保守的。对此,基于事件触发的脉冲控制机制可以有效避免这个问题。另一方面,受数字信号漂移或抖动现象的影响真实脉冲控制信号通常出现在一个已知的脉冲时间窗口内。因此,基于脉冲时间窗口概念研究多智能体系统的脉冲一致性更符合客观实际。此外,还应该考虑外界环境波动所引发的参数不确定性或者随机干扰等因素对智能体动力学行为的影响,以及考虑能否设计一种优化策略以生成最优的脉冲控制信号,等等。综上所述,本文研究了不同控制机制下几类非线性多智能体系统的脉冲一致性问题。本文的主要研究内容如下:1.在绪论部分首先介绍了多智能体系统的研究背景与意义以及多智能体系统脉冲一致性的研究现状,其次给出开展本文研究工作所需要了解的预备知识以及常用的假设与引理,最后简要介绍了后续各章节的主要内容与工作安排并对文中出现的一些特定符号作出解释说明。2.基于所构造的周期可变脉冲时间窗口预置布局研究了具有随机发生非线性(RONs)与随机发生不确定(ROUs)的随机多智能体系统的领导跟随均方一致性。利用Lyapunov稳定性理论,随机微分方程理论以及矩阵理论给出相应的充分的均方一致性判据,随后讨论了不同参数背景下一致性判据的不同适用场景。最后,通过数值仿真验证了研究方法的有效性与可行性。3.受“平均脉冲间距”概念启发提出了适用于脉冲时间窗口存在情形下的“平均左端点间距”概念,并将其应用于具有RONs与ROUs的随机多智能体系统的领导跟随均方一致性问题的研究中。基于Lyapunov稳定性理论,随机微分方程理论以及矩阵理论最终得到一个统一的均方一致性准则,并在此基础上得到了比现有结果更大的可允许脉冲间距上界值。最后,在数值仿真部分对分析方法的有效性给予了验证。4.在系统的模型构建中综合考虑了 RONs,ROUs以及随机干扰的影响,通过设计合适的能够排除Zeno现象的分布式事件触发函数研究了该系统均方意义下的领导跟随一致性问题。其中,各智能体对应脉冲控制时刻的生成取决于所设计的事件触发函数。最终,基于Lyapunov稳定性理论,随机微分方程理论以及均方意义下的Halanay不等式等理论与分析工具得到了一系列均方一致性判据,且通过多个仿真实例验证了控制方法的有效性与可行性。5.设计了一类脉冲控制器优化算法并结合采样数据控制以及分布式事件触发脉冲控制机制研究了多种情形下非线性多智能体系统的脉冲一致性问题。通过对应算法的优化选择作用,脉冲瞬间获取的所有外来节点信息均得到了更合理的利用。因此,相同参数背景下此项研究与仅依赖采样数据控制的一般情形相比只需要更少的采样以及控制次数便能实现更优良的控制效果。最后,通过多个仿真实验验证了所提算法的有效性与更低保守性。6.基于分布式事件触发脉冲控制机制并结合先前提出的脉冲控制器优化算法研究了一类基于网络的多智能体系统的脉冲一致性问题。同时,在初始模型构建中考虑了算法诱导时滞,通信时滞以及系统固有时滞的影响并通过模型转化得到一个基于脉冲时间窗口的新模型。随后利用Lyapunov稳定性理论,Halanay不等式以及随机微分方程理论给出相应的一致性准则并由此得到可允许的总的脉冲输入时滞的最大值。最后,通过数值仿真实例对所提研究方法的有效性进行了验证。

王琦[7](2020)在《基于PI控制的时滞多智能体系统一致性研究》文中指出近年来,由于多智能体系统在分布式计算、传感器网络及机器人编队等方面的广泛应用,受到了越来越多研究者的关注。在多智能体系统协同控制中,最基本的研究问题之一是一致性问题。一致性是指随着时间的推移,最终每个智能体的状态趋于一致。通过设计分布式控制协议来实现一致性,其中每个智能体仅和它相邻的智能体进行信息交换,本文采用新型的比例积分(PI)形式的控制协议来解决一致性问题。此外,由于速度的限制,各智能体在传输信息时总会存在通信延迟,因此本文的研究对象是时滞多智能体系统。在此基础上,本文主要研究了基于PI控制的时滞有向多智能体系统的一致性问题,主要内容如下:首先研究了一阶和异质时滞有向多智能体系统的一致性问题。针对一阶时滞多智能体系统,提出了PI形式的控制协议,针对时滞是常数和时变两种情况,分别给出了实现一致性的充分条件,并通过增加三重积分项减少所得充分条件的保守性,最后通过仿真实例验证所得结论的正确性。将所得结果拓展到异质多智能体系统中,同样给出了实现一致性的充分条件。然后研究了含非线性或扰动的时滞有向多智能体系统的一致性问题。针对这两种情况分别给出了PI控制协议,得到了实现一致性的充分条件,并通过仿真实例验证了所得条件的正确性和有效性。特别的,针对含有扰动的系统,通过仿真比较只含有比例的控制协议和比例积分的控制协议,得到其优缺点。最后研究了基于分布式PID控制的一阶时滞有向多智能体系统的一致性问题。将前两章提出的PI控制协议拓展为PID控制协议,并将其运用到一阶时滞有向多智能体系统中,给出了实现一致性的充分条件,并通过仿真实例验证了提出的设计方法和结论的有效性。

马碧阳[8](2019)在《多智能体预测状态表示模型研究》文中认为序贯预测是智能体技术的核心问题,主要考虑如何在一个充满不确定性、各种干扰、复杂多变的动态环境中建立精确的动态系统模型、实现多智能体动作-观测序列的准确预测以及建立其最优决策模型。在诸多序贯预测模型中,预测状态表示模型(Predictive State Representations,PSR)以动作-观察值序列向量表征系统的状态,进而实现对未来事件发生概率的准确预测,具有强表征能力、易于建模学习等优良特性,有效地克服传统模型处理智能体序贯决策问题的不足,普遍适用于解决单个智能体预测及其决策问题。目前,学习PSR模型的算法已经相对完善,但是其可靠性和效率均有待提高,并且这些研究工作通常考虑的是如何对单个智能体进行建模。而且PSR模型研究尚未涉及到多智能体建模问题,大部分的研究工作仍然集中在模型学习效率和可扩展性的提高。要学习一个多智能体的PSR模型是很难的,特别是随着智能体数目增多和问题领域的复杂化,其建模难度大大增加。同时,随着数据存储和处理技术的进步,大多数多智能体系统在智能体与系统交互时积累了大量的交互数据,当把交互数据在高维空间表示时呈现出明显的稀疏现象。目前,如何充分利用这些数据建立智能体预测模型,提高多智能体的决策能力,将是一个具有广阔应用前景的问题。因此本文主要在单智能体的PSR模型的基础上推广多智能体的PSR模型,着手求解具有挑战性的多智能体建模问题,特别是从大量的多智能体交互数据中学习PSR模型:针对传统预测状态表示模型在对大规模复杂多智能体系统建模时,出现的准确性差和效率低等问题,本文提出基于优化技术的多智能体预测状态表示模型建模方法。这一方法在单智能体的PSR模型的基础上推广至多智能体的PSR模型,而后把多智能体PSR模型的核心检验集合发现和模型参数学习转化为全局优化问题,借助优化技术进行求解。具体而言就是通过把PSR模型的发现问题形式化为一个凸优化问题;考虑到系统动态矩阵的全局稀疏性,把该凸优化问题转化为Lasso问题;最后运用交替方向乘子法(ADMM)求解;获得系统PSR模型核心检验集的时候一并获得PSR模型参数,由此,可马上获得系统的PSR模型。此外,本文运用的ADMM优化技术有全局收敛性的保证,且本章提出的学习预测状态表示模型的全局稀疏优化方法的不需要预先设置对核心测试集的大小。针对传统预测状态表示模型的系统状态矩阵表示多智能体系统动态特性的不足,本文研究了一个用于学习多智能体PSR模型的高维系统动力学矩阵,即张量,并提出基于张量分解的多智能体预测状态表示模型。基于单智能体的TPSR模型,提出一个使用张量分解来学习两智能体和多智能体PSR的框架,首先考虑如何将传统的张量分解方法应用于两个智能体的PSR学习,然后再将其扩展到多智能体的情况。使用张量分解来学习两智能体和多智能体PSR的框架解决了多智能体建模的难题,特别是从大量多智能体交互数据中得到的PSR模型。针对多智能体系统建模难度随着智能体个数而增加,最终导致难以获得可行的预测状态表示模型等问题,本文提出基于张量的优化技术求解多智能体预测状态表示模型。基本思想的关键是利用张量的高度连通结构和优化技术的良解的性质,并直接从原始张量中获得核心检验集合。首先,考虑如何建立并求解学习其PSR模型的优化模型,而后给出其PSR模型的模型参数,最后再将其扩展到多智能体的情况。因此,可以从模型的解中,直接得到PSR模型的核心联合检验集和模型预测参数,然后构造一些辅助矩阵后得到模型转移参数。

孙远[9](2018)在《CPS-Service运行支撑平台关键技术研究》文中指出信息物理融合系统(Cyber Physical Systems,CPSs)是一个综合计算系统、网络系统与物理系统的多维度复杂系统,其核心是通过计算、通信与控制能力的深度融合与紧密协作,实现网络化物理设备系统的高效、可靠、精确的管理与调控。在当今万物互联时代,其具有广泛的应用前景。但是CPS本质上的复杂性使得其设计与实现遇到了不少挑战。首先,CPS中存在着数量庞大、种类繁多、异构性很强的物理实体,使得统一管理CPS中的所有物理实体变得非常困难。其次,CPS应用任务往往都是难以提前确定的,必须提供相应的运行时环境以支持CPS动态使命任务的完成。再次,当前物理实体的计算能力普遍不强,难以有效提升物理实体的智能化水平以应对非结构化环境、未知环境。这些挑战的出现使得采用传统上的“从零开始(from scratch)”的系统设计流程进行CPS设计与实现的效率明显降低。论文针对多智能机器人协同工作系统的特点及需求,提出设计一种CPS-Service运行支撑平台,以提高此类CPS应用系统的设计与实现效率。CPS-Service运行支撑平台利用CPS-Service统一管理物理实体(即将物理实体的能力抽象为CPS-Service);通过组合不同的CPS-Service完成不同的CPS应用任务;利用云计算技术提升物理实体计算能力、增强CPS-Service的服务效果以应对非结构化环境、未知环境。论文围绕着CPS-Service运行支撑平台结构及其关键技术进行了研究,主要工作与贡献如下:1)研究了CPS-Service运行支撑平台的结构设计。深入分析了目前CPS运行支撑平台的主流体系结构及其相关实现技术,从CPS应用任务构造方法和适用场景两个方面对目前CPS运行支撑平台的主流体系结构进行了深入比较。在此基础上,设计了一种基于实时云的CPS-Service运行支撑平台。2)构造了一种基于本体的CPS-Service模型,并提出了相应的快速CPS-Service匹配方法。为了统一管理数量庞大、种类繁多、异构性很强的物理实体,提出将物理实体的能力抽象为CPS-Service。针对当前服务模型难以有效表达CPS-Service特有的信息物理融合属性的问题,构造了一种基于本体的CPS-Service模型。与现有服务模型相比,该CPS-Service模型更加完善,其在核心要素CPS-Service基础上,增加了物理实体、物理空间位置和物理环境等信息物理融合要素。此外,CPS-Service运行支撑平台通常管理着大量CPS-Service,而CPS应用任务的完成一般只需要其中一部分CPS-Service的参与。因此,如何从CPS-Service集合中快速找到所需的CPS-Service子集成为一个重要问题。针对这一问题,提出了基于概率聚类和R树的快速CPS-Service匹配方法。该方法利用一种混合索引结构在在线匹配阶段快速排除不可能满足需求的CPS-Service。仿真实验结果表明,通过引入这种混合索引结构,该方法大幅提升了CPS-Service匹配速度。3)提出了物理位置与环境敏感的CPS-Service组合方法。CPS-Service运行支撑平台通过组合不同的CPS-Service完成不同的CPS应用任务。CPS-Service特有的物理位置与环境敏感性使得当前的软件服务组合方法难以直接用于解决CPS-Service组合问题,为此需要研究面向CPS的服务组合方法。首先针对CPS-Service具有明显物理位置敏感性的特点,研究了考虑物理位置敏感性的CPS-Service组合问题。进而针对在非结构化环境、未知环境下CPS-Service易受环境影响的特点,研究了考虑执行可靠性的CPS-Service组合问题。为了求解这两个问题,分别提出了基于改进量子遗传算法的CPS-Service组合方法和基于退火Pareto汤普森采样的超启发式CPS-Service组合方法。仿真实验结果表明,两种方法可在多种不同的场合下大幅提升现有CPS-Service组合方案的质量。4)提出了CPS-Service云基增强方法。为了应对非结构化环境、未知环境,CPSService需要引入复杂的计算任务以增强其服务效果,然而当前物理实体的计算能力有限。针对这一问题,提出利用云计算技术提升物理实体计算能力以支持复杂计算任务的运行,从而增强CPS-Service效果。CPS-Service云基增强的主要思想是把CPS-Service中的复杂计算任务迁移到云上执行。尽管计算任务迁移使得利用云增强CPS-Service成为可能,但是由于通信资源与云端(如私有云、边缘云)计算资源是有限的,如何获取最好的CPS-Service增强方案成为一个重要问题。为了解决该问题,提出了两种CPS-Service云基增强方法,分别是基于贪婪选择和基于个体稀疏的CPS-Service增强方法。仿真实验结果表明两种方法都可获取很好的CPS-Service增强方案,基于贪婪选择的CPS-Service增强方法甚至可以获取近似最优的CPS-Service增强方案。5)设计实现了CPS-Service运行支撑平台原型及相关软件工具原型。以上述研究成果为基础设计实现了CPS-Service运行支撑平台原型的主要功能模块(其包括基于云的CPS-Service增强框架、CPS-Service匹配框架、CPS任务执行引擎),并开发了相关的CPS-Service描述工具原型、CPS应用任务流程构造工具原型。

张挺[10](2012)在《基于SO-CIR-Agent模型的智能代理平台在拍卖领域的应用》文中提出近几年,随着网络技术和电子商务的快速发展,Web服务引起了越来越多人的关注。建立在WSDL,SOAP以及UDDI等标准之上,结合XML等技术,Web服务在企业管理、消费服务、网络信息系统等众多领域得到广泛的应用。然而目前的Web服务并没有为服务的智能化调用、客户意图的封装、软件异构等问题提供支持。Agent技术的发展和诞生是网络技术和人工智能技术进步的必然结果。Agent拥有自治性、协商性、社会性等优点,具备强大的解决问题的能力,在某些场合能够模拟人类的行为,替人们完成一些较为复杂的事情。这些特征使得Agent技术适用于需要人工参与的复杂活动的仿真领域。因而,Agent技术的出现和发展为解决Web服务乃至整个电子商务领域所面临的问题带来了新的希望。本文正是通过Agent技术模拟用户的行为,利用用户Agent将用户的请求进行了封装,主动地调用Web服务,极大的简化了用户的操作。本系统将Agent平台和Web服务框架组合起来,建立起一个兼有二者特点的新系统,为竞拍Agent提供模拟的交易平台来仿真网上拍卖的整个过程,为拍卖方和竞拍方提供便捷的拍卖机制来进行网上拍卖,使竞拍者获得更大的便利。Agent技术和Web服务技术是当今计算机领域中两个非常重要的技术。如果能把支持跨平台性、松散耦合和互操作的Web服务技术与具有高度智能性、协调性和合作性的Agent技术的优势互补,将会给用户带来更大的方便与效益,为用户构建具有高度适应性、扩展性和交互性的面向Web服务的多Agent系统。作为面向服务基础上的CIR-Agent架构,本系统由CIR-Agent模型扩展而来,必然具有自治的功能,因为这正是CIR-Agent的本身具备的特性之一。它集成了 CIR-Agent所具有的一切能力来适应面向服务的环境需要。Web服务具有的优势正好可以用来克服Agent在分布式设计中的—些困难。对于这个问题,Agent研究者们提出了各种方法来将SOA和AO工程的优势绑定在一起。他们中的一些人关注于执行层面上的面向服务的Agent,另外的研究如何扩展具有Web Service特性的Agent平台或者是整合Agent平台与Web Service平台。本文主要分析讨论如何克服面向服务技术的自治性问题和解决Agent技术分布式设计的难点。在深入研究CIR-Agent模型的基础上,对它的应用范围做一个扩展,同时使服务更多的作用于这个模型的知识模块和通信模块。本研究在概念层面上的SOA与AO工程的结合的同时还将设计出具体的系统实例。文章首先对Agent技术、Web服务的基本理论以及二者结合的原理进行了系统的分析,然后根据Agent的技术特点和Web服务技术的特性,提出了SO-CIR-Agent系统平台来融合两种技术的优势,互补存在的缺陷。随后,进一步给出了拍卖仿真系统体系结构的整体设计。最后,在前几章分析与设计的基础上,本文采用广为流行的基于FIPA规范的JADE平台,利用Maven框架开发了一个网上拍卖系统平台,就典型实例给出了模拟交易过程,实现了原型系统。本文提出的SO-CIR-Agent系统平台可作为参考,进行适当的改进还可以用于其他的网络应用,例如网上购物、旅行服务、企业管理等。为进一步实现复杂智能网络系统做了必要的理论与实践准备,具有—定的参考价值。

二、模型智能构造Agent研究(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、模型智能构造Agent研究(论文提纲范文)

(1)基于社交网络的拍卖机制设计理论研究(论文提纲范文)

摘要
ABSTRACT
主要符号表
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 拍卖理论简介
        1.2.2 基于图的市场模型
        1.2.3 信息传播理论
    1.3 主要贡献与创新
    1.4 论文结构
第二章 拍卖机制设计相关背景
    2.1 一般机制设计环境
    2.2 单物品拍卖理论
    2.3 本章小结
第三章 图上的拍卖机制设计理论
    3.1 图上的拍卖机制设计框架
        3.1.1 问题概述
        3.1.2 基于图的拍卖机制模型
    3.2 基本理论刻画
        3.2.1 激励相容性刻画
        3.2.2 个体理性刻画
    3.3 单调分配与最优支付
        3.3.1 单调分配规则
        3.3.2 可实施性
        3.3.3 最优支付规则
    3.4 收益与效率困境
        3.4.1 不可能性定理
        3.4.2 配置有效的最优机制
    3.5 本章小结
第四章 无权图上的拍卖机制设计
    4.1 预备知识
        4.1.1 关键传播序列
        4.1.2 延迟分配规则
    4.2 关键传播机制
        4.2.1 边集选择函数
        4.2.2 关键传播机制定义
        4.2.3 理论分析
    4.3 案例分析
        4.3.1 信息传播机制
        4.3.2 阈值邻居机制
    4.4 传播机制中的转卖问题
        4.4.1 防转卖定义
        4.4.2 防转卖传播拍卖机制
        4.4.3 弱防转卖传播拍卖机制
    4.5 本章小结
第五章 有权图上的拍卖机制设计
    5.1 有权图传播拍卖模型
    5.2 含中介的有权图模型
        5.2.1 中介市场模型
        5.2.2 树形图上的信息传播机制
        5.2.3 一般图上的顾客分享机制
    5.3 一般有权图上的赋权传播机制
        5.3.1 分配规则定义
        5.3.2 支付规则定义
        5.3.3 理论分析
    5.4 本章小结
第六章 全文总结与展望
    6.1 全文总结
    6.2 后续工作展望
致谢
参考文献
攻读博士学位期间取得的成果

(2)基于观测器的多智能体系统包含控制研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 课题研究背景及意义
    1.2 研究现状
    1.3 本文的内容和安排
第二章 预备知识
    2.1 代数图论知识
    2.2 矩阵理论
    2.3 包含控制基础理论
    2.4 稳定性理论
    2.5 本章小结
第三章 基于状态观测器的多智能体系统有限时间包含控制
    3.1 引言
    3.2 无观测器的异质多智能体系统有限时间包含控制
        3.2.1 问题描述
        3.2.2 有限时间包含控制分析
    3.3 基于观测器的一般线性多智能体系统有限时间包含控制
        3.3.1 问题描述
        3.3.2 基于观测器的有限时间包含控制分析
    3.4 仿真算例
    3.5 本章小结
第四章 基于扰动观测器的多智能体系统有限时间包含控制
    4.1 引言
    4.2 无观测器的有限时间包含控制
        4.2.1 问题描述
        4.2.2 控制器设计
        4.2.3 稳定性分析
    4.3 基于扰动观测器的有限时间包含控制
        4.3.1 问题描述
        4.3.2 扰动观测器设计
        4.3.3 稳定性分析
    4.4 仿真算例
    4.5 本章小结
第五章 DoS攻击下异质多智能体系统的H_∞二分包含控制
    5.1 引言
    5.2 问题描述
    5.3 异质多智能体系统二分包含控制
        5.3.1 观测器设计
        5.3.2 控制器设计
        5.3.3 多智能体系统稳定性分析
    5.4 异质多智能体系统的H_∞二分包含控制
    5.5 仿真算例
    5.6 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
作者简介

(3)基于强化学习的多智能体协作建模方法研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究目的及意义
    1.2 国内外研究现状
        1.2.1 多Agent系统的研究现状
        1.2.2 强化学习的研究现状
        1.2.3 多Agent强化学习的研究现状
    1.3 本文研究内容
    1.4 本文的技术路线
    1.5 本文的创新点
    1.6 全文的组织框架
第2章 相关理论介绍
    2.1 智能制造
        2.1.1 智能制造的背景
        2.1.2 智能制造系统对控制模型的要求
    2.2 Agent相关技术
        2.2.1 Agent相关概念及特性
        2.2.2 Agent体系及结构
        2.2.3 多Agent系统概念
        2.2.4 多Agent系统体系结构
    2.3 强化学习与多Agent强化学习方法
        2.3.1 强化学习
        2.3.2 多Agent强化学习
    2.4 本章小结
第3章 面向工业的多Agent混合式智能模型
    3.1 多Agent建模的含义和优势
    3.2 Agent之间的通信
        3.2.1 ACL相关介绍
        3.2.2 利用JADE平台实现ACL
    3.3 面向工业的多Agent混合式智能模型
        3.3.1 多Agent混合式智能模型的构建
        3.3.2 多Agent混合式智能模型中各模块功能及主要Agent的结构
        3.3.3 在JADE平台上构建多Agent混合式智能模型
    3.4 本章小结
第4章 基于状态表示学习的多Agent协作算法
    4.1 研究背景
    4.2 MADDPG算法概述
    4.3 M3DDPG算法概述
    4.4 SRL_M3DDPG算法概述
        4.4.1 状态表示学习
        4.4.2 SRL_M3DDPG算法
    4.5 仿真实验
    4.6 本章小结
第5章 基于TS_Qlearning的多Agent作业调度
    5.1 研究背景
    5.2 作业调度问题描述
    5.3 强化学习求解作业调度问题
        5.3.1 调度问题中的强化学习
        5.3.2 Q-learning算法
        5.3.3 TS_Qlearning算法
    5.4 仿真实验
    5.5 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
在校期间主要研究成果
    一、发表学术论文
    二、其他科研成果

(4)一类非线性系统的自适应迭代学习容错控制(论文提纲范文)

摘要
abstract
1 绪论
    1.1 引言
    1.2 迭代学习控制发展现状
    1.3 研究动机
    1.4 本文结构与组织结构
2 一类具有时滞与执行器故障的非线性系统的迭代学习容错控制
    2.1 引言
    2.2 一类具有时滞与执行器故障的SISO非线性系统的迭代学习控制
        2.2.1 问题描述
        2.2.2 控制器设计
        2.2.3 收敛性分析
        2.2.4 仿真研究
    2.3 一类含时滞与执行器故障的MIMO非线性系统的迭代学习控制
        2.3.1 问题描述
        2.3.2 控制器设计
        2.3.3 收敛性分析
        2.3.4 仿真研究
    2.4 本章小结
3 一类含饱和、时滞和执行器故障的多智能体的一致性问题
    3.1 引言
    3.2 预备知识
    3.3 一类含饱和、时滞和执行器故障的同构多智能体的AILC控制
        3.3.1 问题描述
        3.3.2 控制器设计
        3.3.3 收敛性分析
        3.3.4 仿真研究
    3.4 本章小节
4 总结与展望
参考文献
致谢
攻读学位期间发表的学术论文目录
攻读学位期间完成的学术论文目录

(5)多智能体系统事件触发编队控制研究(论文提纲范文)

致谢
摘要
Abstract
符号清单
1 绪论
    1.1 课题来源
    1.2 研究背景及意义
    1.3 国内外研究现状
        1.3.1 多智能体系统编队控制研究进展
        1.3.2 多智能体系统事件触发控制研究进展
    1.4 存在的关键问题
    1.5 论文的主要内容及结构安排
2 理论基础
    2.1 图论及相关引理
    2.2 编队相关定义
    2.3 系统稳定性理论
    2.4 其它相关引理
3 基于状态观测器的多智能体系统事件触发时变编队控制
    3.1 引言
    3.2 问题描述
    3.3 分布式事件触发编队控制策略
    3.4 分布式自触发编队控制策略
    3.5 仿真验证
    3.6 本章小结
4 受扰多智能体系统固定时间事件触发编队控制
    4.1 引言
    4.2 问题描述
    4.3 固定时间事件触发实际编队跟踪控制算法设计
    4.4 固定时间自触发实际编队跟踪控制算法设计
    4.5 仿真验证
    4.6 本章小结
5 基于采样数据的多智能体系统有限时间事件触发编队控制
    5.1 引言
    5.2 问题描述
    5.3 基于采样数据的有限时间事件触发编队跟踪策略
    5.4 基于采样数据的有限时间自触发编队跟踪策略
    5.5 仿真验证
    5.6 本章小结
6 基于采样数据的多智能体系统动态事件触发编队控制
    6.1 引言
    6.2 问题描述
    6.3 基于采样数据的动态事件触发编队控制策略
    6.4 仿真验证
    6.5 本章小结
7 基于采样数据的多无人车编队跟踪实验
    7.1 引言
    7.2 多无人车实验验证平台
    7.3 无人车运动学模型
    7.4 基于采样数据的多无人车有限时间事件触发编队跟踪实验
    7.5 基于采样数据的多无人车固定时间事件触发编队跟踪实验
    7.6 本章小结
8 结论
    8.1 本文总结
    8.2 未来展望
参考文献
作者简历及在学研究成果
学位论文数据集

(6)不同控制机制下几类非线性多智能体系统的脉冲一致性研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 课题研究背景、意义及目的
    1.2 国内外研究现状
        1.2.1 具有脉冲时间窗口的脉冲系统的研究现状
        1.2.2 事件触发脉冲控制机制下脉冲系统的研究现状
    1.3 预备知识
        1.3.1 代数图论
        1.3.2 矩阵理论
        1.3.3 伊藤(It(?))随机微分方程理论
        1.3.4 Halanay脉冲微分不等式
    1.4 主要工作与章节安排
    1.5 符号说明
第二章 周期可变脉冲时间窗口下具有RONs与ROUs的随机多智能体系统的领导跟随均方一致性
    2.1 引言
    2.2 脉冲时间窗口预置布局的设计及多智能体系统模型的构建
    2.3 领导跟随均方一致性分析
    2.4 数值仿真
    2.5 本章小结
第三章 脉冲时间窗口下具有RONs与ROUs的非线性随机多智能体系统的统一的均方一致性准则
    3.1 引言
    3.2 “平均左端点间距”的由来及多智能体系统模型的构建
    3.3 统一的均方一致性准则
    3.4 数值仿真
    3.5 本章小结
第四章 分布式事件触发脉冲控制下具有ROUs与RONs的随机多智能体系统的领导跟随均方一致性
    4.1 引言
    4.2 事件触发机制的设计及多智能体系统模型的构建
    4.3 领导跟随均方一致性分析
    4.4 数值仿真
    4.5 本章小结
第五章 分布式事件触发脉冲控制作用下关于多智能体系统采样数据一致性的优化设计策略
    5.1 引言
    5.2 问题描述及协议构造
        5.2.1 多智能体系统中无领导者
        5.2.2 多智能体系统中领导者全局可达
        5.2.3 多智能体系统中领导者非全局可达
    5.3 主要结果
        5.3.1 无领导者多智能体系统的采样数据平均一致性分析
        5.3.2 领导者全局可达时多智能体系统的采样数据领导跟随一致性分析
        5.3.3 领导者非全局可达时多智能体系统的采样数据领导跟随一致性分析
    5.4 数值仿真
    5.5 本章小结
第六章 具有多时滞的多智能体系统基于网络的采样数据一致性:一种分布式事件触发脉冲控制方法
    6.1 引言
    6.2 问题描述及协议构造
    6.3 主要结果
        6.3.1 多智能体系统采样数据平均一致性分析
        6.3.2 多智能体系统采样数据领导跟随一致性分析(领导者全局可达)
        6.3.3 多智能体系统采样数据领导跟随一致性分析(领导者非全局可达)
    6.4 数值仿真
    6.5 本章小结
结论与展望
参考文献
攻读学位期间取得与学位论文相关的成果
致谢

(7)基于PI控制的时滞多智能体系统一致性研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 多智能体系统一致性研究现状
        1.2.2 时滞多智能体系统一致性研究现状
        1.2.3 基于PID控制的多智能体系统一致性研究现状
    1.3 论文主要工作及章节安排
2 预备知识
    2.1 图论
    2.2 矩阵论
    2.3 稳定性理论
    2.4 线性矩阵不等式
    2.5 本章小结
3 基于PI控制的一阶和异质时滞多智能体系统一致性研究
    3.1 引言
    3.2 基于PI控制的一阶时滞多智能体系统一致性研究
        3.2.1 问题描述
        3.2.2 一致性分析
        3.2.3 数值仿真
    3.3 基于PI控制的异质时滞多智能体系统一致性研究
        3.3.1 问题描述
        3.3.2 一致性分析
        3.3.3 数值仿真
    3.4 本章小结
4 基于PI控制的非线性和含扰动时滞多智能体系统一致性研究
    4.1 引言
    4.2 基于PI控制的非线性时滞多智能体系统一致性研究
        4.2.1 问题描述
        4.2.2 一致性分析
        4.2.3 数值仿真
    4.3 基于PI控制的含扰动时滞多智能体系统一致性研究
        4.3.1 问题描述
        4.3.2 一致性分析
        4.3.3 数值仿真
    4.4 本章小结
5 基于PID控制的时滞多智能体系统一致性研究
    5.1 引言
    5.2 问题描述
    5.3 一致性分析
    5.4 数值仿真
    5.5 本章小结
6 工作总结与展望
    6.1 工作总结
    6.2 工作展望
致谢
参考文献
附录

(8)多智能体预测状态表示模型研究(论文提纲范文)

摘要
Abstract
主要符号对照表
第1章 绪论
    1.1 引言
    1.2 研究问题
    1.3 研究方案
    1.4 主要贡献及意义
    1.5 论文组织结构
    1.6 本章结语
第2章 国内外研究现状
    2.1 智能体系统建模
        2.1.1 马尔可夫决策过程
        2.1.2 部分可观测马尔可夫决策过程
        2.1.3 预测状态表示
    2.2 多智能体系统建模
        2.2.1 分布式马尔可夫决策过程
        2.2.2 分布式局部可观测马尔科夫决策过程
        2.2.3 交互式部分可观察马尔可夫决策过程
        2.2.4 交互动态影响图
    2.3 本章结语
第3章 预测状态表示及相关理论基础
    3.1 预测状态表示理论基础
    3.2 多智能体系统预测状态表示理论
    3.3 交警方向乘子法
    3.4 张量理论基础
    3.5 本章结语
第4章 基于优化技术的多智能体预测状态表示模型
    4.1 基于优化技术的多智能体预测状态表示模型建模
        4.1.1 建立预测状态表示优化模型
        4.1.2 ADMM求解优化问题
    4.2 学习预测状态表示模型参数
    4.3 实验分析
        4.3.1 性能评估
        4.3.2 模型参数敏感性分析
        4.3.3 实验结果对比分析
    4.4 本章结语
第5章 基于张量分解的多智能体预测状态表示模型
    5.1 基于张量分解的两智能体的预测状态表示模型
        5.1.1 学习两智能体预测状态表示模型预测参数
        5.1.2 最优化模型求解两智能体预测状态表示模型转移矩阵
    5.2 基于张量分解的多智能体的预测状态表示模型
    5.3 实验分析
    5.4 本章结语
第6章 基于张量优化的多智能体预测状态表示模型
    6.1 基于张量优化技术的两智能体预测状态表示模型
        6.1.1 学习两智能体预测状态表示的张量优化模型
        6.1.2 优化问题松弛化处理
        6.1.3 ADMM求解优化模型子问题
        6.1.4 学习两智能体预测状态表示模型的转移矩阵
    6.2 基于张量优化技术的多智能体预测状态表示模型
        6.2.1 学习多智能体预测状态表示的张量优化模型
        6.2.2 学习多智能体预测状态表示模型的转移矩阵
    6.3 实验分析
    6.4 本章结语
第7章 总结和展望
在读期间取得的科研成果和参与的项目
致谢
附录
参考文献

(9)CPS-Service运行支撑平台关键技术研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 信息物理融合系统(Cyber Physical Systems)
        1.1.1 信息物理融合系统的定义
        1.1.2 信息物理融合系统的组成与特点
        1.1.3 信息物理融合系统的国内外发展现状
    1.2 CPS-Service运行支撑平台
        1.2.1 CPS设计与实现面临的挑战
        1.2.2 CPS-Service运行支撑平台的提出
    1.3 论文研究内容
    1.4 论文内容安排
2 CPS-Service运行支撑平台结构设计
    2.1 几种主流的CPS运行支撑平台结构
    2.2 现有CPS运行支撑平台分析
        2.2.1 基于构件的CPS运行支撑平台分析
        2.2.2 基于服务的CPS运行支撑平台分析
        2.2.3 基于Agent的 CPS运行支撑平台分析
        2.2.4 现有CPS运行支撑平台的比较
    2.3 一种基于实时云的CPS-Service运行支撑平台
        2.3.1 CPS应用任务执行层
        2.3.2 CPS-Service注册与发现层
        2.3.3 CPS-Service使能层
    2.4 小结
3 CPS-Service描述与匹配方法
    3.1 引言
        3.1.1 相关研究
        3.1.2 主要工作与贡献
    3.2 一种基于本体的CPS-Service模型
        3.2.1 物理实体本体模型
        3.2.2 物理环境本体模型
        3.2.3 CPS-Service本体模型
    3.3 基于概率聚类和R树的快速CPS-Service匹配方法
        3.3.1 基于概率聚类的CPS-Service索引构建
        3.3.2 基于R树的CPS-Service索引构建
        3.3.3 在线CPS-Service匹配
    3.4 仿真实验
        3.4.1 实验设置
        3.4.2 实验结果及分析
    3.5 小结
4 物理位置与环境敏感的CPS-Service组合方法
    4.1 引言
        4.1.1 相关研究
        4.1.2 主要工作与贡献
    4.2 基本概念与定义
    4.3 考虑物理位置敏感性的CPS-Service组合问题
        4.3.1 问题的提出
        4.3.2 问题定义与求解分析
        4.3.3 基于改进量子遗传算法的CPS-Service组合方法
        4.3.4 仿真实验
    4.4 考虑执行可靠性的CPS-Service组合问题
        4.4.1 问题的提出
        4.4.2 问题定义与求解分析
        4.4.3 多目标优化与超启发式方法相关研究
        4.4.4 基于退火Pareto汤普森采样的超启发式CPS-Service组合方法
        4.4.5 仿真实验
    4.5 小结
5 CPS-Service云基增强方法
    5.1 引言
        5.1.1 相关研究
        5.1.2 主要工作与贡献
    5.2 问题定义与求解分析
        5.2.1 数学模型
        5.2.2 问题定义
        5.2.3 问题求解分析
    5.3 基于贪婪选择的CPS-Service增强方法
    5.4 基于个体稀疏的CPS-Service增强方法
    5.5 仿真实验
        5.5.1 实验设置
        5.5.2 实验结果及分析
    5.6 小结
6 原型系统及相关软件工具实现
    6.1 引言
    6.2 原型系统主要功能模块实现
        6.2.1 基于云的CPS-Service增强框架
        6.2.2 CPS-Service匹配框架
        6.2.3 CPS应用任务执行引擎
    6.3 相关软件工具原型实现
        6.3.1 CPS-Service描述工具
        6.3.2 CPS应用任务流程构造工具
    6.4 原型系统应用验证与性能测试
        6.4.1 应用验证
        6.4.2 性能测试
    6.5 小结
7 结论和展望
    7.1 论文总结
    7.2 研究展望
参考文献
致谢
攻读博士学位期间发表的学术论文和参加科研情况

(10)基于SO-CIR-Agent模型的智能代理平台在拍卖领域的应用(论文提纲范文)

摘要
Abstract
1. 前言
    1.1 课题研究背景和意义
    1.2 课题研究内容
    1.3 论文结构
2. Agent及其属性
    2.1 Agent的介绍
    2.2 Agent的定义
    2.3 多Agent系统
        2.3.1 MAS的定义及特点
        2.3.2 MA S的体系结构
    2.4 Agent通信语言
        2.4.1 KQML语言
        2.4.2 FIPA ACL
    2.5 Agent的抽象体系结构
        2.5.1 BDI模型
        2.5.2 CIR-Agent模型
3. Web Service
    3.1 Web Service概览
        3.1.1 构成Web服务的技术
        3.1.2 Web服务的前景
        3.1.3 Web服务的定义
    3.2 Web服务模型
        3.2.1 Web服务体系结构中的角色
        3.2.2 Web服务体系结构中的操作
        3.2.3 Web服务的构件
        3.2.4 Web服务开发生命周期
    3.3 Web服务通信模型
        3.3.1 基于消息路由的通信模型
        3.3.2 基于RPC的通信模型
    3.4 服务描述的发布和发现
        3.4.1 服务发布
        3.4.2 服务发现
    3.5 Web服务在分布式环境中的优势
4. SO-CIR-Agent系统平台设计
    4.1 系统模型分析
    4.2 系统基本描述
    4.3 SO-CIR-Agent平台原理
        4.3.1 知识模块
        4.3.2 通信模块
        4.3.3 基于Web服务的通信
    4.4 系统实现
5. SO-CIR-Agent系统平台实现
    5.1 SO-CIR-Agent系统平台开发环境
    5.2 基于Agent JADE平台的开发
        5.2.1 JADE平台简介
        5.2.3 Agent的设计与实现
    5.3 基于Agent的服务
    5.4 实例分析
        5.4.1 问题描述
        5.4.2 平台实现过程
6. 结束语
    6.1 总结
    6.2 展望
致谢
参考文献
在读期间科研成果目录

四、模型智能构造Agent研究(论文参考文献)

  • [1]基于社交网络的拍卖机制设计理论研究[D]. 李斌. 电子科技大学, 2021(01)
  • [2]基于观测器的多智能体系统包含控制研究[D]. 张静怡. 南京信息工程大学, 2021(01)
  • [3]基于强化学习的多智能体协作建模方法研究[D]. 胡大鹏. 齐鲁工业大学, 2021(10)
  • [4]一类非线性系统的自适应迭代学习容错控制[D]. 刘恒. 青岛科技大学, 2021(01)
  • [5]多智能体系统事件触发编队控制研究[D]. 柴小丰. 北京科技大学, 2021
  • [6]不同控制机制下几类非线性多智能体系统的脉冲一致性研究[D]. 张振华. 广东工业大学, 2021
  • [7]基于PI控制的时滞多智能体系统一致性研究[D]. 王琦. 南京理工大学, 2020(01)
  • [8]多智能体预测状态表示模型研究[D]. 马碧阳. 厦门大学, 2019(08)
  • [9]CPS-Service运行支撑平台关键技术研究[D]. 孙远. 西北工业大学, 2018(02)
  • [10]基于SO-CIR-Agent模型的智能代理平台在拍卖领域的应用[D]. 张挺. 西南财经大学, 2012(05)

标签:;  ;  ;  ;  ;  

模型智能构建代理研究
下载Doc文档

猜你喜欢