分享到:

多agent协作团队的学习方法研究

多agent技术作为一种分布式人工智能新技术已经迅速渗透到信息社会的各个环节中,多agent学习技术作为多agent技术与机器学习的交叉研究领域,是当前分布式人工智能研究中的一项颇受关注的前沿课题。本论文以多agent协作团队为研究对象,对多agent协作求解过程进行了研究;利用强化学习的理论以及经验共享和马尔可夫博弈理论的思想,对多agent协同强化学习方法进行了研究:对改进团队协作性能的其他学习方法也进行了探索。作者完成的主要工作和取得的创新性成果如下:1.提出了一个适合于多agent协作团队的协作求解框架,并在此基础上实现了一个原型系统MBOS。在协作求解框架中,结合团队工作模型的理论和理性BDI模型的特点,给出了从发起组建团队到结果评价的整个协作求解的过程:在原型系统MBOS的工程实现中,提出了一个AGENTFRAME结构以及相应的多线程并发控制机制和会话管理方法。其中,多线程并发控制机制使得agent能够有效地完成决策  (本文共142页) 本文目录 | 阅读全文>>

国防科学技术大学
国防科学技术大学

多Agent协作团队的强化学习方法研究

强化学习,因其不需要环境模型、通过Agent和所在环境的自主交互进行学习的特点,现已成为多Agent系统和机器学习领域的研究热点。多Agent系统常被应用于开放、复杂、动态变化的环境,单个Agent的能力已不能胜任所面临的任务,尤其是具有相同目标的系统,Agent之间必须协同求解。同时,Agent还必须具备学习能力以适应环境的动态变化。但传统的单Agent学习原理并不适用于多Agent环境,因此亟待根据多Agent系统的协同性,提出新的学习方法。Pursuit Game问题常用于来测试人工智能领域的学习算法,本文就此问题提出了两种多Agent协同强化学习方法:基于承诺和约定的方法和基于联合行为优先序列的方法。文章首先介绍了Agent和多Agent系统、以及多Agent学习的一些基本概念,然后介绍了强化学习和多Agent强化学习的研究现状和未来发展方向。第二部分对强化学习理论和多Agent强化学习理论进行了简要介绍。在对Pursu...  (本文共89页) 本文目录 | 阅读全文>>

哈尔滨工业大学
哈尔滨工业大学

基于强化学习的多机器人追捕问题研究

多机器人协调与协作问题是多机器人系统研究的热点之一。多机器人追捕问题是研究多智能体机器人系统中多机器人协调与协作问题的理想平台。它主要研究多个追捕者捕获运动的多个逃跑者的动态过程中通过相互间的协作与协调使追捕者间避免冲突,获利最大的最优协作追捕算法。同时它涵盖了实时视觉处理、无线通讯、实时动态路径规划、多机器人分布式协调与控制、多机器人规划与学习、机器人团队之间的竞争与合作等多学科、多领域知识。强化学习是学习如何把状态映射到动作,并且使得用数字表示的奖励信号最大的一种学习方法。将强化学习应用到多机器人追捕问题中,使追捕机器人能够主动的试探环境,在与环境交互的动态过程中获得知识,不断地提高系统自身的性能,通过积累经验明确系统当前性能与目标性能之间的距离,实施改进操作,提高系统追捕效率。本文以多个机器人追捕多个逃跑目标的过程为背景,探索多体机器人的协作机制为导向,提高多体机器人的协作效率为目的,研究了多个理性智能体在动态复杂环境下的...  (本文共144页) 本文目录 | 阅读全文>>

广东工业大学
广东工业大学

团队对抗性游戏决策系统的研究与实现

随着人工智能理论与技术在军事对抗和国民生产等领域的广泛运用,多智能体系统已用于诸多问题的求解。当前,团队对抗性游戏已成为了智能决策控制研究的焦点,如:战机空空协同作战系统、集群式作战机器人和Robocup仿真组足球机器人等。由于娱乐性、对抗性、动态性和不确定性,使其成为人工智能和机器人学结合的理想平台。这些系统,有着共同的特征。首先,比赛的形式是敌我双方阵型的团队博弈,其中每个机器人是具有决策能力的智能体。其次,在比赛过程中,不但要发挥自主角色个体技术,而且还能通过合作策略发挥集体力量。要获得博弈的胜利,必须集成许多技术,其中,决策系统是机器人是否具有高智能的体现,并且是团队对抗获胜的关键。本文对团队对抗性游戏决策系统展开研究,从团队的个体决策来实现团队的整体协作入手,本文设计了团队成员的双层决策模型,包括团队成员的高层协作策略和交互层基本行为策略。基于双层模型的决策系统简化了决策内容的设计与学习,增强了推理的能力,主要内容包括...  (本文共101页) 本文目录 | 阅读全文>>

河南师范大学
河南师范大学

基于博弈论的多Agent协作研究

随着Agent技术的不断发展,Agent的应用已逐渐深入到了各个领域。Agent所执行任务的难度以及应用环境的复杂度也在不断增加,单个Agent已经不能满足应用的要求,多Agent系统研究已成为Agent技术的一个重要研究方向。目前多Agent系统成为分布式人工智能领域的一个重要分支,同时也是当今国际上人工智能领域研究的热点问题之一,而多Agent协作问题是多Agent系统研究的核心问题之一。多Agent环境中,Agent的行为选择受到环境中其它Agent行为选择的影响,博弈论为这种相互影响的决策行为提供了很好的数学工具,本文利用博弈论的方法,来研究多Agent的协作问题,具体内容如下:(1)对国内外多Agent协作的研究现状进行综述,介绍了多Agent协作的主要研究内容、目前的热点问题,对已取得成果进行分析,并指出其中存在的不足。(2)介绍了Agent和多Agent系统的相关概念,博弈论的概念及分类,Nash均衡的定义及相关定...  (本文共54页) 本文目录 | 阅读全文>>

西安电子科技大学
西安电子科技大学

强化学习方法及应用技术研究

强化学习是一种重要的机器学习方法,在智能控制及分析预测领域有很多应用。学习者通过与环境进行不断试错性的交互来改善自身行为,所以很适合于学习者在对环境了解甚少的问题域中学习控制策略。多Agent强化学习是传统强化学习的改进,其利用多个Agent共同协作学习,能更好的适应开放、复杂、动态变化的环境。首先,对于单Agent强化学习算法,研究并改进了启发式动作选择的强化学习方法。在每幕学习结束后,运用状态回溯方法来分析这幕学习中的状态转移过程,用以指导接下来Agent的动作选择,加速学习过程。其次,对于集中式多Agent强化学习,运用一种分解策略将总任务分解成各子任务,进而分发给各独立学习的Agent去完成。学习过程中,各Agent将对其它Agent获取的经验进行学习,并将自身的经验共享出去,再运用经验总结方法进一步强化好的行为,使学习能够更快的收敛。多目标围捕实验结果表明所研究方法是有效的。最后,针对采用联合行为的多Agent协同强化...  (本文共67页) 本文目录 | 阅读全文>>