分享到:

风险敏感度激励学习的广义平均算法

提出了一种新的算法.这个算法通过潜在地牺牲控制策略的最优性来获取其鲁棒性.这是因为,如果在理论模型与实际的物理系统之间存在不匹配,或者实际系统是非静态的,或者控制动作的可使用性随时间的变化而变化时,那么鲁棒性就可能成为一个十分  (本文共10页) 阅读全文>>

上海大学
上海大学

激励学习的若干新算法及其理论研究

本博士论文大体上可以分成两大部分,第一部分我们给出了激励学习的一些新算法,其目的是为了改进现有算法所面临的诸于维数灾难与计算速度等问题。第二部分是我们在基于风险敏感度概念的基础上,研究了与激励学习有关的最优方程与最优解的理论问题。本论文首先提出了一种新的激励学习算法,即我们所说的激励学习的遗忘算法。这种算法的基本思想是基于下面的考虑:以前的有关激励学习算法都只是通过对状态被访问次数的短时记忆来确定状态值函数空间的更新长度。对于这些算法来说,无论是用lookup表的形式,还是用函数逼近器的形式,对所有状态的值函数都必须要全部记忆。这些方法对大状态空间问题会导致需要指数增长的记忆容量,从而呈指数地减慢计算速度。Sutton等人考虑过这个问题,但始终没有得到满意的解决方案。基于上述考虑,将记忆心理学中有关遗忘的基本原理引入值函数的激励学习算法的研究之中,特别是对于著名的SARSA(λ)算法,形成了一类适合于值函数激励学习的遗忘算法。我...  (本文共163页) 本文目录 | 阅读全文>>

《现代商业》2020年14期
现代商业

驻沙特中国企业人员跨文化敏感度测评与分析

本研究采用问卷调查和深度访谈相结合的研究方法,对60位现在仍在沙特工作和生活的中国企业人员的跨文化敏感度水平以及个人因素与跨文化敏感度之间的相关关系进行测评与分析。通过研究发现:首先,驻沙特中国企业人员的跨文化敏感度处于中等偏高水平,他们的跨文化敏感度总分达到了94.33分,跨文化敏感度五因子平均分为3.926分;其次,在跨文化敏感度五因子中,差异认同感...  (本文共5页) 阅读全文>>

《学园》2017年22期
学园

论新闻编辑记者的新闻敏感性

对于新闻媒体来说,新闻的影响力主要来源于编辑记者,而编辑记者对于新闻的来源...  (本文共1页) 阅读全文>>

权威出处: 《学园》2017年22期
《浙江理工大学学报(社会科学版)》2016年03期
浙江理工大学学报(社会科学版)

留学生跨文化敏感度研究

采用问卷调查的方式研究留学生跨文化敏感度的整体情况和不同个体因素留学生跨文化敏感度的差异。结果发现:全体留学生的跨文化敏感度较高,跨文化敏感的五个维度之间显著正相关。不同个体因素的留学生存在一定的跨文化敏感度差异,中华文化...  (本文共7页) 阅读全文>>

《商》2013年14期

浅谈培养学生的信息敏感度

信息积累的丰厚与否,是一个国家历史和文明的象征;信息的迅捷与否,甚至能关系到一个国家的生死存亡。信息对个人的成长,个人目标的实现也有至关重要的...  (本文共1页) 阅读全文>>

权威出处: 《商》2013年14期
《浙江中医杂志》2003年05期
浙江中医杂志

糖尿病视网膜病变光敏感度的检测与中医辨证分型

对比敏感度较视力更能全面地反映出视觉形觉功能。为了研究糖尿病视网膜病变的光敏感度变化与辨证分型的关系 ,我们选...  (本文共1页) 阅读全文>>