一类Nash均衡问题的信赖域方法研究开题报告
2020-02-19 21:54:53
1. 研究目的与意义(文献综述)
纳什均衡,又名非合作博弈均衡,因著名数学家、经济学家约翰·纳什而得名。有些人认为纳什师从于博弈论的开创者冯·诺依曼,在纳什和冯·诺依曼之前,经济学家古诺、斯坦伯格、埃奇沃思,数学家波雷尔和梅洛等,都曾尝试过博弈论的研究。而早在18世纪大哲学家休谟就曾提出“均衡”的思想。
上世纪50年代,纳什首次论证了“纳什均衡”的思想。相同时期,纳什的导师tucker提出了著名的“囚徒困境”的概念,由此,师生二人的研究成果开创了现代非合作博弈论。在此均衡中,不论他人的策略如何,始终保持自己的策略是相对于其他人策略选择的最优方案,即让自己的效用函数最小化,当你无法左右他人的选择时,纳什均衡可以让参与各方达成一种暂时的平衡,而相应的策略选择也是最为保险的。20世纪60至70年代则是博弈论的发展时期。1965年,reinhard selten提出了完美纳什均衡(subgame perfect nash equilibrium)概念。1967至1968年,john c harsanyi 提出贝叶斯纳什均衡(bayesian nash equilibrium)概念。1982 年 kreps 和 wilson 合作建立了关于动态不完全信息博弈的理论。此外,kreps、milgrom、roberts 和 wilson 于1982年共同创立了“kmrw 声誉模型”。
伴随着与纳什均衡相关实际问题研究的深入,算法也在不断地发展和创新,目前流行的解决方法有:一,转化为等价的拟变分不等式问题进行求解;二,利用nikaido-isoda 函数、gap 函数转化为最优化问题求解。近年来信赖域算法逐渐被运用于解决纳什均衡问题。
2. 研究的基本内容与方案
研究的主要内容及目标是给出一种适用于求解纳什均衡问题的jacobi类型的信赖域算法,并研究该方法在一定条件下的收敛性。
主要内容包括四个部分:
-
对于纳什均衡问题给出一种jacobi类型的信赖域算法
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!3. 研究计划与安排
1-3周:查阅相关文献,完成开题报告
4-6周:总体设计,对纳什均衡问题和信赖域方法有更深刻的理解,完成论文综述
7-10周:设计Jacobi类型的信赖域算法,功能模块设计
11-13周:编码和测试,完成对算法收敛性的理论证明。
14-15周:写论文,提交初稿,给老师检查,修改定稿,答辩。4. 参考文献(12篇以上)
[1] 高苗苗,宫恩龙,孙清滢,王真真,杜小雨.一类新的基于信赖域技术的非单调共轭梯度算法[j].工程数学学报,2018,3505:502-514.
[2] 王真真,刘延浩,高苗苗,孙清滢.基于修正拟牛顿方程解非线性方程组问题的非单调自适应信赖域算法[j].曲阜师范大学学报(自然科学版),2018,4404:28-36.
[3] 李春念,袁功林.求解无约束问题的修正prp共轭梯度算法[j].西南大学学报(自然科学版),2018,4009:67-75.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付