惩罚与激励双视角下绿色矿山建设的演化博弈与仿真
Evolutionary Game and Simulation of Green Mine Construction from the Perspective of Punishment and Incentive
通讯作者:
收稿日期: 2021-06-02 修回日期: 2021-09-24
基金资助: |
|
Received: 2021-06-02 Revised: 2021-09-24
作者简介 About authors
陈婉菁(1997-),女,江西赣州人,硕士研究生,从事区域资源开发与管理工作
关键词:
Keywords:
本文引用格式
陈婉菁, 吴泽斌.
CHEN Wanjing, WU Zebin.
推进绿色矿山建设是全面贯彻落实新发展理念、加强矿业领域的生态文明建设、促进矿业转型和高质量发展的有效路径。绿色矿山建设包括生态环境治理、自然资源开发与利用、可持续创新型智慧矿山和矿山循环经济等内容(刘建兴,2014)。2017年,国土资源部、财政部、环境保护部、国家质检总局、银监会和证监会联合印发《关于加快建设绿色矿山的实施意见》,要求加快绿色矿山的建设进程,加大政策的支持力度。2019年,在绿色矿山遴选过程中,共有953家矿山企业被纳入全国绿色矿山名录。虽然我国已经出台了加快绿色矿山建设的指导文件,地方政府和企业也在积极探索推进绿色矿山建设,但现阶段的政策在矿山企业的违规治理方面还不完善,未将专项整治与政策激励相结合,仍有较大的提升空间。在推进绿色矿山建设过程中,尚存在地方政府与企业的双方博弈、主动性欠缺,评选中有虚报、瞒报现象,甚至存在参评时执行一套标准、评选后执行另一套标准的情况。截至2018年底,全国矿山开采占用损毁土地面积约为36×109 m2,其中正在开采的矿山约占37%(自然资源部,2020),结合当前新形势、新问题和新要求,如何更有效地推进绿色矿山建设,转变我国矿业发展方式,是当下重要命题。
关于绿色矿山建设的研究,主要聚焦3个方面:(1)绿色矿山建设激励政策研究。切实落实税费方面的优惠政策,解决新常态下绿色矿山建设面临的问题(杨俊鹏等,2017);延伸产业链、落实各方责任,促进江西省绿色矿山建设的发展(郑先坤等,2018);对绿色矿山建设优惠政策缺失问题进行探讨(靳利飞等,2014)。(2)绿色矿山建设绩效评价。钟琛等(2017)、李芬等(2018)、王永卿等(2019)、赵国彦等(2019)和Pell et al.(2018)对绿色矿山建设的效果进行评价与考核分析。(3)绿色矿山数字建设。建立综合调度指挥集成平台,提高矿山建设的调度管理效率(谭章禄等,2014);设计智慧露天矿山建设的基本框架及体系(张瑞新等,2019);构建深地资源安全高效的矿业开采框架和矿山循环经济模式(李夕兵等,2019);研制露天矿自动化运输控制系统(Igor et al.,2017)。从研究内容来看,现有研究在绿色矿山建设领域取得了丰硕的成果,但是关于如何规范地方政府和当地企业行为的研究较少,且大多以定性分析为主,定量测评或构建模型求解的研究甚少。从研究视角来看,现有研究多以税收优惠、专项保证金等激励视角为主,而从惩罚视角探讨绿色矿山建设的研究较少,仅靠激励政策有可能带来损害绿色矿山建设实施效果、降低政府补助金利用效益和增加监管难度等消极作用。因此,既注重激励也注重惩罚,更符合绿色矿山建设主体行为实际,从惩罚与激励双视角出发探讨绿色矿山建设更具现实意义。
绿色矿山建设是多主体参与的过程,随机性和变动性是其重要特征。吴信科等(2019)对地方政府和矿山企业的联动机制建设进行了研究,但在动态博弈方面的分析还有待深入。演化博弈理论具有有限理性假设以及不完全信息的优势,适用于地方政府和矿山企业在绿色矿山建设中的复杂动态决策。绿色矿山建设是一个长期性、周期性的问题,运用系统动力学进行政策仿真,能够对地方政府和矿山企业的博弈情况做出较为科学的解释,从而得到博弈最优结果。鉴于此,在借鉴前人研究方法(朱庆华等,2014;王志强等,2019;谢识予,2001)的基础上,从政府惩罚与激励相结合的双视角出发,将演化博弈理论与系统动力学理论相结合,建立地方政府和矿山企业的系统动态(System Dyna-mic,SD)演化博弈分析模型,并在此基础上进一步分析动态惩罚与动态激励机制下博弈双方演变的实际情况,通过Vensim软件仿真演示双方策略行为,为绿色矿山建设的奖惩机制设计与管理实践提供参考依据。
1 地方政府与矿山企业的博弈模型
1.1 模型假设
(1)博弈主体假设
绿色矿山建设中主要参与者是地方政府和矿山企业。地方政府是奖罚的实施方,矿山企业是奖罚的承受方,双方均是有限理性主体在信息不对称的条件下通过多次博弈来找寻最优策略。基于博弈论和系统动力学构建地方政府和矿山企业的博弈模型,充分考虑了双方主体的角色、地位和利益诉求,体现了绿色矿山建设过程中地方政府和矿山企业两大主体行为协同耦合的发展机理,从一定程度上为解决绿色矿山建设中企业内生动力不足和政府心有余而力不足的困境提供了决策参照。
对于地方政府而言,政府部门作为博弈一方不仅会考虑公共利益,也会考虑自身利益。在推进绿色矿山建设过程中,地方政府采取有效措施对矿山企业进行引导、鼓励,最终实现社会经济和生态环境的良性发展以及自身利益的最大化。政府的可选策略分为“高奖惩”和“低奖惩”,对应的初始概率分别为x和
对矿山企业而言,企业以利润最大化为重要目标,但是矿山企业在实施绿色发展过程的前期,需要淘汰落后技术,引进先进技术,耗费一定的人力、物力和资源对矿山进行整体规划,会减少企业当前的收益。而在外部奖罚政策推动下,矿山企业推进绿色矿山建设反而会获得额外收益。矿山企业可选策略分为“高参与”和“低参与”,其初始概率分别为y和
(2)其他变量假设
结合现阶段绿色矿山建设的发展情况,将影响双方博弈的因素纳入其中,进一步构建博弈收益矩阵。对于地方政府来说,假设“a”是政府选择“高奖惩”策略所支出的直接成本,包括财政补贴、购买服务等对企业的资金支持和额外增加的监管、培训费用;“b”是政府“高奖惩”所付出的间接成本,如政策推行、媒体宣传和专项调研等活动所需的成本。此外,假设“c”是指企业积极参与绿色矿山建设时政府获得的额外收益,例如:解决矿地矛盾、过度开采和环境破坏等问题;“d”是指政府对不符合绿色矿山标准而额外支付的外部成本,如地质灾害、生态环境和矿区稳定等治理成本。对于矿山企业来说,假设“e”是指企业在经营过程中所获利润;“f ”是指企业积极参与绿色矿山建设获得的间接收益;“g”是指企业引进绿色先进技术和员工培训等所需成本;“h”是指矿山企业所受到的罚金,包括违规、违法处罚等。
根据以上假设,博弈双方为了自身利益最大化,在策略组合中进行多次博弈,双方博弈支付矩阵可由表1表示。
表1 静态博弈下地方政府和矿山企业博弈收益矩阵
Table 1
博弈双方 | 矿山企业 | ||
---|---|---|---|
高参与y | 低参与1-y | ||
地方政府 | 高奖惩x | [c-a-b,a+e+f-g] | [h-b-d,e-h] |
低奖惩1-x | [c-b,e+f-g] | [-b-d,e] |
1.2 模型建立
在借鉴以往学者关于模型构建的研究成果(王志强等,2019;谢识予,2001;Gardner,1995),结合绿色矿山建设特点,根据以上假设,已知政府的选择是“高奖惩”和“低奖惩”策略,矿山企业的策略是“高参与”和“低参与”绿色矿山建设。
对于地方政府而言,选择“高奖惩”与“低奖惩”策略的期望收益
对于矿山企业而言,选择“高参与”与“低参与”绿色矿山建设的期望收益
由此可知,地方政府“高奖惩”策略和矿山企业“高参与”绿色矿山建设策略下的复制动态方程
2 静态机制下演化博弈模型的稳定性及仿真分析
2.1 地方政府“奖惩”策略的演化均衡分析
由复制动态方程F(x)可知,
若
若
在参照谢识予(2001)研究成果的基础上,当
(1)当
(2)当
当矿山企业“高参与”策略的概率大于动态博弈的均衡值时,地方政府倾向于选择“低奖惩”策略;当矿山企业“高参与”策略的概率小于动态博弈的均衡值时,地方政府选择“高奖惩”策略的概率更高。
2.2 矿山企业“参与”策略的演化均衡分析
由复制动态方程F(y)可知,
若
若
当
(1)当
(2)当
(3)当
当
当
当矿山企业引进绿色先进技术、员工培训等所需成本与企业积极参与绿色矿山建设的间接收益之差越大时,矿山企业倾向于采取“低参与”策略。地方政府也要相应地提高“高奖惩”策略中付出直接成本及收取的企业罚金金额,来提高企业参与绿色矿山建设的积极性。
2.3 地方政府和矿山企业混合策略演化均衡分析
由以上博弈分析可以看出,不同初始情况下地方政府和矿山企业的演化策略不同。从现阶段企业参与绿色矿山建设的情况来看,矿山企业积极参与绿色矿山建设的成本要大于参与绿色矿山建设所带来的间接收益。同时,政府也会通过激励手段和惩罚措施来避免极端情况的产生。因此,本文仅分析
根据Friedman(1998)提出的观点,演化系统均衡点的稳定性可由该系统得到的雅克比矩阵的局部稳定性分析中得到,对于复制动态方程求其雅克比矩阵 J,可表示为
若均衡点满足det( J )>0、tr( J )<0,则均衡点满足演化动态过程中任一局部渐进稳定的不动点,与演化稳定策略相对应。根据雅可比矩阵局部稳定性分析方法,均衡点稳定性分析结果见表2。
表2 均衡点的稳定性分析结果
Table 2
均衡点 | det( J ) | 判断正负 | tr( J ) | 判断 正负 | 均衡点类型 |
---|---|---|---|---|---|
(0,0) | h(f-g) | - | h+f-g | 不确定 | 鞍点 |
(0,1) | a(f-g) | - | a+f-g | 不确定 | 鞍点 |
(1,0) | -h(a+h+f-g) | - | a+f-g | 不确定 | 鞍点 |
(1,1) | -a(a+h+f-g) | - | h+f-g | 不确定 | 鞍点 |
+ | 0 | 0 | 中心点 |
基于以上分析,点
2.4 模型仿真及分析
在地方政府促进矿山企业参与绿色矿山建设的演化博弈过程中,博弈双方会根据对方的策略来调整自己的策略,因此采用系统动力学的方法分析博弈过程中均衡解稳定性的情况,从而分析得到博弈最优结果。参考赣州市某露天矿开采及地质环境治理工程案例,博弈模型的参数取值需满足条件
图1
图1
地方政府和矿山企业的演化博弈模型(SD模型)
Fig.1
Evolutionary game model between local government and mining enterprises(SD model)
当
图2
图2
静态机制下地方政府与矿山企业演化博弈的仿真轨迹
Fig.2
Simulation trajectory of evolutionary game between local government and mining enterprises under static mechanism
由此可见,系统的博弈演化过程是围绕稳定中心周期性运动的闭轨线环,地方政府和矿山企业2个群体的博弈过程呈现出不稳定的周期性行为模式,且博弈行为不易控制。表明地方政府和矿山企业在进行绿色矿山建设过程中,也在不断调整自己的策略。
当
图3
图3
静态机制下不同初始值的企业参与绿色矿山建设的演化过程
Fig.3
Evolution process of enterprises with different initial values participating in green mine construction under static mechanism
目前绿色矿山建设治理成本高、难度大,不能为企业带来太多的直接经济效益,加之矿山开采通常采用露天开采模式,进一步加大了生态环境修复的难度。对地方政府来说,若企业进行绿色矿山建设,可以减少当地矿山修复的实际成本,同时也带来正面宣传等间接收益。考虑到这些影响因素均对绿色矿山建设博弈系统产生的影响,因此选取a、h、g、f共4个变量来模拟变量数值变化对矿山企业行为的变化。在满足
图4
图4
改变其他变量对矿山企业参与绿色矿山建设的影响
Fig.4
Influence of changing other variables on mining enterprises’ participation in green mine construction
3 动态惩罚与动态激励机制下演化博弈模型分析及仿真
3.1 动态惩罚机制对模型的影响
(1)稳定性分析
以上分析是假设矿山企业所受到的惩罚罚金是固定值,是静态机制。然而,从实际情况来看,矿山企业对推进绿色矿山建设所采取的行为不尽相同,导致博弈双方最终的决策行为不稳定,因而针对不同的行为采用不同的惩罚措施加以监管、修正,称为动态惩罚机制。假设地方政府对矿山企业实施惩罚的罚金
表3 动态惩罚机制下地方政府和矿山企业博弈收益矩阵
Table 3
博弈双方 | 矿山企业 | ||
---|---|---|---|
高参与y | 低参与1-y | ||
地方政府 | 高奖惩x | [c-a-b,a+e+f-g] | [h(y)-b-d,e-h(y)] |
低奖惩1-x | [c-b,e+f-g] | [-b-d,e] |
下面对动态惩罚机制下地方政府和矿山企业的混合博弈策略进行稳定性分析,将
令
求出系统的雅克比矩阵:
将
将
求得其特征根为
(2)均衡点分析
由以上分析可知,
求解方程组,得到:
讨论各参数对系统均衡点产生的影响:
①对
②对
(3)仿真分析
假设q=2,当
图5
图5
动态惩罚机制下地方政府与矿山企业演化博弈的仿真轨迹
Fig.5
Simulation track of the evolution game between local government and mining enterprises under dynamic punishment mechanism
假设政府采取“高奖惩”策略的初始概率为x=0.4,企业采用“高参与”策略进行绿色矿山建设的初始概率分别为y=0.2和y=0.8时,博弈演化过程随时间变化的曲线如图6(a)所示;政府采取“高奖惩”策略的初始概率为x=0.7,企业采用“高参与”策略进行绿色矿山建设的初始概率分别为y=0.2和y=0.8时,博弈演化过程随时间变化的曲线如图6(b)所示。从仿真结果来看,动态惩罚机制下矿山企业采用“高参与”策略的演化趋势呈逐渐收敛,政府采取“高奖惩”策略的概率不同,导致矿山企业策略行为初始演化的情况也不同,但最终稳定到均衡点。说明采用动态惩罚机制促使了矿山企业参与绿色矿山建设的行为稳定,从而提高了企业参与的积极性。
图6
图6
动态惩罚机制下不同初始值的企业参与绿色矿山建设的演化过程
Fig.6
Evolution process of enterprises with different initial values participating in green mine construction under dynamic punishment mechanism
令地方政府和矿山企业初始概率分别为x=0.4,y=0.2,研究不同机制下的惩罚措施对矿山企业参与绿色矿山建设的影响。当惩罚金额为固定值时,企业采用“高参与”策略进行绿色矿山建设的概率呈周期性变动,且波动范围变大。当采用动态惩罚机制时,企业采用“高参与”策略进行绿色矿山建设的概率由波动状态逐渐收敛,并最终稳定到均衡值。而当动态惩罚机制延迟4个月之后,企业采用“高参与”策略进行绿色矿山建设的概率波动不断变小,但最终并没有稳定下来,稳定效果受到影响(图7)。因此,在对矿山企业实施惩罚机制时,需及时将相关惩罚措施落实到位,逐步引导矿山企业生产转型,并根据矿山企业的具体情况进行相应规划。
图7
图7
当x=0.4,y=0.2时不同惩罚机制下企业参与绿色矿山建设的演化过程
Fig.7
Evolution process of enterprises participating in green mine construction under different punishment mechanisms when x=0.4 and y=0.2
3.2 动态激励机制对模型的影响
(1)稳定性分析
同理,在绿色矿山建设的背景下,静态演化博弈是假设政府激励所支出的直接成本是固定值。但是从实际情况来看,有关部门制定了绿色矿山评选标准,根据相关标准并结合管辖范围内矿山实际情况,地方政府也会制定相应的激励政策,因而激励行为并不是固定的。对于不同的情况,需要采取相应的激励补偿措施,称为动态激励机制。对于动态激励机制,假设地方政府激励所支出的直接成本a与矿山企业采用“低参与”策略进行绿色矿山建设的行为成正比关系,此时地方政府对矿山企业的激励金额关系式为a(y)=(1-y)p,其中p为地方政府对矿山企业的激励强度,在此动态激励机制下,地方政府和矿山企业演化博弈收益矩阵如表4所示。
表4 动态激励机制下地方政府和矿山企业博弈收益矩阵
Table 4
博弈双方 | 矿山企业 | ||
---|---|---|---|
高参与y | 低参与1-y | ||
地方政府 | 高奖惩x | [c-p(1-y)-b,p(1-y)+e+f-g] | [h-b-d,e-h] |
低奖惩1-x | [c-b,e+f-g] | [-b-d,e] |
下面对动态激励机制下混合博弈策略的稳定性进行分析,将a(y)=(1-y)p代入前述复制动态方程,结果如下:
令
求出系统的雅克比矩阵:
将
将
求得其特征根为
(2)均衡点分析
由以上分析可知,
求解方程组,得到:
讨论各参数对均衡点稳定性的影响:
①对
②对
(3)仿真分析
假设p=2,当
图8
图8
动态激励机制下地方政府与矿山企业演化博弈的仿真轨迹
Fig.8
Simulation trajectory of evolutionary game between local government and mining enterprises under dynamic incentive mechanism
图9
图9
动态激励机制下不同初始值的企业参与绿色矿山建设的演化过程
Fig.9
Evolution process of enterprises with different initial values participating in green mine construction under dynamic incentive mechanism
从结果来看,动态激励机制下矿山企业采用“高参与”策略的演化趋势逐渐收敛,最终稳定在均衡点。政府采取“高奖惩”策略的概率不同,初始演化的情况也不同。采用动态激励机制,矿山企业“高参与”策略行为不会随着时间发生变化,且在动态激励措施下的矿山企业积极性相对较高。
令地方政府和矿山企业初始概率x=0.4,y=0.2,研究不同情况下地方政府“ 高奖惩”策略的补贴额度对矿山企业采用“高参与”策略进行绿色矿山建设的影响。当激励金额为固定值时,企业采用“高参与”策略进行绿色矿山建设的概率呈周期性变动,且波动范围变大。当采用动态激励机制时,企业采用“高参与”策略进行绿色矿山建设的概率会迅速提高,并最终稳定到均衡值。而当动态激励机制延迟12个月之后,企业采用“高参与”策略进行绿色矿山建设的概率波动不断变小,虽然最终能稳定到均衡值,但稳定时间延长,稳定效果受到影响(图10)。因此,在加快落实激励政策的同时,还要采取优化存量、激活增量等措施来推动绿色矿山建设,逐步形成绿色矿山建设激励机制。
图10
图10
当x=0.4,y=0.2时不同激励机制下企业参与绿色矿山建设的演化过程
Fig.10
Evolution process of enterprises participating in green mine construction under different incentive mechanisms when x=0.4 and y=0.2
4 结论与启示
运用演化博弈理论与系统动力学相结合的方法,对地方政府实行奖惩策略的行为以及矿山企业参与绿色矿山建设的行为进行了演化分析,构建模型的过程中考虑了影响博弈双方行为决策的主要因素,分析了在动态惩罚和动态激励机制下博弈双方的演化均衡。结论如下:
(1)当惩罚罚金和激励金额为固定值时,参与主体的行为会随着周期改变,不能达到稳定均衡的状态。企业参与绿色矿山建设的行为会随着政府实行奖惩策略的行为而变化。当企业采用“高参与”策略进行绿色矿山建设时,其技术成本更高,而间接收益却较低,地方政府通过“高奖惩”策略推进企业参与绿色矿山建设的概率也就越高。
(2)政府的奖罚机制对企业参与绿色矿山建设会产生不同的影响。在动态惩罚机制下,地方政府和矿山企业的演化过程逐渐收敛并最终稳定到均衡值,适当提高惩罚的力度有助于提升企业推进绿色矿山建设的概率。在动态激励机制下,双方的演化过程同样呈收敛态势并趋于稳定,但是通过大幅度政府激励的直接成本的行为并不会提升企业选择“高参与”策略进行绿色矿山建设的概率,反而会使企业参与绿色矿山建设的意愿降低。此外,可以通过优化存量、激活增量等措施,使动态惩罚和动态激励机制落实到位。
(3)建设绿色矿山不能只靠矿山企业的自觉性,还需要建立一套标准体系和一套系统的奖惩机制,双管齐下调动矿山企业参与绿色矿山建设的积极性,加强宣传,将“绿色”理念真正植入到每一个矿山企业中。
基于以上结论,为进一步推进绿色矿山建设,提出以下建议:
(1)加强地方政府的监管职能。完善矿山建设立项审批程序,对已开展绿色矿山建设工作的企业进行定期抽查,针对矿山的地质环境、资源开发和生态修复等问题制定相关的标准和解决方案,健全有关政策的法律法规。
(2)完善绿色矿山建设的监管惩罚措施。结合相关条例,依法打击破坏生态环境、违规采矿等行为;针对技术落后、资源浪费等情况,从土地、税收和财政等方面着手,形成有效的动态监管和惩罚机制,促进资源循环利用,减少矿山企业的违规行为。
(3)构建多层次且适度的激励政策体系。在政策设计时,不能单一地对矿山企业进行财政补贴,可通过税收减免、以奖代补等多种方式对不同级别的矿山进行相应的政策扶持。扩大相关政策的面向范围,对已开展绿色矿山建设工作的企业按一定比例进行政策补贴,调动企业参与绿色矿山建设的积极性。
(4)加大绿色先进技术的研发支持力度。推进创新技术开发,加强涉矿产业人才培养,切实改进采矿、资源利用和生态修复等方面的技术。设立科研专项资金,鼓励矿山企业开展技术研发,帮助企业破解技术瓶颈。
本文通过构建地方政府和矿山企业的演化博弈模型,探索推进绿色矿山建设的发展过程,验证博弈双方在整个系统中的稳定性,并提出设计合理、有效的动态惩罚和动态激励机制来规范地方政府和矿山企业的行为。在政府惩罚与激励双视角下,矿区居民与矿山企业之间的策略还有待分析,这也是今后的重点研究方向。
http://www.goldsci.ac.cn/article/2021/1005-2518/1005-2518-2021-29-6-884.shtml