国际政治科学,2017, 2(4): 1-27
国际危机中的领导人决策行为分析*——基于多元启发理论视角
韩召颖,赵倩
 
【摘要】  领导人如何进行危机决策?现有的四种模型——官僚政治模型、组织行为模型、理性选择模型、“刺激—反应”模型——仅提供部分解释,对该问题的研究在理论上仍存在不足。为弄清决策者在危机中的决策模式,形成“从动机到行为再到对策”的逻辑链条,本文在既有研究的基础上,从多元启发理论视角出发,结合博弈分析,进一步完善了从认知到理性分析两阶段式的领导人危机决策模型。论文选择第一次和第三次朝核危机中的朝美谈判为案例,验证了提出的领导人危机决策模型。对两次朝核危机中领导人决策的分析与比较,揭示了朝美领导人的博弈行为所表现出的一些特征,这有助于我们理解和判断朝核问题的走向。
【关键词】  危机决策 ; 多元启发理论 ; 形式模型 ; 领导人 ; 朝核危机

【Abstract】 
 

据国际危机行为数据库(ICB)统计,1918—2013年,国际上共发生过470次危机,涉及1036个行为体,其中35次危机为持续性冲突(protracted conflicts)。1面对危机带来的冲突性压力,有些行为体选择与对手协商、妥协,以达成协议的和平方式化解危机,解决利益争端;有些行为体却执意使用武力手段维护、争取国家利益,导致危机升级,最终引发国家间的暴力冲突,甚至战争。在危机中,决策者如何在和平与武力手段之间进行策略选择?要回答这个问题,需要弄清决策者在危机中的决策模式,并形成从动机到行为的逻辑链条,从而对危机的走向作出判断。

决策者在危机中如何进行策略选择?学者多通过建立危机决策模型来解决这一问题。但以国际危机的概念与危机决策特征为标准来评估既有模型,发现这些模型在分析决策者之间的互动行为上仍存在较大的改进空间。本文以多元启发理论为视角,探讨分析国家领导人在危机中的决策行为,在已有研究的基础上建立国家领导人在国际危机中的决策模型。这不仅为解释决策者在危机中的连续决策提供一种新的视角,也进一步丰富和扩展了多元启发理论在危机决策领域中的应用。笔者依据此模型来解释朝鲜领导人在第一次和第三次朝核危机中的决策行为,最后发现,以多元启发理论为视角的领导人危机决策模型虽然存在一定的局限,但可以较好地判断领导人在危机中的策略选择。

一、既有文献综述

自20世纪60年代国际危机研究兴起以来,学者提出了四种危机决策模型:官僚政治模型、组织行为模型、理性选择模型、“刺激—反应”模型。2本文对既有模型的评估依据是,其能否符合国际危机概念与危机决策特征的要求。文献回顾部分主要梳理了国际危机的概念和特征以及危机决策模型两方面的既有研究成果。

关于国际危机的概念,学者多从体系和单元两个层次着手进行界定。从体系层次上说,奥兰·杨(Oran Young)对危机的界定较有代表性,他提出国际危机是“一系列迅速爆发的事件,这些事件使不稳定性对整个国际体系或任何一个子系统的影响都超过了正常水平,并增加了在系统内部发生暴力的可能性”。3在此定义下,危机有三个特征:(1)行为体之间在短时间内进行的恶性互动;(2)这种互动会造成的体系不稳定;(3)这种不稳定导致可能的暴力冲突。

从单元层次来看,虽然研究者们的表述各不相同,但由迈克尔·布雷彻(Michael Brecher)提出的三要素被普遍认可。布雷彻将国际危机定义为一种引起国家内部或外部环境变化的情景,且该情景满足三个条件,即决策者感知到:(1)其基本价值受到严重威胁;(2)需要在有限的时间对此作出回应;(3)存在卷入军事冲突的可能性。4具体而言,基本价值是国家和决策者的根本利益所在,国际体系中的利益分配调整可能会对行为体的基本价值产生不同程度的威胁。从特征上看,国际危机是时效性压力和冲突性压力下的国家互动情景,时效性压力意味着决策的时间紧迫且有限5,冲突性压力意味着国家间的互动强度和冲突爆发的可能性增大。

综合体系和单元两个层次上的国际危机概念及特征,可以归纳出建立危机决策模型需满足的三个条件。其一,危机中的行为体处于互动状态。从分析层次上看,这种互动不单指在国际体系层面和国内层面上的利益协调,也包含体系和单元的跨层次互动。从策略选择上看,决策者不仅要关注自己的策略集合,也必须考量对方策略集合的调整与变化。其二,维护或实现基本价值是决策者进行策略选择的动机所在。危机决策模型需要回答的重要问题之一,就是决策者为何选择某一策略而排除其他策略。其三,时效性压力和冲突性压力要得到充分体现。根据这三个条件,梳理并评估既有的四种模型,可从中借鉴经验,以便建立新的决策模型。

官僚政治模型和组织行为模型都将危机参与国家单方面的国内政治层次作为组建模型的切入点,缺少对危机中行为体互动性的解释。官僚政治模型将个人及其组成的集团作为决策行为体,这些决策单元基于其各自的特点、职责、利益关系、社会关系等考量,拥有各自的立场,在政府内部形成竞争性博弈,决策是政治角力的结果。6组织行为模型将各种组织作为决策行为体,认为决策是政府内部各个机构例行程序和组织过程运作的输出,具有“程式化”的特征。7这两种模型不仅适用于解释危机中的决策行为,也能解释行为体在非危机时期的政府决策。从互动性来说,两种模型多关注国家内部单元的互动对决策的影响,忽视国家行为体之间围绕利益分配的互动行为,分析层次较为单一。

罗伯特·帕特南(Robert D.Putnam)提出双层博弈理论,将国内和国际两个分析层次纳入同一解释模型,扩展了对外政策决策的研究视野。所谓“双层博弈”,就是领导人兼顾国际和国内两个层次的博弈局面,其决策既要争取国际层面的国家利益,又要满足国内单元的利益要求,据此建立获胜集合,参与到与其他国家的互动中去。8该模型打破了单一的分析层次,作为决策主体的领导人(或团体)既能考虑体系层面的国家利益,又能兼顾国内的利益考量,充分强调讨价还价中的国家间互动以及国际和国内层次的双向互动。虽然“双层博弈”并非危机决策模型,但对建立行为体的危机决策模型具有借鉴意义。

根据理性选择模型,决策以“收益—成本”计算为基础,通过对每个策略预期支付(expected payoff)的计算,按照收益最大化原则,最终选定策略。9在构建理性选择模型时,博弈论是常用的研究方法10,代表性成果包括格林·斯奈德(Glenn Snyder)和保罗·戴辛(Paul Diesing)、罗伯特·鲍威尔(Robert Powell)等学者的研究。11然而,从危机的时效性压力来看,行为体在有限的时间内较难完成对所有策略的完全理性分析。同样由于不完全信息、不确定性12和认知因素的限制,实现完全理性缺少现实基础。因此,有学者通过有限理性或认知理论等来弥补完全理性分析的不足。13

“刺激—反应”模型借鉴心理学的知觉理论,将意图认知作为关键变量引入危机决策研究,模拟行为体在危机中的认知行为。14该模型强调,决策是行为体基于其价值和认知对信息处理的结果,会存在认知偏差和错误的情况。在危机中,决策者的压力越大,其出现错误知觉和认知缺陷的可能性也会越大。15虽然危机带来的压力较大,但决策者绝非仅凭认知就能判断与确定优势策略,该模型缺少对策略和局势的理性分析。

在对外政策分析领域,有关决策模型的研究取得了新进展。将认知与理性分析相结合,运用于讨价还价、决策等模型,是对外政策决策领域的新方向,也是解释危机决策的一种新途径。例如,前景理论将损失规避视为领导人进行决策的关键原则之一,在讨价还价中,如果某一策略的成本过高,遵循损失规避原则,该策略也将被淘汰。16亚历山大·明茨(Alex Mintz)等人提出的多元启发理论,同时将国内政治维度引入对外政策决策的分析中,通过两阶段式决策过程模拟领导人决策行为。17

叶珉(Min Ye)进一步将多元启发理论、讨价还价和形式模型相结合,建立领导人危机决策模型,拓展危机决策研究的思路。18叶珉从讨价还价的视角出发,将国际危机定义为两个对手之间在战争阴影下围绕利益冲突展开的讨价还价过程19,并以多元启发理论为背景,以博弈论中的讨价还价模型为基础,构建了领导人在危机中的两阶段式决策。这一模型不仅符合了危机决策中的互动性要求,也满足了决策的时效性压力和冲突性压力这一条件。然而,此模型仍存在三方面不足:其一,从国际危机的发展过程上说,该模型仅对危机中的讨价还价部分进行建模,缺少对“挑起危机”行为的探讨;其二,从危机决策的特征上说,该模型并未分析决策者如何确定其基本价值和决策关键维度;其三,从模型建构上说,其建立的支付函数公式仍需进一步推敲。因此,在叶珉提出的模型基础上,本文利用决策者的基本价值这一要素,对“挑起危机”与“讨价还价”两部分进行串联与结合,呈现出一个多元启发理论视角下的完整的危机决策模型。此外,在模型的建立上,本文修改了“拒绝出价”和“使用武力”策略的支付函数公式,并完善了叶珉提出的领导人危机决策模型。

通过对既有危机决策模型的梳理,可获得如下启示。第一,为满足互动性要求,决策行为体的选择是关键。为更贴近现实的讨价还价行为,借鉴双层博弈模型,国家领导人是决策主体的较好选择。第二,将认知与理性相结合,能增强危机决策模型的解释力。决策中加入认知阶段,能够在一定程度上缩短决策过程,满足时效性压力的要求;而加入理性选择阶段,则能体现出决策是基于行为体维护和实现基本价值的选择与产物。在既有理论中,多元启发理论已将两者有效结合20,因此本文选择该理论作为建模的理论基础。第三,冲突性压力这一要求可由策略集合来表现。根据国际危机的概念,结束危机的方式有和平与战争两种。其中,和平方式包含两种情况,一种是危机各方达成协议,另一种是危机各方没有达成协议,但是同意不将危机升级为战争,两者都意味着危机最终和平结束;而战争方式可通过使用武力来表达。

根据以上启示,本文作出四个前提假定。(1)危机中的主要行为体是国家领导人,虽然国内的政党、利益团体、顾问等都会对决策产生一定的影响,但在国际层面上,领导人代表国家与对手进行博弈,而在国内,领导人也是最终的决策者。21此外,将领导人视为决策主体也符合多元启发理论的跨层次分析特征,满足危机中行为体间互动的特征要求。(2)领导人在危机中的决策动机出自对其基本价值的维护,而基本价值所在的维度是其决策的关键维度。这些维度通常包括国内政治、经济、外交、安全等。22在危机决策中,当国内政治维度与其他维度的价值相冲突时,领导人会优先考虑前者。23 (3)领导人是追求收益最大化的理性行为体。(4)关于危机中的策略,领导人拥有三种,即达成协议(A/a)、拒绝出价(陷入僵局)(R/r)和使用武力(W/w),其策略集合是Si={A,R,W}。其中,前两种策略使得危机能够和平结束(即避免战争),而后一种则意味着危机以战争收尾。

二、多元启发理论视角下的危机决策模型

本文将多元启发理论作为理论背景,以叶珉提出的模型为基础,阐释了领导人在危机中的决策模型。多元启发理论是一种跨层次的、两阶段式的决策分析工具,它提出领导人进行决策主要经过两个阶段:基于非补偿性原则(non-compensatory)的排除选项的认知阶段和基于词典编纂原则的确定选项的理性选择阶段。24

多元启发理论应用于解释行为体的危机决策既合理又具有优势。第一,该理论的跨层次性与危机的互动性特征相符合,这点尤其体现在决策的非补偿性原则上。非补偿性原则指出,决策者不仅会排除不满足自己的关键维度最低标准的策略选项,同时也会排除不满足对手的关键维度最低标准的策略选项,这体现了行为体的策略选择是在预测对方行为的前提下进行的,行为体会将国际互动视为决策背景。25第二,该理论提出的两阶段式决策过程也能够体现出时效性压力对决策的影响。认知阶段可缩减决策者的策略集合,从而加速决策过程,缓解危机带来的时效性压力。叶珉首次将多元启发理论、危机决策和博弈分析融为一体,建立了领导人的危机决策模型。本文在叶珉建立的模型的基础上,进一步丰富基于多元启发理论视角的领导人危机决策模型。

(一)领导人挑起危机的动机

决策者(即参与人,用i表示,i=1,2,…)在国际危机中需要进行两轮决策,分别在危机前和危机的讨价还价中进行。在第一轮决策即危机前的决策过程中,当国家内部或外部环境变动引发国家间利益分配调整时,为了维护基本价值,参与人i会产生应激反应,可能会引发国际危机。如图1所示,国家内部或外部环境发生变化会引起国家间利益分配情况发生变化,使利益分配格局成为SQ=(d1d2),其中0≤di≤1且d1d2=1,“1”视为博弈方争夺的利益总额。参与人i对新的分配格局SQ=(d1d2)于其基本价值是否产生威胁这一情况予以认知,并通过认知和理性选择两个阶段进行策略选择,最终决定其之后的对策。在危机前的决策中,参与人i的策略集合是{维持现状,挑起危机,使用武力}。当“挑起危机”成为参与人i的占优策略,且对手也选择同样策略,国际危机将爆发,双方进入危机中的讨价还价阶段。

图1
参与人i在国际危机中的反应机制示意图注:图中阴影表示参与人的策略。

(二)危机中的讨价还价过程

决策者在国际危机中的第二轮决策,出现在危机的讨价还价中,决策在时效性压力和冲突性压力下进行,这里的讨价还价可被视为有限多轮的序贯博弈。26在讨价还价中,参与人可通过对手的出价、情境变化等信号进行信息的更新和学习,不断调整自己的信息集合。由于信息的不断更新,在讨价还价的每一轮次中,参与人都需重新审视和调整策略集合,即便在上一轮曾经被淘汰的策略也可能出现在下一轮的策略集合中。

图2所示,参与人之间就如何分配利益进行讨价还价,在利益分配上,双方处于常和博弈的关系中。27作为危机的挑起者,参与人1在讨价还价的第一轮次(t=1)出价x,这里x=(x1x2)且0≤xi≤1,x1x2=1,t表示谈判的轮次。图2中的阴影三角表示参与人的可出价范围(0,1),其可分得的利益最大值是1,最小值是0。由于双方进行的是常和博弈,参与人1所得为1时,参与人2将一无所获,记作(1,0);同理,参与人1所得为0时,参与人2将得到1,记作(0,1)。面对参与人1的出价,参与人2将在策略集合{ARW}中作出选择:当选择策略A时,双方达成协议,危机的结果是(x,1),表示在第一轮谈判中双方达成协议x,危机结束;当选择策略W时,将爆发战争,危机的结果是(w,1),表示在第一轮谈判后爆发战争,危机结束;当选择R时,双方将进行下一轮次的讨价还价,由对方出价,过程与上一轮次相同,此时讨价还价将依此循环。理论上,谈判双方轮流担任出价方,直到双方就结束危机的方式达成一致后,讨价还价才能结束。28

图2
讨价还价过程示意图资料来源:Min Ye, “Poliheuristic Theory, Bargaining, and Crisis Decision Making,”Foreign Policy Analysis, Vol.3, No.4, 2007, p.325.

(三)决策过程中的认知阶段

根据多元启发理论,决策过程分为两个阶段,决策者(参与人i)首先进行认知上的策略排除阶段。在认知阶段中,参与人i以“基于维度”和“非补偿性”为原则,排除任何不符合其决策关键维度的阀值(threshold)要求的策略29,阀值一般是指参与人i能够付出的最高成本的临界值。当某一策略选项的成本超过关键维度的阀值时,该选项的支付函数(Ui)趋向负无穷,该策略则被排除;即某一策略在关键维度上的成本是c¯ik¯i,且该维度的阀值是c¯i*k¯i*,若该策略不符合参与人i决策关键维度的阀值,根据

c¯i>c¯i*,Ui=k¯i>k¯i*,Ui=

决策者将排除该策略。30

(四)决策过程中的理性选择阶段

经过认知阶段的策略排除后,决策者将在理性选择原则的指导下计算所有剩余策略的支付函数并确定最终策略。在国际危机中,参与人i在危机前和讨价还价中共涉及两轮决策,其中包含5个策略选项,每一策略有其相应的支付函数计算公式,可根据“利益份额—成本”间关系来确定。31其中,利益份额由协议或战争的结果而定,记作ui(x)或ui(W),每轮讨价还价的谈判成本记作ci(0<ci<0.5),战争成本记作ki

在危机前这一阶段中,涉及“维持现状”和“使用武力”两个策略的支付函数公式。“维持现状”策略意味着参与人i接受现有的利益分配,那么,在该策略下,危机各方的可得支付函数就是现有的利益分配SQ=(d1d2),即

Ui(SQ)=di

“使用武力”策略(W/w)在两轮决策中都有出现,其支付函数公式是一致的。由于战争结果受多方面因素影响,危机各方很难对战争胜负作出准确预测,仅能通过实力对比和战争决心等条件来预测战争获胜的可能性,由此,获胜概率成为决策者考察战争策略的重要因素。32假定对参与人i来说,取得战争胜利的所得是1,概率为pi,相反,遭受战争失败的所得是0,概率为(1-pi)33,那么,根据冯·诺依曼和摩根斯坦效用函数(von Neumann-Morgenstern Utility Function)34,战争策略的预期效用是pivui(1)+(1-pi) vui(0),而战争成本是ki,战争策略的预期支付函数公式是

EUi(W)=piui(1)+(1pi)ui(0)ki=piki

在讨价还价的过程中,参与人i的三种策略的支付函数均需通过公式计算而得出。“达成协议(A/a)”是和平结束讨价还价的一种方式。当参与人i以(xt)的出价达成协议时,它同时需要承担每轮谈判成本ci×t,那么,“达成协议”策略的支付函数公式是

Ui(x,t)=ui(x)ci×t=xicit35

“拒绝出价(R/r)”既是讨价还价中的一种策略,又是以“谈判僵局”来和平结束危机的一种方式。在讨价还价中,当参与人i认为下一轮的支付会高于本轮时,将拒绝本轮的出价。36在这种情况下,用xi表示的是下一轮次中的出价,因为在下一轮次中参与人i所得的支付函数大于本轮次的支付函数,即

Ui(x,t+1)=xici×(t+1)>Ui(x,t)

所以参与人i将选择“拒绝出价”策略。此外,当危机各方认为使用武力的成本过高、目前又难以达成令人满意的利益分配且各方之间的冲突性压力也不断降低时,危机也可能以“谈判僵局”的形式而结束,此后,各方步入危机后的长周期谈判。此时,参与人i需要继续支付谈判成本,直至争议问题最终解决,“谈判僵局”的支付函数公式是

Ui(x,t)=ui(x)limt(ci×t)=37

综上可知,国家间利益分配的调整可能对决策者的基本价值产生威胁,通过对威胁的认知和理性分析,决策者在{维持现状,挑起危机,使用武力}的策略集合中作出选择,当“挑起危机”成为占优策略时,国家间爆发危机,各方陷入讨价还价中。在讨价还价的过程中,决策者在{达成协议,拒绝出价,使用武力}的策略集合中,选择占优策略,该策略也将成为结束危机的方式。无论是在危机前还是在讨价还价的过程中,决策者均采用两阶段式的策略选择过程:在先前的认知阶段中,依据基于维度原则和非补偿性原则,决策者排除部分策略选项,缩减策略集合;在随后的理性选择阶段中,基于理性选择原则,决策者比较剩余策略选项的支付函数,进行博弈分析,最终确定结束危机的策略与方式。

三、案例分析

朝核危机是当前国际核不扩散体系的严重威胁之一,其能否得到妥善处理关系到中国周边、亚太地区甚至全球的安全与稳定。虽然朝核问题是学者、特别是中国学者讨论的重要议题之一,但是研究朝鲜或是其领导人危机决策行为的成果较少,而研究朝核问题的学者多关注以下三个问题:朝鲜发展核武器的动机38,主要相关国家的对朝政策39,以及解决朝核问题的对策。40由于这些问题与本文的研究问题的相关性较小,因此不作详细评述。

1993—2013年,朝核问题共引发5次危机(如表1所示),本文运用上述模型,选择了第一次和第三次朝核危机作为案例,解释朝鲜领导人41在危机中的决策行为。案例选择的主要依据是博弈中信息的完全程度。从信息的完全程度上看,5次朝核危机中的朝美博弈可归为两类:在第一次和第二次朝核危机中,由于朝美之间的交流较多,在危机爆发前后双方对彼此的实力与决心有较清晰的认识,由此可被视为完全信息博弈;在后三次危机中,朝美双方在较长时间内直接接触较少,对彼此的意图、实力和决心都缺乏认知,学习和知识更新速度较慢,由此可被视为不完全信息博弈。由于篇幅的限制和材料获取的困难,本文只在两种类型的博弈中各选一个进行分析,另外三次危机的博弈过程通过该模型也可得到解释。

表1
5次朝核危机

在朝核问题上,利益纠葛在于朝鲜是否能够或事实上拥有核武器。若朝鲜拥有核武器:其一,朝美之间、六方之间的谈判前提将改变;其二,国际核不扩散机制将遭到严重挑战,威胁当前的核均势局面。因此,本文以朝鲜是否拥有核武器及其实际核能力为依据,定义历次朝核危机之前危机各方的利益分配状况。42

(一)第一次朝核危机

20世纪90年代初,美国怀疑朝鲜秘密进行核武器试验。为求证朝鲜的核应用情况,国际原子能机构多次发出调查要求,遭到朝方拒绝。与此同时,美韩频繁举行联合军演,朝美局势骤然紧张。1993年3月,朝鲜宣布退出国际原子能机构,引发第一次朝核危机。自危机爆发起至次年2月,朝美双方进行了第一轮讨价还价,并达成初步妥协:美韩停止联合军演,朝鲜接受国际原子能机构的调查。43然而,朝鲜在随后的调查过程中的一系列不配合举动,使1994年3月后的一段时间内朝美谈判陷入僵局,导致危机进一步升级。为缓和紧张局势,换取朝鲜同意国际原子能机构的继续调查,同年4月,韩国放弃对朝鲜的谈判要求。5月,朝鲜被证实并没有滥用浓缩核燃料。7月美国前总统卡特结束访朝行程之后,朝美重启双边会谈,并最终在10月达成《核框架协议》。至此,第一次朝核危机结束。

在“挑起危机”的阶段中,首先需要对危机的主要参与人以及决策者的基本价值进行确定,而后分析决策者是如何依据多元启发理论中的两阶段式方法来确定其应对策略的。

在第一次朝核危机中,朝鲜、美国和韩国都是直接参与人。由于在本次危机中韩国总统的立场与美国相似,且为换取美朝重启对话,在危机中途退出讨价还价。因此,本次危机的主要参与人是朝鲜和美国领导人。

通过分析危机前的环境变化,可推断出国家间利益分配的调整对朝美两国领导人的基本价值造成何种威胁。对朝鲜领导人来说,危机爆发前的局势是,国际原子能机构对朝鲜提出检查要求,同时美韩进行军演联合施压朝鲜,朝鲜领导人需要考量该局势在其外交、经济、国内政治和安全维度上的影响。冷战结束后,朝鲜失去苏联等社会主义盟友,在外交上陷于孤立,但美国此时采取对朝“接触”政策,美朝依旧保持正常互动。44在经济上,朝鲜国内经济状况恶化,能源和资源等严重短缺;由于遭受制裁,朝鲜可获得的外部援助有限,国内经济危机的恶化不利于朝鲜国内政治局面的稳定。45在国内政治维度上,美韩施加的外部安全压力和内部经济压力给朝鲜领导人带来了国内政治风险,经济和安全维度上受威胁的价值最终造成国内政治维度的价值受损。因此,国内政治维度是此次危机中朝鲜领导人进行决策的动机的关键维度。46

对美国领导人来说,虽然美国历任总统的对朝政策不同,但在朝核问题上的目标始终如一,即禁止朝鲜发展核武器。47核扩散问题本身就是对美国国家安全和国际核不扩散机制的巨大挑战48,且一直以来由于意识形态等问题,朝美两国长期处于对立状态,一旦朝鲜拥有核武器,美国的国家安全势必遭受严重威胁,同时这也与美国支持国际核不扩散体系的政策相悖。出于维护安全维度的基本价值,美国确定了其在朝核问题上的战略与策略。

朝鲜领导人根据非补偿性原则,选择“挑起危机”作为其应对利益分配调整的策略。危机前,朝鲜(参与人1)未拥有核武器,其利益配额为0,美国(参与人2)为1,朝美之间的利益分配即SQ=(0,1)。已知朝鲜领导人在危机中的基本价值在于国内政治维度,其策略排除和选择的依据是该策略能否维护国内政治的基本稳定。面对国际原子能机构和美韩的双重施压,若朝鲜单方面妥协,接受现状,不仅可能会降低朝鲜领导人的政治威信,而且存在外部干预力量进入朝鲜的风险。若朝鲜领导人选择“维持现状”策略,任由局势发展下去,这将可能引发国内政治局面的不稳定,威胁其在国内政治维度上的基本价值,超出其可接受的国内政治维度上的阀值。根据c¯ic¯i*Ui=-∞,“维持现状”策略将被排除。同样,朝美实力相差巨大,对美先发制人使用武力、引发朝美间冲突,朝鲜获取胜利的概率较低,而一旦失败,朝鲜领导人很可能面对混乱的国内政治局面,这完全超出朝鲜领导人能够承担的阀值。根据k¯ik¯i*Ui=-∞,“使用武力”策略也被排除,并且在讨价还价的过程中也被朝鲜领导人排除出策略集合S1

此外,朝鲜领导人选择“挑起危机”的另一前提是“使用武力”不会成为美国的占优策略。如果美国倾向于使用武力,那么朝鲜率先挑起危机无异于给美国发动战争的口实。危机前,美国推动朝韩草签《朝鲜半岛无核化宣言》(1992 Denuclearization Agreement),敦促朝鲜接受国际原子能机构的检查,即便是在朝鲜宣布其退出核不扩散条约的意图后,朝美依旧保持双边会谈,而美国总统也表示“希望他们能收回成命,如果他们一意孤行,我们将采取进一步措施”。49朝鲜由此判断,美国直接对朝进行武力打击的可能性不大,“挑起危机”策略不会使朝鲜被迫面对战争局面。因而,“挑起危机”成为朝鲜领导人的占优策略。

在讨价还价阶段中,决策者同样依据多元启发理论的两阶段式方法,进行策略选项的排除和选择。由于讨价还价是双向互动进程,美朝双方的策略集合都需要考虑。在认知阶段,双方要排除那些不满足其决策基本价值和没有能力付诸实施的策略。上文已表明,使用武力策略被排除于朝鲜领导人的策略集合之外,然而对美国领导人来说,“大棒”是争取谈判优势的有效工具,该策略仍保留在美国领导人的策略集合中。由此,经过认知阶段的策略选项的排除,朝鲜的策略集合是{AtRt},美国的策略集合是{atrtwt}。

在理性选择阶段,通过博弈分析得出朝美各自的占优策略和均衡结果。50图3是以1994年3月朝美中断接触为界的朝美两轮(t=2)讨价还价的博弈树形图。在轮次t=1中,美朝虽初步达成协议,但朝鲜随后并不配合国际原子能机构的检查,此时朝鲜的策略集合是{A1R1},美国的策略集合是{a1r1w1}。在轮次t=2中,朝美达成协议,以和平方式结束此次危机。若朝鲜拒绝美国在本轮的出价,那么在轮次t=3中,美国大概率会拒绝朝鲜一方的出价51,其策略集合将缩小至{r2w2}。因此,“达成协议”成为朝鲜领导人的最终策略。

图3
第一次朝核危机中的美朝博弈树形图

计算得出,朝美双方谈判的子博弈纳什均衡52是:[(R1A2),r1]。考虑朝美谈判的现实情况,由于朝鲜的可接受出价范围是(0,1),而美国的可接受出价范围是(1-c2,1),因此在第二轮次的出价[(R1A2),r1]是本次博弈的纳什均衡。这一结果表示,美国只需付出较小成本则能实现危机前的价值(目标)。

在现实中,虽然朝美的策略选择过程与博弈分析一致,双方在讨价还价的第二轮次达成协议。然而,从《核框架协议》53的内容看,现实谈判达成的结果偏离了均衡点。朝鲜不但获得了美国不对朝鲜使用核武器的正式安全保障,还赢得了经济和安全上的实际好处。虽然美国也得到朝鲜坚持半岛无核化的承诺,但践行协议的经济成本和观众成本过高。由于韩国、日本、俄罗斯等国最终不愿为该协议买单54,且美国国内也认为该协议签署得过于仓促55,因此该协议最终被废弃。也正是由于美朝双方在事后都没有履行条约,因此信任在彼此间很难被建立或维持。

(二)第三次朝核危机

2005年,美国宣布对包括澳门汇业银行在内的朝鲜海外资产进行冻结,借此施压朝鲜以促成六方会谈早日达成共识。2006年5月,朝鲜官方承认正在进行核试验,引发第三次朝核危机。危机初期,美国敦促朝鲜重回六方会谈,但拒绝与朝鲜进行双边对话。10月9日,朝鲜进行第一次核试验,最后以失败收尾。对此,联合国安理会通过1718号决议56,严厉制裁朝鲜,虽然中俄两国表示支持决议,却反对以武力贯彻对朝鲜的制裁。三周之后,朝美举行双边会谈,达成初步妥协,危机局势得以缓和。2007年8月,朝鲜重返六方会谈,危机结束。

在本次危机中,除主要参与人朝鲜和美国外,中国、俄罗斯、日本、韩国也作为次要行为体参与其中。六方会谈的开启,使和平解决朝核危机成为各方共识,武力的使用受到限制。由于行为体之间复杂的博弈网络,作为主要行为体的朝美需要对其他四国,特别是对中国的角色和立场不断进行意识的更新,并依据这种认识进行策略选择。57

中国在危机中存在不确定性。中国对朝鲜半岛的基本政策目标是“维护和平与稳定,在半岛安全中发挥战略平衡作用”。58追求“战略平衡”使中国成为影响主要参与人之间谈判实力对比的不确定性。若中国支持朝鲜,会减轻美韩的直接军事威胁和切断经济援助带给朝鲜的压力,美国对朝谈判的筹码将减少,相反朝鲜的谈判实力将增加。但是,威慑压力变小后,朝鲜可能会推进核武计划,反而威胁中国的国家安全。若中国支持美国,朝鲜的谈判空间将进一步缩小,这将不利于朝鲜争取谈判优势。同时,外交孤立无援、经济萎靡不振可能造成朝鲜政局与社会的动荡,这又与中国维护半岛局势稳定的初衷相违背。因此,中国在操作“战略平衡”时常处于钟摆状态,其政策具有较强的灵活性,朝美对中国立场的认识要作出判断,并以此进行决策。

确定朝鲜领导人的基本价值。危机前的局势是美日韩等国对朝进行严厉的经济制裁。进入21世纪后,朝鲜的经济和外交局面都得到改善。六方会谈扩大了朝鲜的外交空间,国内经济开始进行改革并出现好转。59此外,美国处于阿富汗和伊拉克两场战争之中,朝美间爆发战争的可能性降低。总体来说,朝鲜在外交、经济、安全维度上的价值受威胁程度较低。通过对以往美朝博弈的学习及从中获取的经验,朝鲜领导人发现,被动地寄期望于美国给出安全承诺来确保国家安全的可能性和可信度较低;反而主动通过增强军事力量来实现安全目标则更为实际。在实现安全自保的道路上,发展核武器是朝鲜的最佳选择。由此可知,第三次朝核危机是朝鲜领导人为实现基本价值而主动挑起的,其基本价值既涉及国内政治维度,又涉及国家安全维度。

朝鲜领导人挑起危机的另一动机在于持续的谈判僵局造成的高成本。六方会谈始终难以达成有效成果,朝鲜付出的成本随着谈判的推移而不断增加。从“谈判僵局”的支付函数可知,若僵局继续,朝鲜可预期的支付将趋近于负无穷。这时,及时止损和争取相对成本优势是参与人的首要目标。在谈判陷入僵局时,挑起危机对于朝鲜有三点益处:一是增加对美的谈判筹码;二是将危机化作达成协议的契机,及时止损;三是一旦拥有核武器,将彻底改变朝美间利益分配格局,获取相对成本优势。因此,“挑起危机”成为朝鲜领导人的占优策略。

与前一个案例的分析一样,在本次的讨价还价阶段中,决策者同样依据多元启发理论的两阶段式方法,进行策略选项的排除和选择。在讨价还价过程中,危机前朝鲜不具有核武器,那么在利益分配上朝鲜(参与人1)依旧是0,美国(参与人2)是1,朝美之间的利益分配即SQ=(0,1)。在认知阶段,“使用武力”策略被朝美双方排除:对朝鲜领导人来说,无论中国支持自己还是成为对手,战争都会给朝鲜带来巨大的安全和国内政治风险,根据k¯ik¯i*Ui=-∞,朝鲜领导人将排除“使用武力”策略;对美国领导人来说,六方会谈的出现使和平解决朝核危机成为各方共识,若贸然违背,美国将背负巨大的国际观众成本,根据c¯ic¯i*Ui=-∞,“使用武力”策略被美国领导人排除。60据此,在本次危机中,朝鲜的策略集合是{AtRt},美国的策略集合是{atrt}。

在不完全信息下进行理性选择,假定双方决策者都运用前向法,始终且连续对对手的属性与行为作出理性判断,对博弈中的不确定性进行信念判断和信息更新,并最终决定策略选择。不完全信息下的动态博弈可通过精炼贝叶斯均衡得出结果。

具体而言,在不完全信息下,参与人1先对参与人2的属性61进行类型化判断,而后对这些属性进行信念判断。根据叶珉提出的模型,参与人2属性可归类为H型和L型:H型参与人2的实力逊于参与人1,其谈判成本(cH)和战争成本(kH)都高于参与人1,且战争获胜的概率(pH)小于参与人1;L型参与人2的实力强于参与人1,其谈判成本(cL)和战争成本(kL)都小于参与人1,并且战争获胜的概率(pL)大于参与人1。由于cHc1cLkHk1kL,并且pH<0.5<pL,所以参与人1面对H型参与人2时更具有议价优势,而面对L型参与人2时处于劣势。62参与人1对参与人2属性的信念判断存在乐观、中性、悲观三种情况。当持乐观信念时,参与人1认为参与人2是H型的概率较大,自己占据谈判优势;当持悲观信念时,参与人1认为参与人2是L型的概率较大,自己处于谈判劣势;当持中性信念时,情况介于前两者之间。

在第三次朝核危机中,由于信息不完全,朝鲜领导人在决策之前需要对中国的立场进行信念判断,以预期双方博弈的谈判实力对比。如果中国支持朝鲜,那么朝鲜面对的将是失去中国支持的H型美国;如果中国支持美国,那么朝鲜面对的将是赢得中国支持的L型美国。凭借自己对环境的认知,朝鲜领导人对中国的立场进行信念判断:乐观信念表示其认为美国可能是H型;中性信念表示其认为朝美实力对比贴近现实;悲观信念表示其认为美国是L型。在不完全信息之下,朝美博弈的出价范围如表2所示。63

表2
第三次朝核危机的美朝的出价矩阵

根据上述出价范围,朝鲜持不同信念得出的支付矩阵如表3所示。基于理性分析,参与人1在不完全信息之下拥有严格占优策略,即持有乐观信念。具体而言,当参与人2是H型时,u1 (乐观)>u1 (中性)>u1 (悲观),那么参与人1将选择保持高信念以确保支付函数最大化。当参与人2是L型时,u1 (乐观)>u1 (中性)=u1 (悲观),那么参与人1将选择保持乐观信念以使支付函数最大化。总之,无论参与人2是何种属性,参与人1持有乐观信念能够为自己在讨价还价中争得较高的利益分配,因此乐观信念可被视为参与人1的严格占优策略。换言之,如果参与人1抱有除乐观信念外的两种信念,那么该支付函数可能存在低于凭借自身实力应得利益的情况。

表3
第三次朝核危机中朝鲜持各信念的支付矩阵

在实际的讨价还价过程中,朝鲜领导人的一系列举动表明其对中国的立场持乐观态度,在与美国的讨价还价中持乐观信念,执行其严格优势策略。这点尤其表现在朝鲜坚定地执行其核试验计划方面。朝鲜领导人之所以能够保持高信念,得益于两次信号传递:一是在朝鲜提议举行朝美双边会谈被拒之后,美国敦促中国对朝进行制裁,中国虽有参与但力度较小;二是在朝鲜进行核试验后,中国仍对朝鲜的制裁持谨慎态度,朝鲜领导人可确定之前的信念是正确的。朝鲜据此信息认为中国的立场相对偏朝,因此朝鲜领导人按计划进行核试验。这使得朝鲜能够最大限度地满足自己维护基本价值的需要,并完全实现既定价值(目标)。随后核试验失败,出于对国家和政权安全的考虑,朝鲜领导人决定重返六方会谈,以避免中国立场的扭转可能带来的风险。

四、结论与启示

在回答“决策者如何进行危机决策”问题时,既有的四种危机决策模型或多或少存在局限性,难以同时满足危机决策在互动性、时效性压力和冲突性压力三方面的要求,这就使该问题领域存有理论留白。本文在叶珉提出的模型基础上,从多元启发理论视角出发,运用认知和理性分析的两阶段式决策过程,结合博弈分析,提出了领导人危机决策模型。

经案例检验可知,该危机决策模型在判断领导人在危机中的策略选择,预测危机以和平或战争形式结束这一问题上具有较强的解释力。从策略选择上来说,危机前,国家间利益分配的调整使决策者需要在{维持现状,挑起危机,使用武力}中作出选择,而此时其决策的动机是被动维护其受威胁的基本价值或者主动实现其基本价值。当“挑起危机”成为占优策略时,国际危机就会爆发。在危机的讨价还价的过程中,决策者的策略集合是{达成协议,拒绝出价,使用武力}。决策者先是通过认知阶段排除不满足其基本价值所在的关键维度阀值的策略选项,而后通过理性的博弈分析,最终确定结束危机的策略。在两个案例中,朝鲜领导人在两次危机中的决策与模型得出的结果一致。此外,本文发现,信息更新和学习过程不仅发生在单一事件中,也会对日后行为体间的互动产生影响,且影响较难消除。例如,美国无法践行1994年的《核框架协议》,就削弱了朝美之间的互信,直接影响朝鲜在第三次危机中的决策。

从多元启发理论和博弈论视角对两次朝核危机中领导人决策的分析与比较,对于我们认识目前朝核问题有着重要的启示。朝美领导人的博弈行为所表现出的一些特征有助于我们理解和判断朝核问题的走向。从决策动机来看,朝鲜领导人把国内政治视为其决策的关键维度,“挑起危机”是其应对外部环境变化和利益调整的对策,而发展核武器是其维护和实现基本价值(目标)的主要手段。美国领导人决策的基本价值(目标)是国家安全,在对朝政策上美国可运用的策略与手段虽然不少,但大多因其效果会受外部因素影响而打折扣,唯有对朝施压成为美国最合理的选择,以此迫使朝鲜回到谈判桌前,继续在相互博弈中讨价还价,最终寻求朝核问题的和平解决。另外,从朝美博弈的进程上看,彼此间的不信任感随着互动的进行而不断加深,这种不信任感来源于双方博弈的经验与不确定性的存在。例如,美国最终抛弃1994年的《核框架协议》,使得朝鲜对美国能否履行条约产生怀疑;而朝鲜“危机—谈判—核试验”的行为模式,也使美国质疑其能否最终放弃核武器。朝美在互动中累积形成的互不信任,在一定程度上阻碍了双方的谈判进程。

进一步讲,若朝鲜在事实上拥有核武器,且谈判僵局一直持续,朝美博弈的前提将会发生改变,这样,朝鲜的要价将越来越高,而美国只能将施压作为应对朝核问题的重要手段。由于谈判僵局会使双方最终都面临负无穷收益,那么,双方在谈判中占据优势的关键是,谁能够首先争取更多利益分配和降低谈判成本。一旦朝鲜在事实上拥有核武器,朝美之间利益分配将变为朝鲜占优,而美国维护国家安全的成本将提高,朝美的谈判地位可能出现逆转,由美国占优变为朝鲜占优。从朝美以往几次谈判博弈的经历中,美国深知排除“使用武力”策略后,其所得支付会变小,在博弈中的优势受到削弱,甚至失去所占有的优势地位。因此,为避免该情况的出现,将“使用武力”拉回策略集合,并适当增加施压手段,这样,美国在对朝的谈判博弈中才能确保继续占据优势地位,从而最终和平解决朝核危机。

本文提出的领导人危机决策模型仍存有一定的局限性,即现实中结束危机的利益分配与模型得出的结果不同。也就是说,决策过程的理性不能完全确保结果的理性,如朝美于第一次危机达成的协议与博弈均衡点间存在偏差,致使1994年的《核框架协议》最终作废。由此得出两点启示。第一,决策者并非完全理性的行为体,时效性压力和冲突性压力以及信息不完全会使现实中的完全理性难以实现。如何操作危机中的“不完全信息”变量以及如何改善完全理性分析,使其更加贴合现实中的博弈行为,需要进一步地深入研究与探讨。第二,虽然在决策过程中,关键维度上的价值是决策者进行危机决策的决定性动机,但危机结束后,其他维度也会影响甚至彻底改变决策者的认知及行为体之间的后续互动。例如,1994年的《核框架协议》虽满足美国的基本价值要求,但却因为履约会使美国在经济、外交等维度的价值受到某种程度的损害而难逃被废弃的结局。此外,由于本文仅考虑危机期间行为体的决策行为,对危机后的局势变化并未作过多考察,因此对行为体理性行为的定义难免具有局限性。这些问题仍需我们在今后的研究中进一步去修改与完善。

本文得到国家社会科学基金重大项目(项目编号:13&ZD049)的资助。感谢美国詹姆斯·麦迪逊大学杨溢教授和卡罗莱纳海岸大学叶珉教授提出的修改意见,同时感谢编辑部及匿名评审人的修改意见和建议。文章不妥及舛误之处由作者负责。

国际危机行为数据库(ICB):https://sites.duke.edu/icbdata/data-collections/,访问时间:2017年7月21日。

可参见Graham T.Allison, “Conceptual Models and the Cuban Missile Crisis,”The American Political Science Review, Vol.63, No.3, 1969, pp.689-718;Ole R.Holsti, Crisis, Escalation, War(Montreal: McGill Queens University Press, 1972), pp.51-70;克里斯托弗·希尔:《变化中的对外政策政治》,唐小松等译,上海人民出版社,2007年,第59—141页。

詹姆斯·多尔蒂、小罗伯特·普法尔茨格拉夫:《争论中的国际关系理论》,阎学通等译,北京:世界知识出版社,2013年,第621页。

可参见Michael Brecher, “State Behavior in International Crisis,” Journal of Conflict Resolution, Vol.23, No.3, 1979, pp.446-447; Michael Brecher and Jonathan Wilkenfeld, “Crisis in World Politics,” World Politics, Vol.34, No.3, 1982, p.383; J. Joseph Hewitt, “Dyadic Processes and International Crises,” Journal of Conflict Resolution, Vol.47, No.5, 2003, p.671;Jack S.Levy and William R.Thompson,Causes of War (New Jersey: Wiley-Blackwell, 2010), p.155;阎学通、杨原:《国际关系分析(第二版)》,北京大学出版社,2013年,第183页。也可参见ICB网站(https://sites.duke.edu/icbdata/data-collections/)。

虽然危机决策中的时效性压力是学者们公认的国际危机的基本要素之一,但是对于有限决策时间的具体长短仍未有具体界定,“紧迫的”“既定的”“很短的”是形容决策时间的常见词语。国际危机行为数据库(ICB)收录的各种危机持续时间长短不一,长则多于1年,如几次朝核危机,短则少于1月,如1994年的“七月危机”。因此,本文在界定国际危机时,采用国际危机行为数据库的标准,该数据库此前由Michael Brecher和Jonathan Wilkenfeld管理,现管理者为Patrick James和Kyle Beardsley。

Graham T.Allison, “Conceptual Models and the Cuban Missile Crisis,”The American Political Science Review, Vol.63, No.3, 1969, pp.691-707.

Ibid., pp.698-707.

Robert D.Putnam, “Diplomacy and Domestic Politics: The Logic of Two-Level Games,” International Organization, Vol.42, No.3, 1988, pp.427-460.

Graham T. Allison, “Conceptual Models and the Cuban Missile Crisis,” The American Political Science Review, Vol.63, No.3, 1969, pp.691-696.

王鸣鸣:《外交决策研究中的理性选择模式》,《世界经济政治》2003年第11期,第18—19页。

可参见Glenn Snyder and Paul Diesing, Conflict Among Nations: Bargaining, Decision Making, and System Structure in International Crises(New Jersey: Princeton University Press, 1977); Robert Powell, “Bargaining Theory and International Conflict,” Annual Review of Political Science, Vol.5, No.3, 2002, pp.1-30.

不确定性包括两个方面:一是卷入危机的行为体不能明确彼此间的相对权力分配,即危机各方(两个或两个以上行为体)不清楚彼此之间的实力对比;二是卷入危机的行为体不能明确对方的战争决心(resolve of fighting a war),即行为体不清楚对方的讨价还价的底线。

可参见Christopher K. Butler, “Prospect Theory and Coercive Bargaining,”Journal of Conflict Resolution, Vol.51, No.2, 2007, pp.227-250;Robert Jervis, “Hypotheses on Misperception,”World Politics, Vol.20, No.3, 1968, pp.454-479;克里斯托弗·希尔:《变化中的对外政策政治》,唐小松等译,上海人民出版社,2007年,第120—124页。

Ole R.Holsti,Crisis, Escalation, War (Montreal: McGill Queens University Press, 1972), pp.51-70.

Robert Jervis, “Hypotheses on Misperception,” World Politics, Vol.20, No.3, 1968, pp.454-479.

Christopher K.Butler, “Prospect Theory and Coercive Bargaining,” Journal of Conflict Resolution, Vol.51, No.2, 2007, pp.227-250.

多元启发理论是明茨等人在20世纪90年代提出的一种对外政策分析领域中的决策理论。可参见Alex Mintz, “The Non-compensatory Principle of Coalition Formation,”Journal of Theoretical Politics, Vol.7, No.3, 1995, pp.335-349;Alex Mintz et al., “The Effect of Dynamic and Static Choice Sets on Political Decision Making: An Analysis Using the Decision Board Platform,”The American Political Science Review, Vol.91, No.3, 1997, pp.553-566;韩召颖、袁维杰:《对外政策分析中的多元启发理论》,《外交评论》2007年第6期,第75—83页。

Min Ye, “Poliheuristic Theory, Bargaining, and Crisis Decision Making,” Foreign Policy Analysis, Vol.3, No.4, 2007, pp.317-344.

Ibid., pp.321.

关于多元启发理论的有效性检验,可参见陈冲、刘丰:《多元启发理论与美国总统使用武力:一种定量检验》,《国际观察》2011年第5期,第58—74页;Brandon J.Kinne, “Decision Making in Autocratic Regimes: A Poliheuristic Perspective,” International Studies Perspectives, Vol.6, No.1, 2005, pp.114-128; Karl DeRouen Jr. and Christopher Sprecher, “Initial Crisis Reaction and Poliheuristic Theory,” Journal of Conflict Resolution, Vol.48, No.1, 2004, pp.56-68.

Min Ye, “Poliheuristic Theory, Bargaining, and CrisisDecision Making,” Foreign Policy Analysis, Vol.3, No.4, 2007, p.323.

Patrick James and Enyu Zhang, “Chinese Choices: A Poliheuristic Analysis of Foreign Policy Crises, 1950—1996,” Foreign Policy Analysis,Vol.1, No.1, 2005, p.32.

Alex Mintz, “How Do Leaders Make Decisions?:A Poliheuristic Perspective,” Journal of Conflict Resolution, Vol.48, No.1, 2004, pp.3-13;

韩召颖、袁维杰:《对外政策分析中的多元启发理论》,《外交评论》2007年第6期,第77页。

Jonathan W.Keller and Yi Edward Yang, “Empathy and Strategic Interaction in Crises: A Poliheuristic Perspective, ”Foreign Policy Analysis,Vol.5, No.2, 2009, pp.169-189.

在序贯博弈中,他人行动之后的参与人可以获取到那个时间点为止的博弈进展信息,包括其他参与人的选择等。关于序贯博弈的详细内容,可参见科林·凯莫勒:《行为博弈——对策略互动的实验研究》,贺京同等译,北京:中国人民大学出版社,2006年;沃尔特·尼克尔森、克里斯托·西迪尔:《中级微观经济学:理论与应用》,徐志浩等译,北京:中国人民大学出版社,2012年,第198—199页;Joel Waston,Strategy: An Introduction to Game Theory(New York: W.W.Norton & Company, 2013)。

讨价还价流程可参见Min Ye, “Poliheuristic Theory, Bargaining, and Crisis Decision Making,” Foreign Policy Analysis, Vol.3, No.4, 2007, p.325.

需说明,有学者认为战争爆发后,讨价还价亦没有结束,双方在战争过程中继续谈判,直到达成协议终结战争,例如费伦。由于本文主要讨论的是危机谈判,因此对战争中讨价还价是否继续不作过多讨论。本文的前提是,当战争爆发时,国际危机将告一段落,战争可被视为危机谈判的终点。因此,本文将不对战争中的讨价还价进行过多解释。

Alex Mintz, “The Decision to Attack Iraq: A Non-compensatory Theory of Decision Making,” Journal of Conflict Resolution, Vol.37, No.4, 1993, pp.598-603.

Min Ye, “Poliheuristic Theory, Bargaining, and Crisis Decision Making,” Foreign Policy Analysis, Vol.3, No.4, 2007, p.325.

策略选项的支付计算建立在利益份额和成本两个变量的关系上,建构两者关系通常有两种方式。一种是“减号”关系,用“uicit”表示,例如,鲍威尔(Robert Powell)、叶珉等学者采用过该方式,具体可参见:Robert Powell, “Bargaining Theory and International Conflict,” Annual Review of Political Science, Vol.5, 2002, pp.1-30;Min Ye, “Poliheuristic Theory, Bargaining, and Crisis Decision Making,” pp.317-344。另一种是通过贴现因子(δ)表示每一轮讨价还价的折损率,来计算策略的预期支付,即利益份额×折损率,用“δt×ui”表示。由于贴现因子难以表示时效性压力这一特征,模型多用“减法”来组建策略支付公式。

Robert Powell, “Crisis Bargaining, Escalation and MAD,” American Political Science Review, Vol.81, No.3, 1987, p.729.

为了简化计算过程,本文将战争的结果看作“赢者全得”(winner-takes-all)的情况。

关于冯·诺依曼和摩根斯坦效用函数公式的内容,可参见哈尔·范里安:《微观经济学:现代观点》,费方域等译,上海人民出版社,2003年,第271页。

Min Ye, “Poliheuristic Theory, Bargaining, and Crisis Decision Making,” Foreign Policy Analysis, Vol. 3, No. 4, 2007,p.327.

第一种情况在叶珉模型中没有出现,但是却不得不考虑。危机的结束只能以和平和战争两种方式,不存在双方一直相互扯皮的状态。危机方之间要么就利益如何分配达成协议,要么就如何分配利益的方式达成共识。在讨价还价中,决策者拒绝达成协议是因为存在支付更高的策略选项的存在:当决策者偏好达成协议(即战争选项并非首选)时,他会比较本轮和下一轮的预期支付,如果下一轮的支付高于本轮,那么他就会选择拒绝策略。这时,下一轮次的预期支付会成为本轮中的拒绝策略的预期支付。

Min Ye, “Poliheuristic Theory, Bargaining, and Crisis Decision Making,” Foreign Policy Analysis, Vol.3, No.4, 2007, p.326.

关于“朝鲜发展核武器的动机”这一问题的研究,可参见AlkKairouz, “North Korea Nuclear Crisis,”Economic and Political Weekly, Vol.39, No.1, 2004, pp.25-31;Michael J. Mazarr, “Going Just A Little Nuclear: Non-Proliferation Lessons from North Korea,” International Security, Vol.20, No.2, 1995, pp.93-99;邱美荣:《威胁认知与朝核危机》,《当代亚太》2005年第6期,第3—11页;张琏瑰:《朝鲜核问题现状与美国责任》,《东北亚学刊》2012年第2期,第3—8页。

关于“主要相关国家的对朝政策”这一问题的研究,可参见林利民:《朝核危机管理与中国的外交抉择》,《现代国际关系》2006年第8期,第32—38页;张业亮:《布什政府对朝政策与朝核危机》,《美国研究》2004年第1期,第35—54页;朱锋:《“后天安舰时代”半岛无核化进程评析》,《现代国际关系》2011年10月,第9—11页;陈新明、李源正:《新世纪以来俄罗斯对朝鲜半岛的政策评析》,《东北亚论坛》2015年第5期,第58—70页;王俊生:《中韩在第二次朝核危机中共同立场和相互协调分析》,《当代韩国》2008年第1期,第26—34页。

关于“解决朝核问题的对策”这一问题的研究,可参见薛力:《朝鲜问题的治本之道,用“联合国方案”代替“六方机制”》,《世界经济与政治》2007年第9期,第14—15页;韩献栋:《朝鲜半岛和平机制的构建:国际政治和国际法视角》,《当代亚太》2008年第3期,第77—94页。

由于多元启发理论能够实现跨层次分析,因此本文中将采用国家名称代替领导人名称,进行案例分析。

本文的利益分配依照两种简单情况划分:当朝鲜不拥有核武器或实际制造能力时,本文认为朝鲜的利益分配为0,对方为1,即危机前的利益分配情况为SQ=(0,1);当朝鲜拥有核武器或实际制造能力时,本文认为朝鲜的利益分配为1,对方为0,即危机前的利益分配情况为SQ=(1,0)。

夏立平:《冷战后美国核战略与国际核不扩散体制》,北京:时事出版社,2013年,第356—359页。

樊吉社:《美国对朝鲜政策:两次朝核危机比较》,《美国研究》2009年第4期,第21—38页。

孙茹:《朝核问题:地区合作进程研究》,北京:时事出版社,2009年,第42—59页。

将国内政治维度视为朝鲜对外政策决策的主要动机的研究,可参见Marcus Noland, “Why North Korea Will Muddle Through,” Foreign Affairs, Vol.76, No.4, 1997, pp.105-118; B.R.Myers, The Cleanest Race: How North Koreans See Themselves and Why It Matters (New York: Melville House Publishing, 2010), pp.42-71.

虽然美国历届总统针对朝核问题的政策不一,但内核保持不变,即禁止朝鲜发展核武器。具体可参见张业亮:《布什政府对朝政策与朝核危机》,《美国研究》2004年第1期,第35—54页;樊吉社:《美国对朝鲜政策:两次朝核危机比较》,《美国研究》2009年第4期,第21—38页;朱锋:《“后天安舰时代”半岛无核化进程评析》,《现代国际关系》2011年10月,第9—11页;孙茹:《奥巴马政府对朝“战略忍耐”与朝核问题》,《现代国际关系》2013年第7期,第25—26页;杨文静:《奥巴马政府对朝政策评析》,《现代国际关系》2016年第5期,第9—16页。

夏立平:《冷战后美国核战略与国际核不扩散体制》,北京:时事出版社,2013年,第81—86页。

孙茹:《朝核问题:地区合作进程研究》,北京:时事出版社,2009年,第41页。

双方的出价范围:朝鲜挑起危机的原因是无法接受当前的利益分配SQ=(0,1),那么朝鲜不能接受(0,1)的出价。然而,朝鲜缺少外部实力的加持,在讨价还价过程中处于弱势地位,因此,朝鲜的出价空间有限,可接受的出价范围应是x1>0。美国的实力远超朝鲜,假定美国领导人是理性行为体,他只能接受付出最小的谈判成本来达成协议,也就是他能接受的最低出价是(c2,1-c2),其可接受的出价范围是1-c2x2≤1。

在轮次t=3中,朝鲜领导人是出价一方,其出价范围是[2C1,1],根据鲁宾斯坦讨价还价模型,其出价是(2c1,1-2c1),此时美国一方的支付函数是1-2c13c2。由第一轮次议价可知,美国不接受(c1,1-c1),而第三轮次的出价(2c1,1-2c1)于美国来说所分得的利益(1-2c1)少于第一轮次(1-c1),且美国在第三轮次所耗成本3c2也大于第一轮次中承担的成本,由此美国在拒绝朝鲜的第一次出价后,很难会再次接受之后轮次中朝鲜的出价。因此,在轮次t=3中,美国大概率会拒绝朝鲜的出价,其策略集合将缩小至{r2,w2}。

此次博弈的子博弈完美均衡根据c1和2c2之间的大小关系而定。当c1=2c2时,子博弈纳什均衡在第一轮次的出价(c1,1-c1)或第二轮次的出价(c2,1-c2)达成;当c1>2c2时,子博弈纳什均衡在第二轮次的出价(c2,1-c2)达成;当c1<2c2时,子博弈纳什均衡在第一次轮次的出价(c1,1-c1)达成。

《核框架协议》(1994)规定:朝鲜坚持半岛无核化,接受国际原子能机构的监察;美国需要从朝鲜半岛撤出核武器,向朝鲜提供重油、食品等经济援助,承担帮助朝鲜建立两座核电站的义务,弥补冻结石墨反应堆造成的经济损失等。中国外交部记载该协议的具体内容:http://www.fmprc.gov.cn/web/ziliao_674904/tytj_674911/tyfg_674913/t67399.shtml,访问时间:2017年4月24日。

孙茹:《朝核问题:地区合作进程研究》,北京:时事出版社,2009年,第72—105页。

朱锋:《布什政府的半岛政策与朝鲜核危机》,《现代国际关系》2003年第2期,第1—7页。

联合国安理会1718号决议:http://www.un.org/zh/sc/documents/resolutions/06/s1718.htm,访问时间:2017年4月15日。

本文仅将中国的立场视为影响此次危机博弈的不确定性。这是因为,就日本、韩国、俄罗斯来说,其立场和政策在历次危机中基本保持一致:基于朝鲜核试验对其国家安全的威胁以及美国是其盟友的身份,日本对联合国或美国的对朝制裁持支持态度;韩国虽然不支持对朝鲜的强力制裁,但是在安全和政治上较为依赖美国,立场与美国靠近;俄罗斯坚持尊重和维护朝鲜的国家生存权,属于六方会谈中的较亲朝派。

崔立如:《朝鲜半岛安全问题:中国的作用》,《现代国际关系》2006年第9期,第42—47页。

张宝仁:《近期朝鲜经济发展变化及中韩的作用》,《东北亚论坛》2007年第5期,第78—81页。

关于为什么美国在本次危机中排除战争策略的现实依据,可参见朱锋:《布什政府的半岛政策与朝鲜核危机》,《现代国际关系》2003年第2期,第4—5页。

这种属性包括对方的实力、谈判成本、战争成本等。

Min Ye, “Poliheuristic Theory, Bargaining, and Crisis Decision Making,” Foreign Policy Analysis, Vol.3, No.4, 2007, pp.317-344.

在不完全信息博弈中,行为体在讨价还价中的出价会出现“伪装”现象。伪装是指参与者实际出价要略高于其理论出价(理论出价是指根据双方实力现实对比情况的真实出价)。如果参与人2是H型而参与人1不知道,参与人2在率先出价的情况下,可以伪装自己成为L型来换取议价优势。但是,如果率先出价方是参与人1,H型更易接受参与人1的出价,以避免因达成协议失败而付出更高的谈判成本或战争成本,不过真正的L型参与人会坚持自己在下一轮中出价。

参考文献

资源
PDF下载数    
RichHTML 浏览数    
摘要点击数    

分享
导出

相关文章:
关键词(key words)
危机决策
多元启发理论
形式模型
领导人
朝核危机


作者
韩召颖
赵倩