摘 要
本文以多元统计分析中主成分分析的方法为基础,对我国16个省份经济发展水平的7个主要指标进行分析评价,为了处理不确定环境下的综合评价问题,进一步明确各项指标的权重系数,提出了一种基于蒙特卡罗仿真思想的随机模拟综合评价方法, 将点赋值的序关系法推广至区间赋值的情形。基于随机模拟的思想, 依据经典的综合评价过程, 模拟反映被评价对象之间优劣关系的优胜度矩阵,在此基础上, 给出各被评价对象之间的最佳排序。通过实证分析,得到该种方法比主成分分析更为有效。
关键词:主成分分析,随机模拟,综合评价
Abstract
The paper is based on the principal component analysis which is a kind of the multivariate statistics analysis methods. It aims at studying and comparing with the 16 provinces’ economic development level with the seven major indicators. But for solving the uncertain problem ,we want to make sure The weight of each indicator coefficient further, so a comprehensive evaluation method based on Monte Carlo simulation which is therefore presented, where the dot assignment can be extended to the interval assignment. Based on the stochastic simulation and according to the classical comprehensive evaluation process, the superiority matrix reflecting the relation between the superiority and inferiority of the object s being evaluated is simulated. Then, the optimal ranking of all the objects to be evaluated is given. Finally, using the case analysis, we draw a conclusion that stochastic simulation is more efficient.
Key Words:principal component analysis, stochastic simulation, comprehensive evaluation
I
目 录
摘 要 ................................................... I Abstract .................................................. I 第1节 问题背景 ......................................... 1 第2节 主成分分析 ....................................... 1 第3节 综合评价的相关理论及随机模拟的实现 ................ 2
3.1 基本概念与方法原理 ............................... 2
3.2 随机模拟的软件实现步骤 ........................... 4 3.3 综合评价值的确定 ................................. 5 第4节 实证分析与研究 .................................. 6
4.1 数据来源 .......................................... 6 4.2 指标选择 .......................................... 6 4.3 综合评价排序 ...................................... 6 第5节 程序输入及输出结果................................. 8 略 ....................................................... 8 第6节 总 结 ........................................... 8 参考文献 ................................................. 9 附录一 ................................................... 9
II
第1节 问题背景
综合评价即是对被评价对象完成时态的状态进行客观、公正、合理的全面评价, 其理论与方法在社会科学与自然科学的多个领域有着广泛的应用。指标权重系数的确定一直是综合评价理论研究中的一个核心问题。文献3提出了一种简捷有效的赋权方法—序关系分析法。它的主要特点有: 不用构造判断矩阵,更无需一致性检验; 方法简便、直观, 便于应用; 对元素或指标的个数没有; 具有保序性。序关系分析法一经提出, 就在综合评价理论中得到了广泛的应用。
随着综合评价问题研究的深入和推广, 不确定环境下的综合评价问题引起了人们的关注, 并已取得了丰硕的成果。由于客观事物的复杂性、不确定性以及人类思维的模糊性, 在使用序关系分析法时, 专家在给出任意两个指标间的重要性程度之比时, 往往很难给出精准的数值。从实际应用出发, 专家会更偏爱给出一个相对宽松的比值区间, 这样操作的优点是通过降低评价的精确度以提高评价的效率, 并能从整体上提高评价的效果。但同时,不确定序关系分析过程也使得问题求解的难度大幅增加针对这种情况, 本文给出了一种基于随机模拟的综合评价方法,为了说明这种新方法的优劣,本文考虑利用多元统计知识中的主成分分析法对其进行验证。其理论是将多个指标化为少数综合性指标,这些综合指标是原指标的线性组合,且彼此之间互不相关。再根据综合指标进行评价。它可以在力保原始数据信息丢失最少的情况下,对高维变量空间进行降维处理,是一种较新的综合评价方法。
第2节 主成分分析
主成分分析的基本思想[1]
对于较多变量(设为p)的多元统计问题,由于彼此间存在多重共线性,因而使得观测数据有一定成都的信息重叠。希望用较少的几个(设为mp个)综合变量在(主成分)来代替原来较多的变量,使得几个综合变量彼此互不相关,且尽可能多的反映原变量的信息。p个变量的n次观测可以简化为m个主成分的n次观测,即主成分得分。主成分分析可归纳为如下几步: (1)设原始变量为x1,x2,,xn,主成分分析后得到的综合变量为
z1,z2,,zm(mn),为了排除数量级和量纲不同带来的影响,首先对原始数据进行标准化处理.x*ij(xijxi)/i,i1,2,,n;j1,2,,p。其中xij为第i个指标第j个分区的原始数据;xi和i分别为样本均值与标准差. (2)由标准化数据表,计算相关系数矩阵R(rij)nn,其中
1
1nrij(xkixi)(xkjxj)/ij。
nk1(3)计算R的特征值和特征向量.将特征值从大到小排列12n,同时可得对应的单位特征向量u1,u2,,un。
(4)计算贡献率eii/i和累积贡献率Ejj/i。
i1j1i1nmn*(5)计算主成分zjuijxij。
j1i1pn(6)综合分析.一般取Ej85%的最小m(mn),得m个主成分,对m个主成分进行综合分析.
第3节 综合评价的相关理论及随机模拟的实现
3.1 基本概念与方法原理[2]
设由n个被评价对象(或方案) o1,o2,on,m个指标(属性)x1,x2,,xm组成的多指标评价系统:xijxj(oi)(i1,2,,n;j1,2,,m)为被评价对象
oi关于指标xj的观测值。评价数据矩阵(决策矩阵)可表示为:
x12x1mx22x2mA[xij]nnxn2xnm
记M1,2,,m,N1,2,,n(m,n3)不妨设m个指标均为极大型(效益
x11x21xn1型)的,A中数据为预处理后的数据。
综合评价的过程可描述为:取一正变换函数f,使yif(xi1,xi2,,xim),yi为被评价对象oi的综合评价值,对o1,o2,on按照y1,y2,,yn的大小(做降序)排序,进而完成o1,o2,on的优劣比较。通常,将f取为线性函数,
即有 : yiwjxij (1)
j1m式中:wj为指标xj对应的权重系数,wj0,wj1。
j1m确定权重的方法很多, 序关系分析法[3]是一种简便优良的主观赋权方法,其基本操作步骤如下:
3.1.1 确定指标重要性的序关系
2
定义1.若评价指标xi相对于某评价准则(或目标)的重要性程度大于(或不小于)xj时,则记为xixj.
定义2.若评价指标x1,x2,,xm相对于某评价准则(或目标)具有关系式:
***x1x2xm时,则称评价指标x1,x2,,xm之间按\"\"确立了序关系。这里xi*表示{xi}按序关系\"\"排定顺序后的第i个评价指标(i1,2,,m),为书写方便且不失一般性,记为: x1x2xm (2)
3.1.2 给出相邻两个指标的相对重要程度的比较判断
设专家关于评价指标xk1与xk的重要性程度之比wk1/wk的理性判断为:wk1/wkrk,km,m1,,2。
rk的赋值:指标xk1与指标xk具有同样重要性,rk1;指标xk1与xk稍微
重要, rk1.2;指标xk1比指标xk明显重要, rk1.4;指标xk1比指标
xk强烈重要rk1.6,指标xk1比指标xk极端重要, rk1.8。给出rk的点
值形式的判断,则指标相应的权重x1,x2,,xm可由下述定理得到。
3.1.3计算权重系数
定理1 若专家(或决策者)给出了指标两两之间重要性的比值判断rk,则
wm为:wm(1ri)1,而wk1rkwk,km,m1,,2。
k2ikmm在实际评价中,由于问题的复杂性,人类认识的局限性及思维的不确定性,专家通常不能给出rk(k2,,m1,m)的精确点值形式,而更有把握给出rk的区间值,此时综合评价问题的求解显得比较复杂,本文将给出一种仿真模拟的算法。
定义3 若专家给出的关于评价指标xk-1与xk的重要性程度之比rk为区间
r(k2,,m1,m)。 数,则称r为不确定比值判断,记为~rk[rkl,rku],rklrku,rkl,rku可参照表4在区间[1,1.8]上连续选取,即设~rkl,rku[1,1.8]。
*rk区间上服从均匀分布的随定义4 设rk(k2,.m)为不确定比值,判断~****机变量,称w(w1,w2,,wm1)为序关系随机模拟权,这里***wm(1ri)1,wk1rkwk,km,m1,,2。
kk*mmk2ik定义5 对任意2个被评价对象oi,oi*(ii*),称s(oioi*)为oi对oi*的优胜度,有: s(oioi*)P(xijwxi*jw)0.5P(xijwxi*jw*j) (3)
*j*j*jj1j1j1j1mmmm式中集合函数P为事件概率。
3
对优胜度s(oioi*)有如下的一些基本性质: 性质1:有界性.即0s(oioi*)1 性质2:归一性.即s(oioi*)s(oioi*)1
性质3:等价性.即s(oioi*)s(oioi*)s(oioi*)0.5 性质4:自反性.即s(oioi*)0.5
3.2 随机模拟的软件实现步骤
本文运用蒙特卡罗仿真的方法求解被评价对象两两之间的优胜度及随机模拟权,步骤如下:
步骤1. 选取被评价对象集中任意两个被评价对象oi,oi*(若有n个被评价对象, 共需进行n2n次比较).
步骤2. 设置仿真次数监控变量count(初始化时count置1). 步骤3. 运用数学工具包(SAS或Matlab)中的随机数发生器产生给定区间~rk(k2,,m)上均匀分布的不确定比值rk*(k2,,m),进而确定出序关系随机模拟权w*.
步骤4. 设置计数变量rs,re,rt( 初始化时rs,re,rt均置0) 分别表示
\"oioi*\",\"oioi*\",\"oioi*\"的次数.
若ijw(i,i)ijw*j(i,i),则rsrs1;
*j*mmj1mj1m若ijw(i,i)ijw*j(i,i),则rere1;
*j*j1mj1m若ijw(i,i)ijw*j(i,i),则rtrt1;
*j*j1j1步骤5. countcount1若countsum(sum为决策者给定的仿真总次数,一般指标数量越多,sum值越大),则转步骤6,否则转步骤2;
步骤6. 统计优势度s(oioi)的仿真值,(s(oioi)(rs0.5re)/sum,保存
**数值,若已完成被评价对象之间的两两对比,则退出程序,否则转步骤1.
通过模拟仿真,得到n个被评价对象的优胜度矩阵S,记sijs(oi,oj),有
s11s12s1nsss21222n S[sij]nnsssnnn1n2式中: S对角线上的元素均为0.5,理论上,应满足sijsji1, 故只需得
到对角线以上(或以下),(n2n)/2个元素的值便可确定出S中的所有元素,但是从精确性角度考虑,可地模拟出sij的值,此时,若sijsji1足够小,表明
4
仿真次数足够,结果是精确可信的;否则,需要增加仿真次数,即提高sum值.
模拟出的S在满足精度要求后,需要对其中的元素进行调整,调整公式为sij[sij(1sji)]/2,调整后的元素严格满足sijsji1.仍记调整后的优胜度矩阵为S.
3.3 综合评价值的确定
定义6设zi为被评价对象oi的相对综合评价值(从优胜度矩阵S中导出
T的),z为相对综合评价值向量,满足z1z2znc,c为一常数,(z1,z2,zn)则称 ijzizj(sijsji) (4)
为被评价对象oi与oj的比较函数.
定义7 关于n个被评价对象之间的整体比较函数为:
(5) F(z)ij[zizj(sijsji)]2
2i1j1i1j1nnnnT(z1,z2,zn)从偏差最小的角度出发,F(z)越小越好,最佳的z将使F(z)取
最小值。
nnnn2minF(z)ij[zizj(sijsji)]2规划模型为: (6) i1j1i1j1s.t.z1z2znc1nc定理2 模型(6)达到最优时, zisijsji (7)
nj1n证明:构造拉格朗日函数:L(,z)F(z)(zic)
i1n令L0,得到:2[zizj(sijsji)]0即
zij1n(8) 2[nzic](sijsji)0
j1n式( 8) 两边对i求和,2[zinc(sijsji)]n0,推得:
i1i1j1nnn2nn(sijsji) (9)
ni1j1将式(9)代入式(8),可得
1nn1nc(10) zi2(sijsji)sijsji
ni1j1nj1n1nn1nc因为2(sijsji)0,所以zisijsji,证毕
ni1j1nj1n
5
(z1,z2,zn)中元素的大小顺序没有影响, 由式(7)可知,c的选取对z因而也不会影响被评价对象最终的排序。
T第4节 实证分析与研究
4.1 数据来源
本数据来源于2010中国统计年鉴,详见附录一。
4.2 指标选择
为客观评价2010年16个省份的经济发展水平,本着评价的科学性、可操作
性、全面性和可比性原则,选取相关指标。选取了反映各地区经济发展状况的7个评价指标,以较为全面地反映各地区发展的实际情况,其中衡量地区经济实力的地区生产总值GDP,在这里选用GDP增长率为一指标,它同时也反映了该地区的经济增长速度;及地方财政收入,和衡量地区的质量和效益的指标全社会固定资产投资和衡量地区富裕程度的指标人均GDP、社会消费品零售总额、人均可支配收入和衡量该地区开发程度的指标进出口总值[4]。记号如下:
表格 1 评价地区经济发展水平的7项指标 GDP 增长率 x1 地方财政收入 x2 全社会固定资产投资 x3 人均 社会消费品GDP 零售总额 x4 x5 人均可支配收入 x6 进出口总值 x7 4.3 综合评价排序
4.3.1 应用主成分分析对于对评价结果验证
1、利用SAS软件(见附录)求相关阵R的特征值和特征向量u,并计算出贡献率e和累积贡献率E,结果见表2.
表格 2 主成分的特征值和贡献率 主成分 特征值 贡献率(%) 累计贡献率(%) z1 5.190532 0.7415 0.7415 z2 0.925696 0.1322 0.8737 z3 0.403727 0.0577 0.9314 z4 0.342028 0.04 0.9803 z5 0.094848 0.0135 0.9938 z6 0.037117 0.0053 0.9991 z7 0.006052 0.0009 1 2、由表2看到,第一,第二主成分对方差的累积贡献率达到87.37%,并
以该精度将变量由7维降到2维,可依2个主成分进行综合评价.
根据这2个主成分对应的方差贡献率为权数计算综合得分值,结果如表3.
6
Ze1e2z1z2 (11) e1e2e1e2
表格 3 16个省、市经济发展水平综合评价及排序
4.3.1 应用随机模拟对16省经济发展水平的评价
地区|指标 表格4 16 个省、市经济发展水平归一化数据表 x3 x5 x1 x2 x4 x6 x7 河 北 山 西 辽 宁 吉 林 江 苏 浙 江 安 徽 福 建 山 东 河 南 湖 北 广 东 四 川 江 西 湖 南 陕 西 0.2921 1 0.6087 0.3716 0.492 0.5299 0.766 0.5144 0 0.3147 0.8056 0.1037 0.6205 0.8336 0.73 0.8812 0.1863 0.0938 0.3583 0 0.8883 0.5125 0.1397 0.1403 0.5484 0.199 0.1044 1 0.245 0.0449 0.1224 0.0909 0.5239 0 0.5796 0.105 0.9944 0.3667 0.3183 0.1241 1 0.6112 0.2439 0.5553 0.4097 0.1573 0.2091 0.1104 0.2435 0.1688 0.6719 0.3352 1 0.97 0 0.59 0.6328 0.1114 0.2196 0.74 0.0092 0.0114 0.1199 0.1954 0.2666 0.025 0.2711 0.0378 0.7344 0.5026 0.0856 0.1623 0.8043 0.3481 0.2798 1 0.2657 0 0.1988 0.0165 0.0713 0.0198 0.1926 0 0.6305 1 0.0315 0.5332 0.3795 0.0434 0.0541 0.7103 0.0042 0.0058 0.0966 0.0237 0.0612 0.0026 0.1017 0.0065 0.5923 0.3351 0.0142 0.1202 0.2596 0.0101 0.0174 1 0.0177 0.0112 0.0047 0 1、评价指标无量纲化处理:对于观测数据X,为了消除量纲的影响,决策之
xijmin(xj)*前首先应将评价指标无量纲化处理。xij,其中min(xj)为max(xj)min(xj)第j个指标中最小的观测值,max(xj)为最大值,处理后,便得到16个省市的经济发展水平归一化数据表,见表4。
2、由定义1和定义2,确定评价指标的序关系,将各指标排列成:x1x2xm。
r在[1,1.8]3、 由定义3,经过模拟,假定专家根据问题给出的不确定比值判断~k上连续取值为[1.0103,1.2956],[1.1103,1.3558],[1.2103,1.417],[1.3103,1.5001],
[1.4103,1.5467],[1.5103,1.7706]。
4、由定义4和定义5,求得随机模拟权向量,w*(0.2718,0.2124,0.1820, 0.1362,0.0971,0.0634,0.0371),求解出被评价对象两两之间的优胜度矩阵S
7
000.5010.50.50.5 ( 调整后) :
S10.50.50.66670.510.50.3333(5、由定义6, 定义7 及定理2 得到被评价对象o1,o2,o的相对综合nn16)1n1评价值向量,在这里,cn,则zisijsji,那么:
nj1nz(0.3125,0.6875,1.0208,0.5,1.1875,1.35,0.9994,1.2141,1.4428 ,0.9281,。 1.27,1.6746,1.27,0.3916,0.15,0.8498)6、根据相对综合评价值向量, 得到被评价对象的综合排序:
表格 5 16省市相对综合评价指标排序结果
地区 河北 评价值 0.3125 排名 16 地区 山东 评价值 1.4428 排名 2 山西 辽宁 0.6875 1.0208 13 8 河南 湖北 0.9281 1.27 10 5 吉林 0.5 14 广东 1.6746 1 江苏 浙江 安徽 福建 1.1875 1.35 0.9994 1.2141 7 3 9 6 四川 江西 湖南 陕西 1.27 0.3916 0.15 0.8498 4 15 11 12 4.3.3 对表3和表5 结果的分析说明
比较两种方法的排序结果,大多数省份的排名还是一致的,因此,随机模
拟的方法在一定程度上可以说明该地区的发展状况。
第5节 程序输入及输出结果
略
第6节 总 结
本文研究了16个省份的经济发展水平,经过查询资料,确定了七个影响指标:GDP增长率,地方财政收入,全社会固定资产投资,人均GDP,社会消费品零售总额,人均可支配收入,进出口总值;在主成分分析中,选取累积贡献率大于85%的主成分对其进行评价,结合我们所了解的省份发展的具体情况,广东,江苏,浙江,山东,福建都属于沿海省份,进出口贸易频繁,劳动力密集,经济发展水平较高,两种方法得出的结论较为一致;而湖北作为我国南方重工业,高新科技地区,又有着较为有利的地理条件,发展水平应该在河北,河南这些农业省份之上,山西的煤矿业所带来的经济效益也应该刚高于内陆省份河北,江西。根据各方面的经济实力综合,随机模拟得出的结论更符合我国的实际情况。从而得到如下结论:主成分法是一种客观的评价方法,而随机模拟的
8
方法本质上属于一种主观评价方法, 这是二者的根本区别,它虽然降低了信息的精确度, 但是却提高了信息准确度。从方法结构上看,该方法可拓展性很强,仿真模拟部分是的,函数可任意选取,因而可将基本思想及方法推广用于解决类似的很多问题。
参考文献
[1] 张晓冉.统计分析及其SAS实现.清华大学出版社.2011,5.
[2]郭亚军,易平涛,李玲玉.基于随机模拟的综合评价方法及应用.东北大学学报(自然科学版).2010,31(10):1499-1503.
[3] 郭亚军,潘德惠.一类决策问题的新算法[J].决策与决策支持系统,1992,2( 3):56- 62.
[4] 张吉献,张艳玲.中原经济区各城市经济发展水平评价及发展对策.经济师.2009,1:277-278. [5]国家统计局网站.
http://www.stats.gov.cn/tjsj/ndsj/2011/indexch.htm.2012-06-08.
附录一
地区/ 指标 河 北 山 西 辽 宁 吉 林 江 苏 浙 江 安 徽 福 建 山 东 河 南 湖 北 广 东 四 川 江 西 湖 南 陕 西 x1 x2 原始数据[5] x3 x4 (亿元) 15083.35 6063.171 16043.03 7870.384 23184.28 12376.04 11542.94 8199.125 23280.52 16585.86 10262.7 15623.7 13116.72 8772.272 9663.584 7963.666 (元) 28668 26283 42355 31599 52840 51711 20888 40025 41106 24446 27906 44736 21182 21253 24719 27133 x5 x6 x7 (GDP%) 0.183272 0.250404 0.213297 0.190806 0.202227 0.205824 0.228217 0.204355 0.155569 0.185411 0.2319 0.165402 0.214412 0.234623 0.228051 0.239134 指标解释:
(亿元) 1331.855 969.6652 2004.835 602.4092 4079.86 2608.466 1149.395 1151.492 2749.384 1381.318 1011.231 4517.045 1561.673 778.0922 1081.69 958.2065 亿元 6821.8 3318.2 6887.6 3504.9 13606.8 10245.4 4197.7 5310 14620.3 8004.2 7013.9 17458.4 6810.1 2956.2 5839.5 3195.7 (元) 16263.43 157.66 17712.58 15411.47 22944.26 27359.02 15788.17 21781.31 19945.83 15930.26 16058.37 237.8 15461.16 15481.12 16565.7 15695.21 万美元 6205240 1385985 9529180 1702313 49878258 28725008 2338008 11054966 22516027 2001529 2602903 83400617 2629637 2095316 1560837 1170366 9
x1:GDP增长率; x2:地方财政收入; x3:全社会固定资产投资; x4:人均GDP; x5:社会消费品零售总额; x6:人均可支配收入; x7:进出口总值
10
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- vipyiyao.com 版权所有 湘ICP备2023022495号-8
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务