参考B站视频三阶段DEA操作步骤,做个简单的笔记,便于用的时候复习
https://www.bilibili.com/video/BV1F4411n75p?p=1
使用到的软件:DEAP2.1、Frontier4.1、excel
第一阶段:传统DEA模型
这里原始数据是截取博主给的数据中的前10个(主要是记录操作步骤) :
3个投入,2个产出,2个环境变量
运用DEAP2.1软件进行效率分析
(1)打开123.DTA,用于存储数据,产出在前、投入在后
将数据复制到 123.dta
deap 2.1软件分析过程及结果解释
第一阶段分析出来的投入产出松弛变量可能受到外部环境因素、随机误差以及内部管理因素影响,通过随机前沿分析方法(Stochastic Frontier Analysis,简称SFA)对上述因素进行测算并将其影响剔除。
(1)
然后
松弛变量S = 原始投入值 - 目标投入值
关于
这样算出来的松弛变量与DEA结果带的松弛变量结果 SUMMARY OF INPUT SLACKS 部分差距很大的原因
四阶段DEA松弛变量及模型调整问题
[经济学] 请教:DEA分析中投影变量与松弛变量之间的关系
https://bbs.pinggu.org/thread-3347318-1-1.html
其次,对效率为1的DUM,松弛变量可以令为0
注:因原始数据为残缺的,这些结果数值不必在意,主要是操作步骤
第二阶段(SFA)
理论部分我参考的是:研发投入产出效率的国际比较研究—基于三阶段DEA模型分析
以及 关于三阶段DEA模型的几点研究
实际操作运用Frontier4.1软件+ excel
投入的松弛变量作为因变量,K个环境变量作为自变量
注意:SAF只能做单产出分析,即每次只能调整一个投入变量,若有 m 个投入变量,则需要进行 m 次调整。
首先对投入1进行调整,EG1.DTA中放入一下内容
注意顺序
第一列是评价体系的序号;第二列是时期t;.第三列是因变量;.第四列之后是K全自变量
接下来设置 EG1.ins
第一个 y :假设U的分布。y表示截断分布,n表示半正态分布.
第二个 y :表示时变模型,n表示非时变模型。
选择 n
其他设置保持不变.
设置好之后,运行front41.exe
输入 :
F
EG1.ins
找到新生成的 out 文件
还要看 参数是否显著
主要是看 t 值( t-ratio)
注:***、**、*
分别表示在1%、5%、10%的显著性水平上通过正态检验
假设参数都通过检验
接下来 就是根据公式通过excel得到调整后的投入1值
S i j = f j ( z j , β j ) + v i j + u i j S_{ij}=f^j\left( z_j,\beta _j \right) +v_{ij}+u_{ij} Sij=fj(zj,βj)+vij+uij
符合含义在前面参考文献中有
根据Frontier4.1软件,得到SFA估计的系数 β ^ 0 , β ^ 1 , β ^ 2 \hat{\beta}_0,\hat{\beta}_1,\hat{\beta}_2 β^0,β^1,β^2以及
σ 2 = σ u 2 + σ v 2 、 γ = σ u 2 σ u 2 + σ v 2 \sigma ^2=\sigma _{u}^{2}+\sigma _{v}^{2}\text{、}\gamma =\frac{\sigma _{u}^{2}}{\sigma _{u}^{2}+\sigma _{v}^{2}} σ2=σu2+σv2、γ=σu2+σv2σu2
从而可得到环境值
f = β ^ 0 + β ^ 1 Z 1 + β ^ 2 Z 2 f=\hat{\beta}_0+\hat{\beta}_1Z_1+\hat{\beta}_2Z_2 f=β^0+β^1Z1+β^2Z2
其中, Z 1 Z_1 Z1, Z 2 Z_2 Z2为环境变量
现在主要是求 u 和 v ,可以用下面的公式得到
(1)回归的混合误差项现在是可以求得的
ε i = v i j + u i j = S − f \varepsilon_i =v_{ij}+u_{ij}=S-f εi=vij+uij=S−f
先求 u ,根据公式可用条件期望值将其代替
E ( u i ∣ ε i ) = σ ∗ [ φ ( λ ε i σ ) Φ ( λ ε i σ ) + λ ε i σ ] E\left( u_i|\varepsilon _i \right) =\sigma ^*\left[ \frac{\varphi \left( \lambda \frac{\varepsilon _i}{\sigma} \right)}{\varPhi \left( \lambda \frac{\varepsilon _i}{\sigma} \right)}+\lambda \frac{\varepsilon _i}{\sigma} \right] E(ui∣εi)=σ∗[Φ(λσεi)φ(λσεi)+λσεi]
其中 σ 2 = σ u 2 + σ v 2 、 ε i = v i j + u i j 、 σ ∗ = σ u σ v σ \sigma ^2=\sigma _{u}^{2}+\sigma _{v}^{2}\text{、}\varepsilon _i=v_{ij}+u_{ij}\text{、}\sigma ^*=\frac{\sigma _u\sigma _v}{\sigma} σ2=σu2+σv2、εi=vij+uij、σ∗=σσuσv、 Φ 与 φ \varPhi \text{与}\varphi Φ与φ分别为标准正态分布的密度函数和分布函数
因为已知
σ 2 = σ u 2 + σ v 2 、 γ = σ u 2 σ u 2 + σ v 2 \sigma ^2=\sigma _{u}^{2}+\sigma _{v}^{2}\text{、}\gamma =\frac{\sigma _{u}^{2}}{\sigma _{u}^{2}+\sigma _{v}^{2}} σ2=σu2+σv2、γ=σu2+σv2σu2
所以这个等式的值是可以计算的
从而 v 也可以计算出来
E ( v i ∣ ε i ) = ε i − E ( u i ∣ ε i ) E\left( v_i|\varepsilon _i \right) =\varepsilon _i-E\left( u_i|\varepsilon _i \right) E(vi∣εi)=εi−E(ui∣εi)
则投入变量1的调整至为
开始用excel计算
接下来的步骤(简写),直接对应公式就可以完成
最后,调整后的投入1
同理,完成投入2,投入3
最终得到如下结果
第三阶段
利用调整后的投入量,和原始的产出量,再次利用DEA模型估计各个决策单元的各个效率值。
之后可以做一个符号秩检验,检验经过调整后,是否有显著差异,如果没有差异,第二阶段就没多大意义了。
符号秩检验可以用stata做
比如对综合技术效率进行检验
ranksum t,by(g) porder
转载:https://blog.csdn.net/qq_42374697/article/details/109304796