您的当前位置:首页正文

因子分析法--综合评价指标

2021-06-13 来源:星星旅游
《应用统计分析》----题目2

题目2 数据data2是某医院3年中各月的数据,包括门诊人次、出院人数、病床利用率和周转次数、平均住院天数、治愈或好转率、病死率、诊断符合率、抢救成功率。采用因子分析法探讨综合评价指标。

一、因子分析法

因子分析是主成分分析的推广和发展,也是利用降维方法进行统计分析的一种多元统计方法。它是一种将多变量化简的技术,其目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性则降低。每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。

因子分析有一个默认的前提条件就是各变量间必须有相关性,否则,各变量间没有共享信息,就不应当有公因子需要提取,自然也谈不上使用该方法。具体在该条件的判断上,除了根据专业知识来估计外,还可以使用KMO统计量和Bartlett’s 球形检验加以判定。

二、操作步骤 1.导入数据

依次单击“文件—打开—数据文件”命令,打开如图1所示的对话框。

图1 导入数据

1

2.因子分析

(1)依次单击“分析—降维—因子分析”命令,如图2所示。打开图3所示的“因子分析”主对话框。

图2 因子分析菜单

(a)选入变量前

(b)选入变量后

图3 “因子分析”主对话框

(2)在图3(a)所示的对话框中选中左边的变量,单击 选入到左边的列表框中(如图3a所示)。

按钮,将其

(3)单击“描述”按钮,弹出“因子分析:描述统计”对话框,如图4所示,在“统计量”选项组中选取“原始分析结果”;在“相关矩阵”中选取“系

2

数”和“KMO和Bartlett”。设置完毕后,单击“继续”按钮,确认操作。

图4 “因子分析:描述”对话框

图5 “因子分析:抽取”对话框

(4)单击“抽取”按钮,得到如图5所示的“因子分析:抽取”对话框。选择“方法”为“主成分”;在“分析”选项组选择“相关性矩阵”;在“输出”选项组选择“未旋转的因子解”和“碎石图”;在“提取”选项组中将“因子的固定数量:”设置为4;将“最大收敛性迭代次数:”设置为25.

(5)单击“旋转”按钮,得到如图6所示的“因子分析:旋转”对话框。在“方法”选项组选择“最大四次方值法”;在“输出”选项组选择“旋转解”;将“最大收敛性迭代次数:”设置为25。

(6)单击“得分”按钮,得到如图7所示的“因子分析:得分”对话框。选择“保存为新变量”和“显示因子得分系数矩阵”;在“方法”选项组选择“回归”。

最后,在“因子分析”主对话框(如图3所示)中,单击“确定”按钮,执行操作。

3

图6 “因子分析:旋转”对话框

图7 “因子分析:因子得分”对话框

3.结果解释 (1)相关性分析

表1 相关矩阵

相关矩阵 门诊出院病床利病床周用率 .283 .084 1.000 转数 .288 平均住院天数 治愈好转率 病死率 诊断符合率 抢救成功率 .326 -.118 -.024 .132 -.210 -.038 -.123 -.055 -.297 .297 .093 .347 -.343 .129 -.202 .416 -.068 .079 1.000 -.449 -.425 .505 -.088 .235 -.418 .007 -.284 -.449 1.000 人次 人数 相门诊人次 关 出院人数 病床利用率 病床周转数 平均住院天数 治愈好转率 病死率 诊断符合率 抢救成功率 1.000 .044 .044 1.000 .283 .084 .288 .572 .326 -.420 -.118 .132 -.024 -.210 .347 -.343 -.425 .505 .572 -.420 .678 -.110 .678 1.000 -.412 -.110 -.412 1.000 -.038 -.055 -.123 -.297 .129 -.202 -.088 .297 .093 .416 1.000 -.380 -.380 1.000 -.068 .079 .235 -.418 .007 -.284

表2 KMO和Bartlett的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。 Bartlett 的球形度检验 近似卡方 df Sig.

.490 119.028 36 .000 4

通过相关矩阵发现,大部分系数均超过0.3,另外通过Bartlett检验可以看出,应拒绝各变量独立的假设。不过KMO统计量为0.490,小于0.7,说明变量间的信息重叠度可能不是特别的高,有可能做出的因子分析模型不是非常完善,不过值得尝试。

(2)主成分信息

表3 主成分信息

解释的总方差 初始特征值 成份 1 2 3 4 5 6 7 8 9 合计 2.807 1.991 1.448 .785 .681 .541 .453 .175 .119 方差的 % 累积 % 31.194 22.124 16.092 8.723 7.563 6.014 5.034 1.939 31.194 53.317 69.410 78.133 85.696 91.710 96.744 98.683 提取平方和载入 合计 2.807 1.991 1.448 .785 方差的 % 累积 % 31.194 22.124 16.092 8.723 31.194 53.317 69.410 78.133 旋转平方和载入 合计 2.628 1.854 1.471 1.079 方差的 % 累积 % 29.201 20.603 16.339 11.989 29.201 49.804 66.144 78.133 1.317 100.000 提取方法:主成份分析。 表1中的前三个主成分的特征值大于1,但是它们的累积贡献率仅为69.410%。 (3)变量的共同度

表4 变量的共同度

公因子方差 门诊人次 出院人数 病床利用率 病床周转数 初始 1.000 1.000 1.000 1.000 提取 .879 .870 .866 .917 .770 .796 .689 .565 .681 平均住院天数 1.000 治愈好转率 病死率 诊断符合率 抢救成功率 1.000 1.000 1.000 1.000 提取方法:主成份分析。 5

图8 碎石图

表2显示,每一个变量的公因子方差均在0.5以上,且大多数接近或超过0.7,这说明4个公因子能够较好地反映客观原变量的大部分信息。另外,从碎石图可以看出因子1、2、3、4之间的连线比较陡峭,说明特征值的差值较大,前四个因子比较重要。这和上表的结果是吻合的。

(4)旋转前的因子负荷矩阵(如表3所示)

表5 旋转前的因子负荷矩阵

成份矩阵a 门诊人次 出院人数 病床利用率 病床周转数 1 -.255 .766 .244 .689 2 .770 .128 .776 .661 .125 -.071 -.164 .402 -.366 成份 3 .008 .091 -.086 -.071 .440 .888 -.663 .041 .059 4 .470 .508 -.443 -.020 .189 -.009 .243 -.116 .021 6

平均住院天数 -.724 治愈好转率 病死率 诊断符合率 抢救成功率

.039 -.405 -.623 .737 提取方法 :主成分分析法。 a. 已提取了 4 个成份。 根据0.5原则,因子1在多数原始变量上有较大的负荷,因子2在x1(门诊人次)、x3(病床利用率)和x4(病床周转数)变量上有较大负荷,因子3在x6(治愈好转率)、x7(病死率)变量上有较大的负荷,因子4在x2(出院人数)变量上有较大负荷。因此说明,除可初步认定因子1反映综合情况、因子3反映医疗水平情况外,其他两个因子的意义不明显。

(5)正交旋转矩阵(如表4所示)

表6 正交旋转矩阵

成份转换矩阵 成份 1 2 3 4 1 -.898 .395 .153 .117 2 .410 .783 .027 .466 3 .115 -.140 .980 .077 4 -.109 -.459 -.122 .873 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的四分旋转法。 这是通过四次方最大旋转得到的正交变换矩阵。 (6)旋转后的因子负荷矩阵(如表5所示)

表7 旋转后的因子负荷矩阵

旋转成份矩阵a 成份 1 2 3 4 门诊人次 .494 .286 -.068 .740 出院人数 -.680 .157 .147 .601 病床利用率 .137 .920 .028 -.003 病床周转数 -.354 .809 .056 .366 平均住院天数 .732 -.337 .301 .173 治愈好转率 .039 -.160 .876 .033 病死率 .193 -.307 -.746 .037 诊断符合率 .742 .116 -.030 .016 抢救成功率 -.808 -.013 .158 -.061 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的四分旋转法。 7

旋转成份矩阵a 门诊人次 出院人数 病床利用率 病床周转数 平均住院天数 治愈好转率 病死率 诊断符合率 抢救成功率 1 .494 -.680 .137 -.354 .732 .039 .193 .742 -.808 2 .286 .157 .920 .809 -.337 -.160 -.307 .116 -.013 成份 3 -.068 .147 .028 .056 .301 .876 -.746 -.030 .158 4 .740 .601 -.003 .366 .173 .033 .037 .016 -.061 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的四分旋转法。 a. 旋转在 5 次迭代后收敛。 结果显示,因子1支配的变量有x1(门诊人数)、x2(出院人数)、x5(平均住院天数)、x8(诊断符合率)和x9(抢救成功率),因子2支配的变量有x3(病床利用率)和x4(病床周转数),因子3支配的变量有x6(治愈好转率)和x7(病死率),因子4支配的变量有x1(门诊人数)和x2(出院人数)。故可以认为,因子1反应医院医疗工作质量各方面的情况,称为综合因子,因子2反应病床利用情况,称为病床利用因子,因子3反应医疗水平,称为水平因子,因子4反应就诊病人数量,称为数量因子。与旋转前的因子负荷矩阵相比较,说明该旋转对因子负荷起到了明显的分离作用,使各因子具有较明显的专业意义。

通过探索性因子分析,从这9个变量中找到了4个潜在因子,它们是:综合因子、病床利用因子、水平因子和数量因子,如下表所示。 因子 因子一

高负荷指标 x1(门诊人数) x2(出院人数) x5(平均住院天数) x8(诊断符合率) x9(抢救成功率)

因子二

x3(病床利用率)

病床利用因子 因子名称 综合因子

8

x4(病床周转数)

x6(治愈好转率) 水平因子

x7(病死率)

x1(门诊人数) 数量因子 x2(出院人数)

That’s all! Thank you! Thanks for your attention!

9

因子三

因子四

因篇幅问题不能全部显示,请点此查看更多更全内容