您的当前位置:首页正文

数据分析及其应用软件习题

2021-07-04 来源:星星旅游
数据分析及其应用软件习题

《数据分析及其应用软件》习题 姓名__ 学号_ _ _成绩

习题1:出钢时所用盛钢水的钢包,因钢水对耐火材料的侵蚀,容积不断增大

我们希望找出使用次数与增大的容积之间的关系,试验数据如下:

写出分析报告(内容包括以下四点) 1. 用双曲线1/y = a+b/x 作曲线拟合:(1)画出散点图, (2

)写出回归方程, (3)进行检验, (4)分析结果, (α= 0.05) 2. 用指数曲线y = ae b/x 作曲线拟合: (1)画出散点图, (2)写出回归方程, (3)进行检验, (4)分析结果, (α= 0.05)

3. 比较两种曲线后,写出较优的曲线回归方程.

4. 使用较优的曲线回归方程预测当使用次数为17次时钢包的容积增大多少?

习题2:1.研究货运总量Y (万吨)与工业总值1X (亿元)、农业

总产值2

X (亿元)、居民非商品支出3X (亿元)的关系。数据见下表

(1)计算出 321,,,X X X Y 的相关系数矩阵;

(2)求Y 关于321,,X X X 的三元线性回归方程; (3)对所求得

的回归方程作拟合优度检验; (4)对回归方程做显著性检验; (5)对每一个回归系数做显著性检验;

(6)如果有的回归系数没有通过显著性检验,将其剔除。 重新建立回归方程,再作回归方程的显著性检验和回归系数显著性

检验;

(7)求出每一个回归系数的之置信水平为95%的置信区间; (8)求出标准化回归方程;

(9)求当01X =75,02X =42,03X =3.1时的0Y 值,给定置信水平为99%,

用SPSS 软件计算精确置信区间,用手工计算近似预测区间; (10)结合回归方程对问题作一些基本分析。

习题3:为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3

类,指标及原始数据如下表。利用费歇线性判别函数,判定另外4个待判样品属于哪一类?

某地区人口死亡状况指标及原始数据表 组别 序 号

1X = 0岁组 死亡概率 2X =1岁组

死亡概率 3X = 1 0岁 组死亡概率 4X =55岁 组死亡概率 5X =80岁 组死亡概率 6X =平均 预期寿命 第一组 1

34.16 7.44 1.12 7.87 95.19

69.30 2 33.06 6.34 1.08 6.77 94.08 69.70 3 36.26 9.24 1.04 8.97 97.30 68.80 4

40.17 13.45 1.43 13.88 101.20 66.20 5 50.06 23.03 2.83 23.74 112.52 63.30 第二组 1 33.24 6.24 1.18 22.90 160.01 65.40 2 32.22

4.22 1.06 20.70 124.70 68.70

3 41.15 10.08 2.32 32.8 4 172.06 65.85

4 53.04 25.74 4.06 34.87 152.03 63.50 5 38.03 11.20 6.07 27.84 146.32 66.80 第三组1 34.03 5.41 0.07 5.20 90.10 69.50 2 32.11 3.02 0.09 3.14 85.15 70.80 3 44.12 15.12 1.08 15.15 103.12 64.80 4 54.17 25.03 2.11 25.1 5 110.14 63.70

5 28.07 2.01 0.07 3.02 81.22 68.30

待判样品1 50.22 6.66 1.08 22.54 170.60 65.20 2 34.64 7.3

3 1.11 7.78 95.16 69.30

3 33.42 6.22 1.12 22.95 160.31 68.30 4 44.02 15.36 1.07 16.4 5 105.30 64.20

习题4:对中国乡镇企业绩效的进行聚类分析.数据见表1. 表1、原始数据

地区净利润营业收入增加值率企业个数盈利个数全员劳动生 产率 北京

567266957155522.3711875411710020698

天12206851575286522.0612132912083629242河61142747629386225.67101298497937023661山11957221494204826.1529413927756816115内蒙31118703042581528.4591116190511321476辽42858946396648124.591028432101591337607吉15306421908703827.1776461675591722758黑龙5347651175591624.1724586924574618796上9233362066361121.29376922190242769江25947579544800921.4490345688540128529浙558280712780678421.171081514101026832250安17909902418081328.3771077469501714342福23348785598871822.6280702274024125070江9472041454694425.8571768069355713515山460250510975897121.62048217195013520274河52980536045882726.091081731104332418701湖20054034524197222.8592620789102317094湖42554536960145625.712226562216951420262广42776458555757323.7276655772689323573

广津

北西古宁林江海苏江徽建西东南北南东西

9896342288975920.5986790783250910570120524*********.12407193981114270271802922573523.64106691105284153519102813735576419.341374560134800214009669816638103125.5237299632033912429

海四贵

南庆川州

云南8306821779090522.0565492365034110539西藏 陕西

11032862016227525.1189749186828512591

419893670157922.322490822266810595青3461664922720.9854865532287394宁109083156505524.161303571295077644新

191764307149724.683165243045699248

续表一、原始数据

地区流动资产固定资产职工人数银行借款资本金 北京46593893931311101811710243082924903 天津49432904148950120486311804932303981 河北12465461174841758226605403808610332912 山西3557340578089028042019385412934108 内蒙古3227037526749640168664602903333205 辽宁87633139329875453961919997246980228 吉林2372734361468524945265133102409414 黑龙江1861422267900714516925633401871204 上海108326757789596137983726841616258380 江苏32606238250730037680355809673016462531 浙江34257475297148538311974997997220763537 安徽50893237351798474788014500824952914 福建9853152111604455436920164688310778050 江西2264148339994030258628441162425545 山东256102812644708212671968628459614179543 河南1126250515312738838931627116299442756 湖北841918810129567621641120276426427542

甘肃

海夏疆

湖南75572589399762926239316990736723945 广东24910272322305539232307673624019485556 广西3234113526962034712068715653214208 海南278001796182275868182675465657 重庆2418088226702314998826243481656726 四川65693077031491593804925046475130203 贵州3241104177418514062175419972387169 云南33014615809520254676510317432912189 西藏

陕西32245703934343385060011482872769354 甘肃1364007173503115317555010741124357 青海176344363754232662124070209130 宁夏411855679716484183147424429111 新疆7909811266081752463263604677916

习题5:利用主成分分析方法和下表中20个城市高新技术产业化能力数据,《对20个城市高新技术产业化能力进行横向评价》

20个城市高新技术产业化能力指标和数值表(2006年原始数据) 一级指标高新技术产业化

二级指标高新技术产业化水平高新技术产业化效益 三级指标高技术产 业增加值 占工业增 加值比重 知识密集 型产业增 加值占生 产总值比 重 高新技术 产品出口

额占商品 出口额比 重 新产品销 售收入占 产品销售 收入比重 高技术产 业劳动生 产率 高技术 产业增 加值率 知识密集 型产业劳 动生产率

地区% % % % 万元/人% 万元/人北京26.57 32.45 46.01 17.64 21.51 18.38 21.94 天津24.39 10.01 47.39 28.12 30.63 26.38 17.39 沈阳9.32 8.93 27.36 19.57 11.76 27.29 19.09 大连10.45 12.33 14.41 10.91 15.56 27.81 37.70 长春 3.22 10.35 6.81 45.11 10.33 42.24 21.18 哈尔滨14.01 8.72 4.24 15.95 10.09 30.91 16.88 上海19.24 17.72 40.60 30.14 21.56 20.79 26.80 南京16.95 10.70 26.00 19.50 18.63 18.39 31.90 苏州31.84 7.28 65.83 7.52 12.92 22.17 69.21 杭州12.51 12.36 34.32 16.56 16.08 14.76 33.48 宁波 6.59 9.94 5.89 13.97 5.91 17.62 49.76 厦门42.41 10.92 32.90 22.61 17.82 25.53 44.63 济南34.45 10.99 10.19 17.73 29.76 38.37 29.39 青岛8.80 7.74 11.63 32.41 16.33 24.69 38.84 武汉17.26 11.47 26.82 10.65 24.94 37.12 19.23 广州8.81 12.08 23.71 17.88 9.15 23.59 34.99 深圳51.82 13.02 48.22 15.53 15.00 20.68 51.15 重庆 6.24 8.14 4.37 31.46 10.70 34.78 10.22 成都16.85 12.50 20.88

17.97 14.38 37.13 25.71 西安27.80 14.32 13.82 12.94 9.32 33.70 13.42 全国11.04 9.67 29.04 14.80 13.08 23.94 14.59

(数据参见附件表2:“2003-2006年高新技术产业化”数据。利用其中2006年-未经过修正

的原始数据)

习题6: 对中国乡镇企业绩效的进行因子分析.数据见表1. 解题要求:

①一律用SPSS软件做(并下载计算结果,包括相应的图、表等)。 ②答案用A4纸打印,小标题用4号字黑体,正文用小4号字。 ③ 2012年5月9日(周3 )下午3:00交至8-603A(打印版 和电子版)。

因篇幅问题不能全部显示,请点此查看更多更全内容