第三章 统计描述
一、选择题
1.有5辆汽车在同一距离的公路上行驶的速度资料,确定汽车平均每小时行驶速度的平均数公式是( C )。
xfx∑∑ B.A.
n∑f
m∑ C. D.
m1∑x∑x
n
2.加权算术平均数的大小取决于( D )。
(甲)频数绝对量的大小;(乙)频数之间的比率;(丙)变量值的大小。 A.甲丙 B.乙 C.甲乙 D.乙丙
二、问答题
1.指出表3-1、表3-2和表3-3中的主词与宾词、横行标题与纵栏标题,并根据主词的结构分类法,指出该统计表的类型。
表3-1 ××市2000、2001年国内生产总值表
表3-2 国内商业主要经济统计指标(2001年×月)
莫名·编辑
表3-3 ×× 市饮食业机构、人员基本情况(2001年)
答:表3-1为主词简单分组表。
表3-2为主词复合分组表。
莫名·编辑
表3-3为主词复合分组表,一部分主词(市、县、县以下)放置在宾词的位置。
2.在教材第三章的例3-6中,按调和平均法和按算术平均法计算的结果一致,根据幂平均数是参数k的单调不减函数的性质,算术平均数≥调和平均数,这两者是否存在矛盾?
答:不存在矛盾,因为上面所说的算术平均数≥调和平均数的前提条件是每个变量的权数是相等的,而例3-6中各变量的权数不相等。所以两者也就不存在矛盾。
三、计算题
1.抽样调查某省50户城镇居民平均每人全年可支配收入资料如表3-4所示。
表3-4 居民年人均可支配收入 单位:百元
要求:
莫名·编辑
(1)试根据上述资料编制次(频)数分布数列; (2)编制向上和向下累计频数、频率数列;
(3)根据所编制的次数分布数列绘制直方图、折线图与曲线图,并说明其属于何种分布类型; (4)根据所编制的向上(向下)累计频数(频率)数列绘制累计曲线图; (5)根据频数分布曲线图说明居民年人均可支配收入的分布类型。 解:(1)
表3-5
(2)
表3-6
表3-7
莫名·编辑
(3)可以使用Excel的数据分析工具中的“直方图”工具生成如第(1)题所示的次数分布数列以及相应的直方图和折线图等。具体步骤如下:
①在Excel中输入相关数据,如表3-8所示。
表3-8
在表3-8中,收入放在A列,每分组的上限放在B列。这里需要注意的是,分组上限并不是“60、70、80、…”等整数,而是略小于它们的数,这是因为直方图工具分组时采用的是“上限在内”原则,为符合统计的“上限不在内”原则,在Excel中应采用如下方法确定上限值:
以“60以下”这一收入分组为例,必须找到这样的一个上限值:它略小于60,但又是“60以下”这一组中最大的。通过观察收入数据,我们采用了59.9这一上限值。59.9实际上表示的是“小于等于59.9”的收入分组,并不完全等同于“60以下”的分组,但因为在收入数据中,并没有大于59.9且小于60的数,因此“小于等于59.9”的分组与“60以下”的分组所包含的收入数据肯定是相同的。如此,我们就在Excel中遵守了“上限不在内”的原则。
②执行菜单命令[工具]→[数据分析],调出“数据分析”对话框,选择“直方图”选项,调出“直方图”对话框。
注意,若“数据分析”命令没有出现在“工具”菜单上,则应先使用[工具]→[加载宏]命令来加载“分析工具库”。
③在“直方图”对话框中,输入相关数据,见图3-1。 输入区域:$A$1:$A$51
莫名·编辑
图3-1
接收区域:$B$1:$B$6(接收区域的数值应按升序排列)
输出区域:$C$1(指输出区域的左上角单元格)选中“标志”和“图表输出”复选框。 ④结果如图3-2所示。
图3-2
C7中的“其他”是指大于99.9的收人分组,在本题中即指“100~110”这一分组。D1中的“频率”指的是“频数”。
⑤对直方图进行修改。为了使上述直方图的表示更符合统计学中的习惯做法,在工作表的E列增加“频率(%)”一栏,并对工作表和直方图效果进行一定的修改,结果如图3-3。(具体操作步骤略)
⑥对于折线图,有两种方法:一是可以根据C列和E列的数据(或C列和D列的数据)直接在Excel
莫名·编辑
中插入图表;二是可以直接将E列数据加在直方图上。这里用第二种方法。
,打开“源左键单击直方图,使直方图处于选中状态(如图3-3),执行菜单命令:[图表]→[源数据]数据”对话框,在“系列”选项卡中单击“添加”按钮,然后按图3-4所示填好“名称”和“值”文本框,再单击确定即可。
图3-3
莫名·编辑
图3-4
包括折线图的直方图如图3-5所示。
图3-5
⑦对于曲线图。右键单击图3-5中的折线,在弹出式菜单中单击“数据系列格式”,在调出的对话框的“图案”选项卡下,选中“平滑线”选项,再单击“确定”按钮即可。结果如图3-6所示。
莫名·编辑
图3-6(4)
累计曲线图如图3-7所示。
图3-7
(5)根据频数分布曲线图,在统计学中,居民年人均可支配收入的分布类型属于钟型分布。 2.请搜集一实际资料,利用洛伦茨曲线对收入分配的公平度进行评价。解略。
3.甲乙两企业生产三种产品的单位成本和总成本资料如表3-9所示,试比较哪个企业的平均成本高,并分析其原因。
莫名·编辑
表3-9
解:甲企业的平均成本=
2100+3000+15006600
=19.4118, =
210030001500340
++1520303255+1500+15006255
乙企业的平均成本==18.2895。 =
325515001500342
++152030
由上面的计算得知,甲企业的平均成本高于乙企业。
因为乙企业单位成本低的A产品生产的数量多,占总成本一半以上,即成本低的产品相对权数大,而甲企业生产单位成本低的A产品数量少,仅占总成本的31.8%(=2100/6600)。由于权数的作用,乙企业的平均成本低于甲企业。
4.甲乙两市场农产品价格及成交量资料如表3-10所示,试比较哪个市场的平均价格高,并分析其原因。
表3-10
1.2+2.8+1.55.5
=1.375, =
1.22.81.54++1.21.41.5
1.2×2+1.4×1+1.5×15.3
乙市场的平均价格===1.325。
44
解:甲市场的平均价格=
莫名·编辑
由上面的计算得知,甲市场农产品的平均价格高于乙市场。
因为价格低的甲产品在甲市场成交额少,仅占21.8%(=1.2/5.5);而在乙市场的成交额大,占45.3%(=2.4/5.3),由于权数的作用,甲市场的平均价格高于乙市场。
5.某企业工人平均月工资为1440元,月收入少于1280元的占一半,试估计众数,并对该企业工人工资的分布情况做一简要说明。
解:由题中可知,企业工人月工资的中位数=1280 所以众数≈1440-3×(1440-1280)=960
所以,众数<中位数<平均数,则该企业的月工资分布为右(正)偏,说明该企业工人的月工资分布中出现极大值,即出现有人拿到高额的工资,导致月工资分布呈右偏。
6.某城市对3000户居民人均月消费支出进行调查,得到表3-11资料。 要求:
(1)计算居民总平均月支出; (2)计算居民月均支出标准差; (3)计算居民月均支出中位数和众数。
解:(1)居民总平均月支出=150×0.01+250×0.06+350×0.15+450×0.2+550×0.35+650×0.1+750×0.06+850×0.04+950×0.02+1050×0.01=525。
表3-11
莫名·编辑
(2)居民月均支出标准差
(150−525)+(250−525)+(350−525)500~600中。
用下限公式计算:
222+\"+(1050−525)=881250≈938.7492
2(3)居民户数数列向上累计频数为2310,占总户数一半以上,中位数处在这一组,即月均支出数列
∑f
Me=LMe+
2用上限公式计算:
−SMe−1fMe
×dMe=500+
1500−1260
×100≈500+22.8571=522.8571
1050
∑f
Me=UMe−
2−SMe+1fMe
×dMe=600−
1500−690
×100≈600−77.1429=522.8571
1050
频数最高的(户数最多)组就是众数所在之组,众数应处于居民月均支出分组500~600这一组,用下限公式计算:
Mo=LMo+
(f
fMo−fMo−1
Mo
−fMo−1+fMo−fMo+1
)()×dMo
=500+
1050−600
×100=537.5。
(1050−600)+(1050−300)用上限公式计算:
Mo=UMo−
(f
fMo−fMo+1
Mo
−fMo−1+fMo−fMo+1
)()×dMo
=600−
1050−300
×100=537.5。
(1050−600)+(1050−300)7.已知标志值总和为415,标志值平方和为1775,总体单位数为100,试求其方差和标准差。 解:由题可知,
∑x
i=1
100
i
=415,∑xi2=1775,所以x=4.15,
i=1
100
σ=
2
∑(i=1
100
xi−x
)2
100
=
∑xi2−100x
i=1
100
2
100
=0.5275,所以σ=0.7263。
8.某管理局下属8家企业的产品销售数据如表3-12所示。
表3-12 单位:万元
莫名·编辑
试比较其产品销售额和销售利润的离散程度。
289.2204
≈0.5393。
536.25
21.6004
销售利润的平均数=32.5125,标准差=21.6004,所以其标准差系数=≈0.6644。
32.5125
解:产品销售额的平均数=536.25,标准差=289.2204,所以其标准差系数=
根据标准差系数的计算结果,产品销售额的标准差系数较小,说明产品销售额离散程度较小,分布比较均匀。
9.某生产班组11个工人日生产零件数为:15,17,19,20,22,22,23,23,25,26,30。要求: (1)计算平均数和方差;
(2)按照15~19、20~24、24以上分成三组,计算组内方差和组间方差; (3)验证总方差等于组间方差与组内方差平均数之和。 解:(1)总平均数:x=
15+17+\"+30
=22。
11
2
2
(15−22)+(17−22)2
总方差:σ=
11
+\"+(30−22)2
=
178
。 11
(2)组一(15~19):15,17,19;x1=17,组内方差:σ12=
8
。 3
6
组二(20~24):20,22,22,23,23;x2=22,组内方差:σ22=。
514
组三:(24以上):25,26,30;x3=27,组内方差:σ32=。
3
17−22)(2
∴组间方差δ=
2
×3+(22−22)×5+(27−22)×3150
。 =
1111
22
莫名·编辑
8614×3+×5+×3
28253(3)证明:组内方差的平均值:σi=3=。
1111
17815028
总方差:σ2==+=δ2+σi2。
111111
所以,总方差=组间方+组内方差的平均值。原命题得证。
10.某高校学生参加英语四级考试的优秀率和合格率分别为15%和90%,试计算优秀率和合格率分布的方差和标准差。
解:该题属于求0—1分布的方差和标准差。
由题意得优秀率P1=15%,合格率P2=90%,所以优秀率的方差和标准差
σ12=P1(1−P1)=0.15×0.85=0.1275,σ1=0.3571。
所以合格率的方差和标准差
σ22=P2(1−P2)=0.9×0.1=0.09,σ2=0.3。
11.某企业工人工资资料如表3-13所示,试测定其偏度和峰度,并说明真分布状况。
表3-13
解:
表3-14
莫名·编辑
xf∑x=
∑f
=
1440302=7.2(百元)=1.51=1.2288。 ,σ=
200200
−22.8
v
偏度α=33=2003=−0.0614<0,
σ1.2288
1087.94v
峰度β=44−3=2002−3=2.3857−3=−0.6143<0。
σ⎛302⎞
⎜⎟⎝200⎠
工人工资分布呈负偏、低峰态。
因篇幅问题不能全部显示,请点此查看更多更全内容