您的当前位置:首页正文

国家开放大学新版统计学原理作业答案

2023-05-17 来源:星星旅游
统计学原理形成性考核一(第一章和第二章)

一、单项选择

1.在某个或某些属性上的属性表现相同的诸多实体构成的集合称为(A)。A.同类实体

B.异类实体

C.总体

D.同类集合

2.不能自然地直接使用数字表示的属性称为(B)属性。A.数量属性

B.质量属性

C.水平属性

D.特征属性

3.属于总体边界清晰,个体不清晰的变量是(A)。

A.一列车的煤炭B.滇金丝猴种群C.大兴安岭的树D.工业流水线的一批产品4.(A

)是选择个体及采集个体属性值的途径。

B.调查工具

C.调查准则

D.调查程序

A.调查方法

5.从某生产线上每隔25min抽取5min的产品进行检验,这种抽样方式属于(C)。A.简单随机抽样

B.等距抽样

C.整群抽样

D.分层抽样

6.抽样调查和重点调查都是非全面调查,两者的根本区别是(D)。A.灵活程度不同

B.组织方式不同

C.作用不同

D.抽取样本的方式不同

7.按随机原则进行的抽样称(D)A.问卷设计

B.调查

C.抽样设计

D.随机抽样

8.统计学将有许多个小实体构成的同类实体看做集合称为(A)A.总体

B.个体

C.总量

D.变量

9.据总体的形态,总体可以分为(B)A.时间总体和空间总体C.时点总体和时期总体10.统计工作过程由(A.统计设计和统计设施C.现场调查和调查设计

A

B.实在总体和想象总体D.平面总体和线性总体

)两个步骤构成。B.统计实施和调查设计D.统计设计和调查设计

二、多项选择

1.按照信息科学和数据库理论,信息的构成要素主要包括(AB)。A.实体

B.属性

C.调查

D.情况

12.属性的基本类别包括(A.数量属性

AB)。

C.水平属性

ABC

D.特征属性)

B.质量属性

3.下列属于总体边界清晰,个体边界不清晰的是(A.一艘石油巨轮的石油C.公园一片草地

4.现场调查方法包括的方式有(ABC)A.访问

B.观察

C.实验

D.测量

B.一列车的煤炭D.大兴安岭的树

5.按照调查的范围,可将调查分为(AB)A.全面调查

B。非全面调查

C。概率调查

D。非概率调查

三、判断题

1.文字是一种数据。

2.特性可以独立存在,不依赖于观察者的主观视角。

(√)(×)

3.信息构成要素中的实体,只能是通过普通感官直接感知的内容。(×)4.所谓组件构成实体不可缺少的一部分,是客观存在,不依赖于观察者的主观视角,一旦缺少了组件,实体便不完整。

5.数量属性与质量属性是属性的基本分类,也是最重要的分类。

(√)(√)

6.统计学中将由许多个小实体构成的同类实体看作集合,称之为总体,将构成总体的许多小实体看成集合的元素,特别地,如果小实体都不可再分,则称之为个体。

(√)

7.统计调查都是对样本中的个体进行的,故其结果可称之为个体数据,但统计调查的最终目标却是要获得总体数据所包含的信息。8.统计数据的获取过程包括调查和汇总两个阶段

(√)(√)

9.数据一般只包括文字、符号、数码、数字、数值等类型,个体信息量巨大的音频、视频、图像并不包括在内。

10.如果在总体的每个层里独立进行抽样,则称为分层抽样。

(√)(√)

四、简单题

1、简述分类变量和数值变量的根本区别

2答:由于属性可以分为数量属性和质量属性,因此,可以分为数量变量和分类变量。数量属性对应的是数值型变量,简称数值变量,与质量属性对应的是分类型变量,简称分类变量。数量变量是指可以自然地直接使用数值表示其变量值的变量。分类变量是指不可以自然地可直接使用数字表示其变量值。数值型变量是指值可以取一系列的数,这些值对于加法、减法、求平均值等操作是有意义的,而分类变量对于上述的操作是没有意义的。

2.简述信息与数据的异同。举例说明有些信息不是数据。

答:数据和信息是不可分割的两个术语,但它们又有一定的区别。首先是概念不同,信息是客观世界在人们头脑中的反映,是客观事物的表征。数据是信息的载体,是对客观存在实体的一种记载和描述。数据是对客观事物记录下来的可以鉴别的符号。这些符号不仅指数字,且包括回字符、字图形等;信息是经过加工后并对客观世界产生影响的数据。其次,数据只有经过加工处理后才能成为信息。例如,“0、1、2..”、“阴、雨、下降、气温””学生的档案记录、货物的运输情况”等都是数据,数据经过加工后就成为信息。

3.分别指出下列描述中的实体与属性(1)汽车的颜色(2)家庭的人口数

(3)国内生产总值最多的国家(4)人的身高

(1)汽车的颜色(2)家庭的人口数

汽车是实体家庭是实体

颜色是属性人口数是属性

国内生产总值最多是属性身高是属性

(3)国内生产总值最多的国家国家是实体(4)人的身高

人是实体

4.统计调查的八要素有哪些?

答:统计调查具有八个要素:调查主体、调查客体、调查内容(项目)、调查方法、调查工具、调查准则、调查程序、调查结果。

35、简述抽样设计的内容和抽样的一般步骤。答:抽样设计的内容:(1)定义目标总体比

(2)决定抽样框(3)抽样调查的组织形式和抽样方法的选择(4)精度的确定(5)确定样本量(6)经费核算抽样的一般步骤

(1)界定总体

(2)指定抽样框

(3)实施抽样调查并推测总体(4)分割总体(5)决定样本规模(6)决定抽样方式

(7)确定抽样的信度和效度

4统计学原理形成性考核二(第三章和第四章)

一、单项选择

1.对一个变量而言,其(B)指的是全面调查获得的所有变量值(或组)与其对应频率的一揽子表示。A.分布

B.总体分布

C.样本分布

D.频数

2.(C)指的是抽样调查获得的所有变量值(或组)与其对应频率的一揽子表示。A.分布

B.总体分布

C.样本分布

D.联合总体分布

3.以文字叙述方式表达简单变量的分布,一般用于变量值极少的场合(如性别)的分布的表达方法是(A)。

A.语示法B.表示法C.图示法D.函数法

4.以表格陈列的方式表达较复杂变量的分布,用于变量值较少的场合(如年龄段)的分布的表达方法是(B)。

A.语示法B.表示法C.图示法D.函数法

5.以图形方式表达复杂变量的分布的表达方法是(C)。A.语示法B.表示法C.图示法D.函数法

6.(B)既可以反映较少类数也可以反映较多类数的分类变量分布,甚至也能反映分组化的数值变量分布,居于优先选择地位。A.7.

饼形图

B.

柱形图

C.

条形图

D.

直方图

在变量值极少的场合,在一个圆形内,以顶点在圆心的扇形的相对面积(即

占整个圆形面积的比例)表示概率大小,以扇形的颜色或其他标记表示对应变量值(既可是分类变量也可是数值变量的)。这样的图称为(A)。A.8.

饼形图

B.

柱形图

C.

条形图

D.

直方图

在所有总体分布特征中,最重要的分布特征是(D)。

A.中位数B.众数C.标准差D.均值

9.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是(D)。A.二者均为离散变量

B.二者均为连续变量

C.前者为连续变量,后者为离散变量D.前者为离散变量,后者为连续变量10.总量指标数值大小(A)

5A.随总体范围扩大而增大B.随总体范围扩大而减小C.随总体范围缩小而增大D.与总体范围大小无关

11.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和(C)A.小于100%B.大于100%C.等于100%D.小于或大于100%12.众数是(C)。A.出现次数最少的次数

B.出现次数最少的标志值

C.出现次数最多的变量值D.出现次数最多的频数13.在一组数据中,每个数据类型出现的次数称为(B)。A.参数B.频数C.众数D.组数14.集中趋势最主要的测度值是(B)。A.几何平均数B.算术平均数C.众数D.中位数15.下列分布中,不属于离散随机变量分布的是(D)A.超几何分布二、多项选择

1.分布的表达方法有(ABCD)。

A.语示法B.表示法C.图示法D.函数法2.分布图的主要形式包括(ABCD)。A.饼形图

B.柱形图

C.

条形图

D.

直方图

B.伯努利分布

C.几何分布

D.正态分布

3.均值的计算方式包括(AB)。A.算术平均数

B.加权平均数

C.中位数

D.方差

4.可以反映数值变量离散程度分布特征的是(BD)A.中数B.四分位差

C.偏度

D.标准差

5.下列分布中,属于连续随机变量分布的是(BD)A.超几何分布

B.指数分布

C.几何分布

D.正态分布

三、计算分析题

1.某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系?

序号性别1男2男3男4女5男6男7女8男9女10女11男12男6职称工程师技术员技术员技术员技术员工程师工程师技术员技术员工程师技术员技术员解:设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师(1)P(A)=4/12=1/3(2)P(B)=4/12=1/3(3)P(AB)=2/12=1/6

(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2

2.某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、

二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。

解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率P(A)考虑逆事件A“任取一个零件为正品”,表示通过三道工序都合格。据题意,有:

于是

73.已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。试求任一参考人员成绩优秀的概率。

解:设A表示“合格”,B表示“优秀”。由于B=AB,于是

4.某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。

解:设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。

脱靶的概率=1-0.9=0.1

或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1

85.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?解:

设A=活到55岁,B=活到70岁。所求概率为:

6.某企业2003年某月份按工人劳动生产率高低分组的有关资料如下:8.

某班级25名学生的统计学考试成绩数据如下:

89,95,98,95,73,86,78,67,69,82,84,89,93,91,75,86,88,82,53,80,79,81,70,87,60试计算:

(1)该班统计学成绩的均值、中位数和四分位数;(2)该班统计学成绩的方差、标准差。

(3)根据60分以下,60-70,70-80,80-90,90以上的分组标准,编制考试成绩的分布表538191

608293

678295

698495

708698

7386

7587

7888

7989

8089

(1)答:

x

53606769707375787980818282848686878889899193959598

81.2

25中位数Me=82中间第13个是82

Ql=75(2)

x536067697073

QM=89

x-平均数-28.2-21.2-14.2-12.2-11.2-8.2

平方795.24449.44201.64148.84125.4467.24

x848686878889

x-平均数2.84.84.85.86.87.8

平方7.8423.0423.0433.6446.2460.84

975787980818282

-6.2-3.2-2.2-1.2-0.20.80.8

38.4410.244.841.440.040.640.64

899193959598平均81.2

7.89.811.813.813.816.80

60.8496.04139.24190.44190.44282.24方差2998

2998/25=119.92119.9210.95

答:

(3)

按成绩分组60以下60-7070-8080-9090以上合计

S2=119.92S=10.95

人数13511525

比重(%)

412204420100

10形成性考核三(第五章)

一、单项选择(每题2分,共计40分)

1.估计量的含义是指(A).

A.用来估计总体参数的统计量的名称B.用来估计总体参数的统计量的具体数值C.总体参数的名称D.总体参数的具体数值

2.根据一个具体的样本求出的总体均值的95%的置信区间(D).A.以95%的概率包含总体均值C.一定包含总体均值3.无偏估计是指(B)

A.样本统计量的值恰好等于待估的总体参数

B.所有可能样本估计值的数学期望等于待估总体参数C.样本估计值围绕待估总体参数使其误差最小D.样本量扩大到和总体单元相等时与总体参数一致

4.总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以(A)A.样本均值的抽样标准差C.样本方差

B.样本标准差D.总体标准差

B.有5%的可能性包含总体均值

D.要么包含总体均值,要么不包含总体均值

5.当样本量一定时,置信区间的宽度(B)A.随着置信系数的增大而减小C.与置信系数的大小无关

B.随着置信系数的增大而增大D.与置信系数的平方成反比

6.当置信水平一定时,置信区间的宽度(A)A.随着样本量的增大而减小C.与样本量的大小无关7.一个95%的置信区间是指(C)

A.总体参数中有95%的概率落在这一区间内B.总体参数中有5%的概率落在这一区间内

C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中有95%的区间不包含该总体参数

11B.随着样本量的增大而增大D.与样本量的平方根成正比

8.95%的置信水平是指(B)

A.总体参数落在一个特定的样本所构造的区间内的概率为95%

B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%

C.总体参数落在一个特定的样本所构造的区间内的概率为5%

D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%9.一个估计量的有效性是指(D)

A.该估计量的数学期望等于被估计的总体参数B.该估计量的一个具体数值等于被估计的总体参数C.该估计量的方差比其他估计量大D.该估计量的方差比其他估计量小10.一个估计量的一致性是指(C)

A.该估计量的数学期望等于被估计的总体参数B.该估计量的方差比其他估计量小

C.随着样本量的增大该估计量的值越来越接近被估计的总体参数D.该估计量的方差比其他估计量大

11.置信系数(1-α)表达了置信区间的(D)A.准确性B.精确性C.显著性

D.可靠性

12.在置信水平不变的条件下,要缩小置信区间,则(A)A.需要增加样本量C.需要保持样本量不变

B.需要减小样本量

D.需要改变统计量的抽样标准差

13.在其它条件不变的情况下,总体数据的方差越大,估计时所需的样本量(A)A.越大

B.越小

C.可能大也可能小

D.不变

14.在其它条件相同的情况下,95%的置信区间比90%的置信区间(A)A.要宽

B.要窄

C.相同

D.可能宽也可能窄

15.指出下面的说法中哪一个是正确的(A)A.样本量越大,样本均值的抽样标准差就越小B.样本量越大,样本均值的抽样标准差就越大C.样本量越小,样本均值的抽样标准差就越小D.样本均值的抽样标准差与样本量无关16.指出下面的说法中哪一个是正确的(A)A.置信水平越大,估计的可靠性就越大

12B.置信水平越大,估计的可靠性就越小C.置信水平越小,估计的可靠性就越大D.置信水平的大小与估计的可靠性无关17.指出下面的说法中哪一个是正确的(A)

A.在置信水平一定的条件下,要提高估计的可靠性,就应缩小样本量B.在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量C.在样本量一定的条件下,要提高估计的可靠性,就降低置信水平D.在样本量一定的条件下,要提高估计的准确性,就提高置信水平

18.在一项对学生资助贷款的研究中,随机抽取480名学生作为样本,得到毕业前的平均欠款余额为12168元,标准差为2200元。则贷款学生总体中平均欠款额的95%的置信区间为(A)A.(11971,12365)

B.(11971,13365)

C.(11971,14365)

D.(11971,15365)

19.从一个正态总体中随机抽取n=20的一个随机样本,样本均值为17.25,样本标准差为3.3,则总体均值的95%的置信区间为(B)A.(15.97,18.53)

B.(15.71,18.79)C.(15.14,19.36)

D.(14.89,20.45)

20.某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的边际误差为25元,应抽取的样本量为(C)A.20

B.30

C.40

D.50

二、多项选择(每题2分,共计10分)

1.在抽样推断中(ACD)A.抽样指标的数值不是唯一的C.可能抽取许多个样本

B.总体指标是一个随机变量D.统计量是样本变量的涵数

2.从全及总体中抽取样本单位的方法有(BC)

A.简单随机抽样B.重复抽样C.不重复抽样D.概率抽样3.在抽样推断中,样本单位数的多少取决于(BC)A.总体标准差的大小C.抽样估计的把握程度

B.允许误差的大小D.总体参数的大小

4.区间估计和点估计的理论其核心分别是(AB).A.中心极限定理C.切比雪夫大数定理5.简单随机抽样(ABCD)

13B.大数定理D.辛钦大数定理

A、试用于总体各单位呈均匀分布的总体;B、适用于总体各单位标志变异较大的总体C、在抽样之前要求对总体各单位加以编号D、最符合随机原则

三、简答题(每题10分,共计20分)

1.简述以样本均值估计总体均值的理由?

第一,对于待估从参数总体均值而言,样本均值作为估计量(估计产品)随着两本量增大可以非常接近,且需要时可以无限接近总体均值。第二,样本均值几乎符合所有估计量的优良性质。

第三,人们已经找到了一条途径——区间估计,能够可靠地实现以样本均值估计总体均值的目标。

2.随机试验满足三个条件是什么?(1)试验是可重复的

(2)试验的所有可能结果是已知的(3)一次具体试验的结果是无法确知

14四、计算分析题(每题15分,共计30分)

1.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%.求总体比率的置信区间,置信水平分别为90%和95%.

解:已知样本容量n=200,为大样本,拥有该品牌电视机的家庭比率p=23%,拥有该品牌电视机的家庭比率的抽样标准误差为

pp(1P)0.23(10.23)2.98%n200

(1)双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得Zα/2=1.64,此时的置信区间=

p

z

a/2p(1p)23%1.642.98%n

即18.11%——27.89%

可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%——27.89%).

(2)双侧置信水平为95%时,得Zα/2=1.96,此时的置信区间为p

z

a/2p(1p)23%1.962.98%n

即17.16%——28.84%

可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为(17.16%——28.84%).

2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。假定总体标准差为15元,求样本均值的抽样标准误差;

在95%的置信水平下,求允许误差;

如果样本均值为120元,求总体均值95%的置信区间。解:(1)已假定总体标准差为=15元,0

15则样本均值的抽样标准误差为

x152.14n49(2)已知置信水平1-α=95%,得Zα/2=1.96于是,允许误差是EZa/21.962.144.19n(3)已知样本均值为x=120元,置信水平1-α=95%,得Zα/2=1.96,这时总体均值的置信区间为xza/2即置信区间为(115.81——124.19)

可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。

1204.19n16形成性考核(第六章)

一、单项选择(每题2分,共计40分)

1.对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为(D)

A.参数估计B.双侧检验C.单侧检验D.假设检验2.研究者想收集证据予以支持的假设通常称为(B)A.原假设B.备择假设C.合理假设D.正常假设3.在假设检验中,原假设和备择假设(C)A.都有可能成立

B.都有可能不成立

C.只有一个成立而且必有一个成立D.原假设一定成立,备择假设不一定成立4.在假设检验中,第I类错误是指(A)A.当原假设正确时拒绝原假设

B.当原假设错误时拒绝原假设

C.当备择假设正确时未拒绝备择假设D.当备择假设不正确时拒绝备择假设5,当备择假设为:H1:此时的假设检验称为(C)

0A.双侧检验B.右侧检验C.左侧检验D.显著性检验

6.某厂生产的化纤纤度服从正态分布,纤维纤度的标准均值为1.40.某天测得25根纤维的纤度的均值为x=1.39,检验与原来设计的标准均值相比是否有所下降,要求的显著性水平为α=0.05,则下列正确的假设形式是(D)A.HO:μ=1.40,H1:u≠1.40C.HO:μ<1.40,H1:u≥1.40

B.HO:μ≤1.40,D.HO:μ≥1.40,

H1:u>1.40H1:u<1.40

7.一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,用来检验这一结论的原假设和备择假设应为(C).A.HO:μ≤20%,C.HO:π≤20%

H1:μ>20%H1:

π>20%

B.HO:π=20%D.HO:π≥20%

H1:π≠20%H1:π<20%

8.在假设检验中,不拒绝原假设意味着(D).A.原假设肯定是正确的

B.原假设肯定是错误的

C.没有证据证明原假设是正确的D.没有证据证明原假设是错误的9.若检验的假设为HO:,H1:00则拒绝域为(B)

A.z

zB.zzC.zz0/2或者zzD.z

0z/2或者zz10.若检验的假设为HO:,H1:则拒绝域为(A)

17A.z

zB.zzC.zz/2或者zzD.zz/2或者zz11.如果原假设H0为真,所得到的样本结果会像实际观测取值那么极端或更极端的概率称为(C)A.临界值

B.统计量

C.P值

D.事先给定的显著性水平

12.对于给定的显著性水平α,根据P值拒绝原假设的准则是(B)A.P=α

B.P<α

C.P>αD.P=α=0

13.下列几个数值中,检验的p值为(D)时拒绝原假设的理由最充分A.95%

B.50%

C.5%

D.2%

14.若一项假设规定显著性水平为α=0.05,下面的表述哪一个是正确的(B)A.接受H0时的可靠性为95%C.H0为假时被接受的概率为5%

B.接受H1时的可靠性为95%D.H1为真时被拒绝的概率为5%

15.进行假设检验时,在样本量一定的条件下,犯第一类错误的概率减小,犯第二类错误的概率就会(B)A.减小

B.增大

C,不变

D.不确定

16.容量为3L的橙汁容器上的标签表明,这种橙汁的脂肪含量的均值不超过1克,在对标签上的说明进行检验时,建立的原假设和备择假设为H0:μ≤1,H1:μ>1,该检验所犯的第一类错误是(D)A.实际情况是μ≥1,检验认为μ>1C.实际情况是μ≥1,检验认为μ<1

B.实际情况是μ≤1,检验认为μ<1D.实际情况是μ≤1,检验认为μ>1

17.如果某项假设检验的结论在0.05的显著性水平下是显著的(即在0.05的显著性水平下拒绝了原假设),则错误的说法是(D)A.在0.10的显著性水平下必定也是显著的B.在0.01的显著性水平下不一定具有显著性C.原假设为真时拒绝原假设的概率为0.05D.检验的p值大于0.05

18.在一次假设检验中当显著性水平α=0.01,原假设被拒绝时,则用α=0.05,(A)A.原假设一定会被拒绝C.需要重新检验

B.原假设一定不会被拒绝D.有可能拒绝原假设

19.下列场合中,(C)适用t检验统计量?A.样本为大样本,且总体方差己知C.样本为小样本,且总体方差未知

B.样本为小样本,且总体方差已知D.样本为大样本,且总体方差未知

1820.当样本统计量的取值未落入原假设的拒绝域时,表示(B)A.可以放心地接受原假设

B.没有充足的理由否定原假设

C.没有充足的理由否定备择假设D.备择假设是错误的

三、简答题(每题10分,共计20分)

1.简述假设检验的步骤。假设检验的一般步骤如下:

(1)根据所要解决的问题和检验的总体分布特征,建立合适的原假设和备择假设。

(2)根据所要解决的问题,给出容许的第一类错误概率α,称为显著性水平。(3)根据检验的总体分布特征、其他分布特征已知与否以及比较的是差还是商,选定检验统计量。

(4)根据检验统计量服从的分布和显著性水平,查出相应的分位点(称为临界值,实则是拒绝域与接受域的分界点),并据此确定拒绝域。

(5)利用样本数据计算检验统计量的具体数值,若该值落入拒绝域,则拒绝原假设;否则,保留原假设。

(6)以计算所得的检验统计量的具体款值为分位点,倒查其“显著性水平”获得P值。P值提供了额外的信息,P值越小,拒绝原假设的证据力越强,说明结论在统计上更显者。P值相当于实际的显著性水平,即实际的α值。

2.简述假设检验与区间估计之间的关系。

尽管从方法论的角度来看,区间估计是更好的手段,但它在以下几方面明显不如假设检验:

(1)当区间估计用于检验时,只是结果的比较;而假设检验既有结果上的比较,也有过程中的比较,如产品检验中常见的序贯抽样很少用于以估计为目的的抽样。

(2)区间估计仅仅聚焦于给定置信度的分布特征估计或分布估计,较少聚焦于给定区间的概率估计。相比之下,基于统计学中分布、分位点、置信度三者知二得一的规律,假设检验除了比较区间外,还比较概率。这样,其视角无疑更为开阔,手段也相对更为丰富。区间估计未涉及力值统计量,但p值提供的信息是有价值的,

19(3)在对一个随机变量或一个随机向量的分布或分布特征进行区间估计时,只关注第一类(弃真)错误,当然不需要,也不涉及非常重要的第二类(取伪)错误的概念。假设检验有关两类错误的内容是独到的。

四、计算分析题(20分,共计40分)

1.某一小麦品种的平均产量为5200kg/h㎡.一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/h㎡,标准差为120/h㎡.试检验改良后的新品种产量是否有显著提高?(α=0,05)(本题10分)(参考数值Z0.025=1.96解:HO:μ≤5200检验统计量:

z

52755200

3.75

12036Z0.05=1.65Z0.005=2.58)

H1:μ>5200α=0.05n=36临界值(C):1.65

决策:拒绝HO2、一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml.为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml.取显著性水平α=0.05,检验该天生产的饮料容量是否符合标准要求?(本题10分)(参考数值Za/2,Z0.025=1.96Z0.05=1.65Z0.005=2.58)解:HO:μ=255

H1:μ≠255

α=0.05

n=40

临界值(c):1.96检验统计量:

z

x0n

255.8255

1.01

540决策:不拒绝HO

结论:样本提供的证据表明:该天生产的饮料符合标准要求

20

因篇幅问题不能全部显示,请点此查看更多更全内容