2009——-2010学年第2学期 统计学原理 课程考核试卷
(B)
考核方式: (闭卷) 考试时量:120 分钟 题 号 实得分
得分 评卷 人
一、填空题(每空1分,共15分)
1、按照统计数据的收集方法,可以将其分为 和 。 2、收集数据的基本方法是 、 和 。
3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是 ,中位数是 。
4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率
其他 0密度函数为f(x)1 (a5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,求E(2X—3Y)= 。
6、概率是___ 到_____ 之间的一个数,用来描述一个事件发生的经常性. 7、对回归方程线性关系的检验,通常采用的是 检验。
8、在参数估计时,评价估计量的主要有三个指标是无偏性、 和 .
得分 评卷 人 二、判断题,正确打“√”;错误打“×”。(每题1分,共10 分)
1、理论统计学与应用统计学是两类性质不同的统计学( )
2、箱线图主要展示分组的数值型数据的分布.( )
3、抽样极限误差可以大于、小于或等于抽样平均误差.( )
4、在全国人口普查中,全国人口数是总体,每个人是总体单位.( )
5、直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计.( )
6。当置信水平一定时,置信区间的宽度随着样本量的增大而减少( )
7、在单因素方差分析中,SST =SSE+SSA( )
8、右侧检验中,如果P值<α,则拒绝H0。( )
9、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比.( )
10、当原假设为假时接受原假设,称为假设检验的第一类错误。( )
三、单项选择题(每小题1分,共 15分) 1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的样本( )。 A、2000个家庭
B、200万个家庭
C、2000个家庭的人均收入 D、200个万个家庭的总收入
2、当变量数列中各变量值的频数相等时( )。 A、该数列众数等于中位数 B、该数列众数等于均值
C、该数列无众数 D、该众数等于最大的数值
3、某地区商品销售额增长了5%,商品零售价格平均增长2%,则商品销售量增长( ).
A、7% B、10% C、2.94% D、3%
4、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有( )。 A.68%的数据 B.95%的数据 C.99%的数据
得分 评
D.100%的数据
5、某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他调查了200名学生,发现他们每月平均生活费支出是500元。该研究人员感兴趣的参数( ) A、该大学的所有学生
B、所有大学生的总生活费支出 C、该大学所有的在校本科生 D、所调查的200名学生
6、为了了解女性对某种品牌化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。这种调查方式是( ) A、简单随机抽样 B、分层抽样 C、方便抽样 D、自愿抽样
7、某居民小区为了了解住户对物业服务的看法,准备采取抽样调查方式搜集数据.物业管理部门利用最初的居民户登记名单进行抽样。但现在的小区中,原有的一些居民户已经伴奏,同时有些是新入住的居民户.这种调查产生的误差属于( )。 A、 随机误差 B、 抽样框误差
C、 回答误差 D、 无问答误差
8、若投掷一枚骰子,考虑两个事件:A:骰子的点数为奇数;B:骰子的点数为偶数大于等于4,则条件概率P(A︱B)=( ) A、1/3 B、1/6 C、1/2 D、1/4 9、如果峰态系数k〉0,表明该组数据是( ) A、尖峰分布 B、扁平分布 C、左偏分布
D、右偏分布
10、 回归平方和占总平方和的比例称为( )。
A、相关系数 B、回归系数 C、判定系数 D、估计标准误差
11、某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断成绩在70~90分之间的学生大约占( ) A、95% B、89% C、68% D、99%
12、一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下表1:
表1
赞成 反对 合计
男学生 45 105 150
女学生 42 78 120
合计 87 183 270
这个表格是( )。
A、4× 4列联表 B、2× 2列联表 C、2× 3列联表 D、2× 4列联表 13、方差分析的主要目的是判断( ) A、各总体是否存在方差
B、各样本数据之间是否有显著差异
C、分类型自变量对数值型因变量的影响是否显著 D、分类型因变量对数值型自变量的影响是否显著 14、 变量x与y之间的负相关是指( )。 A、x值增大时y值也随之增大 B、x值减少时y值也随之减少
C、x值增大时y值随之减少,或x值减少时y值随之增大
D、y的取值几乎不受x取值的影响
15、对于有线性相关关系的两变量建立的直线回归方程Y=a+bx中,回归系数b ( )。
A、肯定是正数 B、显著不为0 C、可能为0 D、肯定为负数
四、不定项选择题,答案少选,多选或不选给零分计算。(每
得分 评卷 人 小题2分,共 10分)
1、推断统计学研究的主要问题( )。 A、如何科学确定目标总体范围 B、如何科学地从总体中抽样样本
C、怎样控制样本对总体的代表性误差 D、怎样消除样本对总体代表性误差
E、如何科学地由所抽样本去推断总体
2、某商业企业今年与去年相比,各种商品的价格总指数为117.5%,这一结果说
明( )
A、商品零售价格平均上涨17.5% B、商品零售额上涨17.5%
C、由于价格提高使零售额增长17.5%
D、由于价格提高使零售额减少17.5% E、商品零售额增长17.5%
3、在直线相关和回归分析中( ) A、据同一资料,相关系数只能计算一个 B、据同一资料,相关系数可以计算两个 C、据同一资料,回归方程只能配合一个
D、据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个 E、回归方程和相关系数均与自变量和因变量的确定无关
4、在各种平均指标中,不受极端数值影响的平均指标是 ( ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数
5、下列动态指标中,可能取负值的指标是( )
A、增长量 B、发展速度 C、增长速度 D、平均发展速度 E、平均增长速度
五、计算题(第1题7分、第2题8分,第3题8分,第4题12分,第5题15分,总共50分)
1、设X~N(9,4),试描述10X的抽样分布。(7分)
2、某城市想要估计下岗职工中女性所占的比例,采取重复抽样方法随机抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性所占比例的置信区间。(z21.96)(8分)
3、某厂职工中,小学文化程度的有10%,初中文化程度的有50%,高中及高中以上文化程度的有40%。25岁以下青年在小学、初中、高中以上文化程度各组中的比例分别为20%,50%,70%。从该厂随机抽取一名职工,发现其年龄不到25岁,问他具有小学、初中、高中以上文化程度的概率各为多少?(8分)
得分 评
4、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对.
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(Z/22)(6分)
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设边际误差E=0。08)(6分)
5、某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:
方差分析表
变差来源 df SS MS F Significance F 回归 残差 总计 1 10 11 A 220158。07 1642866.67 1422708.6 B C 2。17E-09 参数估计表
Coefficients 标准误差 t Stat P—value
Intercept X Variable 1 363。6891 1。420211 62。45529 0。071091 5。823191 19.97749 0.000168 2。17E—09 ① 求A、B、C的值;(3分)
② 销售量的变差中有多少是由于广告费用的变动引起的?(3分) ③销售量与广告费用之间的相关系数是多少?(3分) ④写出估计的回归方程并解释回归系数的实际意义。(3分) ⑤检验线性关系的显著性
0。05,F0.05(1,10)4.96)(3分) (
2009—-2010学年第2学期 统计学原理 课程考核试卷(B)
一、填空题(每空1分,共15分) 1、观测数据、实验数据 2、自填式、面访式和电话式 3、1153。3、1020
ab(ba)24、、
1225、—5 6、0、1 7、F 8、有效性、一致性。
二、判断题,正确打“√”;错误打“×”。(每题1分,共10分)
1、√ 2、× 3、√ 4、× 5、√ 6、√ 7、√ 8、√ 9、× 10、×
三、单项选择题(每小题1分,共 15分) 1、A 2、C 3、C 4、B 5、B 6、C 7、B 8、A 9、A 10、C 11、C 12、B 13、C 14、C 15、B
四、不定项选择题,答案少选,多选或不选给零分计算。(每小题2分,共 10分) 1、BCE 2、AC 3、AD 4、D E 5、ACE
五、计算题(第1题7分、第2题8分,第3题8分,第4题12分,第5题15分,总共50分)
1、解:X~N(9,2),根据数学期望的性质10X也服从正态分布, 1分 由于
E(10X)=10E(X)=90 2分 D(10X)=100D(X)=100×4=400 2分
所以 10X~N(90,400) 2分 2、解:已知n100,z1.96,p226565% 2分 100根据公式得: pZ2p(1p)65%(165%) 4分 65%1.96n100即65%±9。35%=(55.65%,74。35%),95%的置信水平下估计该城市下岗职工中女
性所占比例的置信区间为55.65%~74。35%. 2分 3、解:设职工文化程度小学为事件A,职工文化程度初中事件B,职工文化程度高中为事件C,职工年龄25岁以下为事件D。
P(A)=0.1, P(B)=0.5,P(C)=0。4
P(D︱A)=0。2,P(D︱B)=0.5,P(D︱C)=0。7 2分
P(AD)P(A)P(DA)P(A)P(DA)P(B)P(DB)P(C)P(DC)P(B)P(DB)2 2分 55同理P(BD)P(A)P(DA)P(B)P(DB)P(C)P(DC)P(C)P(DC)= 5/11, 2分
P(CD)P(A)P(DA)P(B)P(DB)P(C)P(DC)p1p=28/55 2分
4、(1) n = 50 p = 32/50 =64% 2分
0.640.362分 13.58%E= n50置信区间为64%13.58%即50.42%,77.58%2分 22p1p2(2)n2220.80.2E20.082100
应抽取100户进行调查.
5分 1分
5、(1)A=SSR / 1=1422708.6 1分
B=SSE / (n—2)=220158.07/10=22015.807 1分 C=MSR / MSE=1422708.6/22015.807=64.6221 1分 (2)R2SSR1422708.6086.60% 2分 SST1642866.67表明销售量的变差中有88。60%是由于广告费用的变动引起的. 1分
(3)RR20.86600.93 3分
ˆ363.68911.420211x 2分 y(4)估计的回归方程:
ˆ1.420211表示广告费用每增加一个单位,销售量平均增加1。420211回归系数1个单位。 1分
(4)在第(1)中已经计算出F=64.6221大于4。96,所以这回归方程是显著的。
因篇幅问题不能全部显示,请点此查看更多更全内容