您的当前位置:首页正文

概率论与数理统计课程设计

2024-03-30 来源:星星旅游


成 绩 评 定 表

学生姓名 专 业 统计学 班级学号 课程设计题目 营业税税收总额与社会商品零售总额的一元线性回归分析 评 语 组长签字: 成绩 日期 20 13年 7 月 8 日

课程设计任务书

学 院 学生姓名 理学院 专 业 班级学号 统计学 课程设计题目 营业税税收总额与社会商品零售总额的一元线性回归分析 实践教学要求与任务: 通过该课程设计,使学生进一步理解概率论与数理统计的基本概念、理论和方法;初步掌握Excel统计工作表在随机模拟中是应用,MATLAB统计软件包作常见的统计检验和统计分析;具备初步的运用计算机完成数据处理的技能,使课堂中学习到理论得到应用。 1.数据整理:收集数据,录入数据,画出相应图形(如分布图、直方图、盒状图等)。 2.一元、多元线性回归模型:回归系数的估计与检验,数据散点与回归直线的图示,残差图。运用MATLAB统计软件,对给定的数据拟合回归方程。 3.区间估计与假设检验: MATLAB绘制出直方图,做数据分布的推测;参数估计,假设检验,绘制概率密度图,能对结果进行简单分析。 4.常用分布的5种功能:概率密度函数、分布函数、分位数、随机数的生成、均值和方差的应用。 工作计划与进度安排: 周一1~4节:选题,设计解决问题方法 周一5~8节:调试程序 周三1~4节:完成论文,答辩 指导教师: 专业负责人: 学院教学副院长: 201 年 月 日 2013年6月14日 201 年 月 日

摘 要

数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位。对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题。本文利用概率论与数理统计基本原理对小样本常用分布参数置信区间和假设检验问题 ,进行了深入研究,提出了小样本常用分布参数的置信区间与假设检验的解决方法。

本文利用概率纶与数理统计中的所学的回归分析知识,以营业税税收总额与社会商品零售总额的关系建立数学模型,利用这些数据做出社会商品零售总额

x关于营业税税收总额y的线性回归方程,并MATLAB对验数据进行分析处理,

得出线性回归系数与拟合系数等数据,并用F检验法检验了方法的可行性,同时用分布参数置信区间和假设检验问题 ,得出了社会商品零售总额x关于营业税税收总额y的显著性水平,并进行了深入研究,提出了小样本常用分布参数的置信区间与假设检验的解决方法。

关键词:统计量法;置信区间;假设检验;线性关系;回归分析

目 录

1、 设计目的 ...................................................... 1 2、 设计问题 ...................................................... 1 3、 设计原理 ...................................................... 2 4、 设计程序 ...................................................... 2 5、 用MATLAB生成随机数 ........................................... 9 6、 设计总结 ..................................................... 11 致谢............................................................... 12 参考文献........................................................... 13

1、 设计目的

为了更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合MATLAB对数据的处理解决实际问题。本设计是利用一元线性回归理论对营业税税收总额与社会商品零售总额的关系问题建立数学模型,并用MATLAB分析工具库中的回归分析软件进行解算。

2、 设计问题

我们知道营业税税收总额y与社会商品零售总额x有关。为能从社会商品零售总额去预测税收总额,需要了解两者之间的关系。先收集了如下20组数据(单位:亿元):

序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 社会商品零售额 142.08 157.10 177.30 192.25 204.68 220.20 242.68 258.12 316.24 331.50 341.99 332.69 350.01 356.22 营业税税收总额 3.93 4.94 5.96 6.98 7.85 8.90 9.82 10.94 12.50 13.70 15.55 15.79 15.62 16.10 1

15 16 17 18 19 20 (1) 画出散点图;

(2) 建立一元线性回归方程;

389.29 400.00 427.18 453.40 460.78 485.51 16.39 17.01 17.86 18.45 18.60 20.50 (3) 对回归方程作显著性检验,列出方差分析表;

(4) 若已知某年社会商品零售额为300,试给出营业税税收总额的概率为0.95

的预测区间。

3、 设计原理

回归分析一般分为线性回归分析与非线性回归分析。本题采用的是线性回归分析中的一元线性回归。

本题是一道确定营业税税收总额与社会商品零售总额的关系的问题,首先用MATLAB绘出散点图,经过一系列的剔除坏点,得到相对准确的数据,再由图分析该数据属于线性回归问题,然后对其进行一元线性回归分析,在MATLAB软件中得出回归方程系数,置信区间与相关性检验的数据,并画出残差图。

4、 设计程序

(1)输入数据,并输入作散点图命令:

>>y=[3.93,4.94,5.96,6.98,7.85,8.90,9.82,10.94,12.50,13.70,15.55,15.79,15.62,16.10,16.39,17.01,17.86,18.45,18.60,20.50];

>>x=[142.08,157.10,177.30,192.25,204.68,220.20,242.68,258.12,316.24,331.50,341.99,332.69,350.01,356.22,389.29,400.00,427.18,453.40,460.78,

2

485.51];

>> plot(x,y,'*') >>

2520151050100150200250300350400450500 图4.1 散点图

生成图4.1,可以看出x和y大体成线性关系。

(2)建立一元线性回归方程; 做一元回归分析,输入: >> n=length(y); >> X=[ones(n,1),x'];

>> [b,bint,r,rint,s]=regress(y',X); >> b,bint,s b =

-1.7439 0.0468 bint =

3

-3.0250 -0.4628 0.0429 0.0507 s =

0.9726 638.4226 0.0000 0.7471

表4.1 回归分析图

回归系数 回归系数估计值 -1.7439 0.0468 回归系数置信区间 [-3.0250,-0.4628] [0.0429,0.0507] 0 1 R21 f 638.4226 0.0001 则一元回归方程为:

y1.74390.0468x

残差及其置信区间作图代码输入: rcoplot(r,rint)

4

Residual Case Order Plot321Residuals0-1-224681012Case Number14161820 图4.2 残差图

从图中发现第28个为异常点,剔除它重新计算并画图。 再输入: >>

y=[3.93,4.94,5.96,6.98,7.85,8.90,9.82,10.94,12.50,13.70,15.55,15.62,16.10,16.39,17.01,17.86,18.45,18.60,20.50]; >>

x=[142.08,157.10,177.30,192.25,204.68,220.20,242.68,258.12,316.24,331.50,341.99,350.01,356.22,389.29,400.00,427.18,453.40,460.78,485.51];

>> n=length(y); >> X=[ones(n,1),x'];

>> [b,bint,r,rint,s]=regress(y',X); >> b,bint,s,rcoplot(r,rint) 输出结果为:

5

b =

-1.7855 0.0466 bint =

-2.8951 -0.6760 0.0433 0.0500 s =

0.9804 850.1067 0.0000 0.555

Residual Case Order Plot2.521.51Residuals0.50-0.5-1-1.5-2-2.524681012Case Number141618 图4.3 残差图

6

此时由图可知已无异常点,所以用这27组数据进行估计结果会比较准确。 从上面运行的结果可制成下表:

表4.2 回归分析表

回归系数 回归系数估计值 -1.7855 0.0466 回归系数置信区间 [-2.8591,-0.6760] [0.0433,0.0500] 0 1 R21 f 850.1067 0.0001

由剔除异常点后数据得到的一元回归方程为:y(3)显著性检验: 输入:

>>

y=[3.93,4.94,5.96,6.98,7.85,8.90,9.82,10.94,12.50,13.70,15.55,15.62,16.10,16.39,17.01,17.86,18.45,18.60,20.50];

>>

x=[142.08,157.10,177.30,192.25,204.68,220.20,242.68,258.12,316.24,331.50,341.99,350.01,356.22,389.29,400.00,427.18,453.40,460.78,485.51];

>> finv(0.95,1,17) ans =

4.4513

在=0.05的水平下F的值,F0.05<850.1067

>> finv(0.99,1,17)

1.78550.0466x

7

ans =

8.3997

在0.01的水平下F的值,F0.01850.1067

表4.3 方差分析表

方差来源 回归 剩余 平方和 自由度 F值 临界值 显著性 SRSe 1 17SR/m FSe/(nm1)=850.1067 F0.054.4513 F0.018.3997特别显著 总计 ST 18 有题可知m=1,n=19,F值为850.1067,F0.01(m,nm1)8.3997=8.3997,所以F>F0.01(m,nm1),认为y与x之间的线性相关关系特别显著。

且由MATLAB可得R2=0.9804接近于1,所以显著性明显。 (5) 预测区间

ˆ0.0466带入回归方程,对社会ˆ1.7855,将上面的回归系数估计值10商品零售额为300时的概率为0.95的营业税税收总额进行预测。得到

ˆ012.1945。 y作出散点图及拟合曲线,并对x300时的y进行预测 输入: >>

y=[3.93,4.94,5.96,6.98,7.85,8.90,9.82,10.94,12.50,13.70,15.55,15.62,16.10,16.39,17.01,17.86,18.45,18.60,20.50]; >>

x=[142.08,157.10,177.30,192.25,204.68,220.20,242.68,258.12,316.24,331.50,341.99,350.01,356.22,389.29,400.00,427.18,453.40,460.78,485.51]; >> polytool(x,y,1,0.05)

8

结果如图:

2520151050150200250300350400450 图4.4 散点及拟合曲线图

5、 用MATLAB生成随机数

(1) 生成参数依次为1/2,1/2^2到1/2^6的几何随机数 输入:>> R=geornd(1./2.^(1:6)) R =

0 5 3 11 3 17 (2)生成自由度为2的t分布随机数 输入:>> R=trnd(2)

9

R =

-2.9263

(3)生成5个参数为(2,6)的正态随机数 输入:>> R=normrnd(2,6,1,5) R =

-6.6458 5.4269 -0.3993 6.1400 6.8937 (4)生成参数为(10,0.3)的二项随机数 >> R=binornd(10,0.3) R = 2 10

6、 设计总结

通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识以及MATLAB的使用,而且使我对这些知识在实际中的应用产生了比较浓厚的兴趣。由于使用了MATLAB软件,让我更加熟练的操作该软件在进行一些数据上的处理,对以后的学习和工作有很大的帮助。总之,这次课程设计我收获很多。

11

致谢

本论文是张玉春老师指导下完成的。她严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。在此,我向张老师致以诚挚的谢意和崇高的敬意。

同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。我还要感谢我的论文中被我引用或参考的文献的作者。

12

参考文献

[1] 沈恒范.概率论与数理统计教程[M].第四版.高等教育出版社,2003.4 [2] 梁冯珍,宋占杰,张玉环.应用概率统计[M].天津:天津大学出版社,2004.5 [3] 张瑞丰.精通MATLAB 6.5[M].北京:中国水利水电出版社,2004.2 [4] 章栋恩,马玉兰,徐美萍,李双.MATLAB 高等数学实验[M].北京:电子工业出版社,2008.11

[5]王兵团,桂文豪.数学实验基础[M].北京:北方交通大学出版社,2003.11

13

因篇幅问题不能全部显示,请点此查看更多更全内容