您的当前位置:首页正文

葡萄酒的评价

2023-03-03 来源:星星旅游


葡萄酒的评价

目录

葡萄酒的评价 ................................................................................................. 1 摘 要 ............................................................................................................. 2 一、问题重述 ................................................................................................. 2 二、模型假设 ................................................................................................. 2 三、符号说明 ................................................................................................. 3 四、模型建立与求解 ..................................................................................... 3 五、模型评价 ............................................................................................... 20 六、模型推广 ............................................................................................... 20 七、参考文献 ............................................................................................... 21

1

摘 要

本文主要针对葡萄和葡萄酒的相关指标及其数据,研究葡萄和葡萄酒之间的联系及葡萄酒的质量的评价方法

关键词:葡萄酒 酿酒葡萄 主成分分析 多元回归 相关分析

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在品尝后对其分类指标打分,其总酚可以确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反映葡萄和葡萄酒的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

要求解决以下4个问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组可信度更高? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

二、模型假设

1、各附件中所得到的数据准确可靠,一段时间内数据不会因温度,湿度,光度等外因变化

2

2、对于一级指标和二级指标,我们普遍采用一级指标的数据

3、各个评酒员之间对葡萄酒样本的评价相互独立,并且每个评酒员都仔细品尝,认真负责地给葡萄酒样本的各个分类指标评分

三、符号说明

第m组的第j个评酒员对第i个红葡萄酒样本的各个分类指标的评分(m=1,2 , i=1…27,j=1…10) 第m组的第j个评酒员对第k个白葡萄酒样本的各个分类指标的评分(m=1,2 , k=1…28,j=1…10) 第m组的第i个红葡萄酒样本的平均分数 第m组的第k个白葡萄酒样本的平均分数 Amij B mkjABmij mkj

四、模型建立与求解

4.1问题一

问题的提出:分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

通过excel我们分别算出了一组中的每个评酒员对某个红葡萄酒样本和白葡萄酒样本的各分类指标的和Amij,Bmkj,分别利用公式Aj1j11010Amij/10,

mijj110BmkjB/10求其平均,如下为求得的数据:

mkjj110红葡萄酒评分均值

1 2 3 4 5 6 7 8 9 10 11 第一组 62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 3

第二组 68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6

12 13 14 15 16 17 18 19 20 21 22 第一组 53.9 74.6 73 58.7 74.9 79.3 59.9 78.6 78.6 77.1 77.2 第二组 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6

第一组 第二组 23 85.6 77.1 24 78 71.5 25 69.2 68.2 26 73.8 72 27 73 71.5

白葡萄酒评分均值

1 2 3 4 5 6 7 8 9 10 11 第一组 82 74.2 85.3 79.4 71 68.4 77.5 71.4 72.9 74.3 72.3 第二组 77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4

12 13 14 15 16 17 18 19 20 21 22 第一组 63.3 65.9 72 72.4 74 78.8 73.1 72.2 77.8 76.4 71 第二组 72.4 73.9 77.1 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4

第一组 第二组 23 75.9 77.4 24 73.3 76.1 25 77.1 79.5 26 81.3 74.3 27 64.8 77 28 81.3 79.6

4.1.1、对红葡萄酒评价结果的显著性差异分析 (以下所得数据均来自chengxu1.sas)

为了判断两组数据间是否存在显著性差异,我们需要对红葡萄酒和白葡萄酒样本中的评分均值进行双总体假设检验。

1.正态分布检验

利用MATLAB作正态概率分布图进行判断,从得到的正态概率分布图可较直观的看出每组数据基本满足正态分布,随后我们通过SAS中的univariate过程来进行正态分布的检验,通过程序结果可以看到,红葡萄酒的第一组和第二组的正态检验W值分别为0.9248,0.9803,均接近于1,且其对应的概率为0.0519,0.8680,都大于0.05,因此我们可以得出结论:在0.05的显著性水平下,不能拒绝两组数据来自正态分布的假定,也即两组数据的正态性是可以接受的。

第一组红葡萄酒

4

第二组红葡萄酒

2.方差齐次性检验

通过SAS中的anova过程给出的levene方差齐性检验结果,本题中F=4.81,其对应的P值为0.0328,小于0.05,故得出结论,方差有显著区别。

3.通过上述检验,虽然两组数据满足正态分布,但是其方差齐性得不到满足,因此需要采用SAS中npar1way(非参数法)过程进行检验。本题中,Kruskal-Wallis卡方检验的卡方统计量为5.8685,其对应的概率为0.0154,小于显著性水平0.05。因此可以得出结论,在0.05的显著性水平下,两组评酒员对红葡萄酒的评价结果有显著性差异

4.1.2、对红葡萄酒两组结果的可信度比较

5

对于两组结果的可信度,我们通过观察两组数据的波动性来衡量两组结果的可信度,该波动性我们通过两组数据的均值与方差来得以体现 (1)均值图比较:

由图中曲线可以很直观的看出第二组的曲线较稳定,初步反应出对第二组葡萄酒的评价结果更可信

(2)方差比较:

红葡萄酒中各样本的方差

1 2 3 4 5 6 7 8 9 10 11 第一组 9.64 6.31 6.77 10.39 7.87 7.73 10.18 6.63 5.74 5.51 8.41 第二组 9.05 4.03 5.54 6.43 3.7 4.6 7.92 8.07 5.07 6.01 6.17 12 13 14 15 16 17 18 19 20 21 22 第一组 8.92 6.7 6 9.25 4.25 9.38 6.87 6.88 5.1 10.77 7.11 第二组 5.01 3.91 4.81 6.43 4.48 3.03 7.09 7.43 6.25 5.96 4.93

第一组 第二组 23 5.7 4.98 24 8.65 3.27 25 8.04 6.61 26 5.59 6.45 27 7.06 4.53

6

从上图中通过比较得出,第二组葡萄酒的方差普遍比第一组的方差值要小,即第二组红葡萄酒的方差普遍较小,显示出第二组评价结果更加稳定,故得出结论:第二组红葡萄酒的评价结果更可信

4.1.3、对白葡萄酒评价结果的显著性差异分析(以下所得数据均来自chengxu2.sas) 对于对白葡萄酒的分析,与对红葡萄酒的分析类似,故适当简化给出结论。

1.正态分布检验

白葡萄酒的第一组和第二组的正态检验W值分别为0.979,0.9455,均接近于1,且其对应的概率为0.8241,0.1526,都大于0.05,可以得出结论:也即两组数据的正态性是可以接受的。

第一组白葡萄酒

第二组白葡萄酒

7

2.方差齐次性检验

F=4.82,其对应的P值为0.0325,小于0.05,故得出结论,方差有显著区别。

3.Kruskal-Wallis卡方检验的卡方统计量为4.0640,其对应的概率为0.0438,小于显著性水平0.05。可以得出结论,在0.05的显著性水平下,两组评酒员对白葡萄酒的评价结果有显著性差异

4.1.4、对白葡萄酒两组结果的可信度比较 方法与上述类似: (1)均值图比较

白葡萄酒中各样本的方差

1 2 3 4 5 6 7 8 9 10 第一组 9.6 14.18 19.11 6.69 11.24 12.76 6.26 13.55 9.63 14.58 8

第二组 5.09 7 11.94 6.49 5.13 4.77 6.49 5.58 10.31 8.39 11 12 13 14 15 16 17 18 19 20 第一组 13.31 10.76 13.07 10.69 11.47 13.34 12.01 12.51 6.81 8.02 第二组 9.37 11.83 6.84 3.98 7.35 9.07 6.2 5.5 5.1 7.07 21 22 23 24 25 26 27 28 第一组 13.14 11.78 6.61 10.54 5.82 8.54 12.02 8.97 第二组 8.02 7.32 3.41 6.21 10.82 10.14 5.96 5.04

与上述方法类似,得出结论:第二组对白葡萄酒的评价结果更可信

4.2问题二

问题的提出:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

根据酿酒葡萄的理化指标和葡萄酒的质量,我们可以分别对酿酒葡萄进行分级,但考虑两者分级可能存在的差异性,我们考虑将两者结合起来,对酿酒葡萄进行分级。

4.2.1对红葡萄进行分级:

①在对问题一的研究中,我们得到了评酒员给红葡萄酒的评分均值,以此可以对红葡萄酒进行排序,得到其排名。

9

排名 1 2 3 4 5 6 7 8 9 10 11 样本序号 9 23 20 3 17 2 19 14 21 5 26 评酒员打分 78.2 77.1 75.8 74.6 74.5 74 72.6 72.6 72.2 72.1 72

排名 12 13 14 15 16 17 18 19 20 21 22 样本序号 22 27 24 4 16 13 10 12 25 1 6 评酒员打分 71.6 71.5 71.5 71.2 69.9 68.8 68.8 68.3 68.2 68.1 66.3

排名 23 24 25 26 27 样本序号 8 15 18 7 11 评酒员打分 66 65.7 65.4 65.3 61.6

②对于酿酒葡萄的理化指标,由于数据庞大,我们先对数据进行了预处理; i. 重要指标:由附件3我们得到芳香物质的总和,作为附件2理化指标的补充,

并对葡萄的几大重要指标进行了合并,得到总酸,总糖以及PH值。(见附录excel表格)

ii. 其他指标:我们主要通过这些指标与每一位评酒员的评分均值的相关系数确

定指标的重要程度,以下是相关系数表: 氨基酸总量 VC含量 花色苷 多酚氧化酶活力 评酒员打分 0.149 -0.071 0.272 -0.23 褐变度 DPPH自由基 总酚 单宁 葡萄总黄酮 白藜芦醇 黄酮醇 评酒员打分 -0.013 0.603 0.647 0.354 0.694 -0.243 0.264 可溶性固形物 可滴定酸 固酸比 干物质含量 果穗质量

-0.053 -0.265 0.283 -0.082 0.21 评酒员打分

百粒质量 果梗比 出汁率 果皮质量 评酒员打分

0.156 0.142 0.303 0.241 从表中相关系数可看出,评酒员打分的高低与蛋白质、DPPH自由基、总酚、葡萄总黄酮、单宁、出汁率这几个指标相关性较高,这几个指标基本上从葡萄的营养,色泽,香味,口感反应出葡萄的质量好坏。

故选取蛋白质、DPPH自由基、总酚、葡萄总黄酮、单宁、出汁率这6个理化指标作为主要其他指标。

将重要指标与选取的其他指标作为最终选定的理化指标(见附录excel表),对他们进行

10

主成分分析:

主成分分析原理介绍:

(1)假设我们观测了n个对象。记第i个观测对象p个指标的观测值分别为:

xi1,xi2,...,xip,则所有n个对象p个指标的观测值可以表示成以下矩阵形式:

x11x21Xxn1x12x22xn2...x1p...x2p ...xnp启中,n为观测对象书,p为指标或变量数。

(2)对原始数据进行标准化处理,处理方法为:

'/sk,i1,2...n,k1,2,...,p xik=xxikk式中,

xkxik/ni1n2 ,k1xikxksn1i1n2

标准化处理后,变量或指标的方差为1,均值为0

(3)设观察值构成的相关系数矩阵为:

r11r12...r1prr...r21222pR rp1rp2...rpp经标准化处理后的数据的相关系数为:

1n''rijxkixkjn1k1,(i,j1,2,...,p)

(4)对应于相关系数矩阵R,求特征方程RI0的p个非负的特征值

1,2,...,p。对应于特征值i的特征向量为:

Ci(c1i,c2i,...,cpi)',i1,2,...,p

(5)求主成分。由特征向量组成的p个主成分为:

Fic1iX1c2iX2...cpiXp

11

主成分F1,F2,...FP之间相互无关,且它们的方差是递减的。若把样品各指标的观测值带入到主成分中,就得到了样品各主成分的得分。

(6)选择m(m本问题中以各主成分的方差贡献率作为权数,以前几个主成分为变量组成一个综合评价函数,具体函数形式如下:

F总1i1pF12ii1pF2...mii1pFm(理化指标的综合评分,其中1,2,...,m为

i特征值)

Y

xx(评分标准化后得分)

得到理化指标的评定分数,并将评酒员的打分标准化得到分数Y,结合两者得分定义综合得分Y总F总Y,并对酿酒葡萄的综合得分分级。

21 5 14 19 26 0.48 0.28 0.05 -0.02 -0.19 0.42 0.4 0.52 0.52 0.37 0.91 0.68 0.57 0.51 0.18 样本序号 9 23 2 3 20 17 理化指标分数 1.42 0.5 0.93 0.6 -0.25 0.02 评酒员打分 1.93 1.66 0.88 1.03 1.33 1 综合得分 3.36 2.15 1.8 1.63 1.08 1.02 样本序号 24 22 1 13 16 27 4 12 10 8 理化指标分数 -0.07 -0.15 0.55 0.26 -0.02 -0.53 -0.56 -0.11 -0.42 0 评酒员打分 0.25 0.27 -0.61 -0.43 -0.15 0.25 0.17 -0.56 -0.43 -1.13 综合得分 0.18 0.13 -0.06 -0.17 -0.17 -0.28 -0.39 -0.67 -0.85 -1.13 样本序号 25 6 15 7 18 11 理化指标分数 -0.63 -0.46 -0.46 -0.53 -0.56 -0.14 评酒员打分 -0.58 -1.06 -1.21 -1.31 -1.29 -2.24 综合得分 -1.21 -1.52 -1.67 -1.84 -1.85 -2.39

(以上表格中的理化指标数据均来自chengxu3.sas)

由表中的总评分的降序排序我们对酿酒红葡萄进行分级: 第一级(2~3):样本9,23,

12

第二级(1~2):样本2,3,20,17, 第三级(-1~1):样本21,5,14,19,26,24,22,1,13,16,27,4,12,10, 第四级(-2~-1):样本8,25,6,15,7,18,11

4.2.2对白葡萄进行分级:

对白葡萄分级的方法与红葡萄相似,故可以适当简化得出结论。 ①与红葡萄类似,通过评分均值,对白葡萄酒进行排序: 排名 1 2 3 4 5 6 7 8 9 10 11 样本序号 5 9 17 10 28 25 22 21 15 1 23 评酒员打分 81.5 80.4 80.3 79.8 79.6 79.5 79.4 79.2 78.4 77.9 77.4 排名 12 13 14 15 16 17 18 19 20 21 22 样本序号 14 27 4 18 20 19 24 2 3 6 26 评酒员打分 77.1 77 76.9 76.7 76.6 76.4 76.1 75.8 75.6 75.5 74.3 排名 23 24 25 26 27 28 样本序号 7 13 12 8 11 16 评酒员打分 74.2 73.9 72.4 72.3 71.4 67.3

②与红葡萄类似,除了主要指标以外,对于其他评价指标的选取,我们通过指标与每一位评酒员的评分均值与葡萄各项指标进行相关性检验,得到了以下相关系数:

氨基酸总量 蛋白质 VC含量 花色苷 多酚氧化酶活力 评酒员打分 0.26 -0.06 0.19 -0.28 -0.23 褐变度 DPPH自由基 总酚 单宁 葡萄总黄酮 白藜芦醇 黄酮醇 评酒员打分 0.14 0.29 -0.07 0.17 -0.23 0.04 0.03 可溶性固形物 可滴定酸 固酸比 干物质含量 果穗质量 百粒质量 果梗比 评酒员打分 0.43 0.34 -0.26 0.36 -0.46 -0.26 0.12 出汁率 果皮质量 评酒员打分 -0.13 -0.21

观察该表格可看出,评酒员的打分高低与葡萄各个指标的相关性不是特别大。所以只选择主要指标即芳香物质,总酸,总糖以及ph值作为最终的理化指标,经过总评分排序得到如下表格: 样本序号 5 22 25 9 10 17 28 14 19 21 理化指标得分 -0.08 0.46 0.31 -0.03 0.13 -0.28 -0.11 0.63 0.83 -0.19 13

评酒员打分 综合得分 1.57 0.9 0.94 1.22 1.03 1.19 0.97 0.18 -0.04 0.84 1.49 1.37 1.25 1.19 1.17 0.91 0.85 0.81 0.79 0.65 23 0.24 0.27 0.51 12 15 4 6 27 24 2 3 26 1.64 -0.26 -0.03 0.3 -0.23 -0.02 -0.01 0.04 0.43 -1.3 0.59 0.12 -0.33 0.15 -0.14 -0.23 -0.29 -0.7 0.34 0.33 0.08 -0.02 -0.08 -0.16 -0.24 -0.25 -0.27 样本序号 理化指标得分 评酒员打分 综合得分

样本序号 1 20 18 13 8 11 7 16 理化指标得分 -0.74 -0.44 -0.59 -0.47 -0.03 0.14 -0.86 -0.8 评酒员打分 0.43 0.02 0.05 -0.83 -1.33 -1.62 -0.74 -2.91 综合得分 -0.31 -0.42 -0.54 -1.3 -1.36 -1.48 -1.6 -3.71

(以上表格中的理化指标数据均来自chengxu4.sas)

由表中的总评分的降序排序我们对酿酒白葡萄进行分级: 第一级(1~2):样本5,22,25,9,10 第二级(0~1):样本17,28,14,19,21,23,12,15,4 第三级(-1~0):样本6,27,24,2,3,26,1,20,18 第四级(-4~-1):样本,13,8,11,7,16 4.3问题三

问题的提出:分析酿酒葡萄与葡萄酒的理化指标之间的联系

通过分析,我们知道该问题本质上为一个多因变量的多元回归分析,但考虑到计算的复杂性,我们对该模型进行简化,采用逐步回归法对问题进行处理。

4.3.1模型建立:多元线性回归模型 其一般表示式为:yi01xi12xi2...pxipi(i1,2,....n)

我们先对其进行选元,即从M(M≥p)个变量中选择p个对因变量比较重要的变量作为回归模型中的自变量。对此我们采用的方法是逐步回归法。

其思想为:①在待选的M个变量中选择一个对因变量影响最大的自变量,这可通过因变量与每一自变量进行回归得到的F值来判断。若最大的F值在给定的显著性水平下是显著的,则改变量呗选中,否则选元结束。②在剩下的M-1个变量中,再选择一个变量加入到模型中,这可以通过偏F检验来判断。

SSR(XjX1)/1F(1,n3),其中偏F统计量为:FMSE(X1,Xj)SSR(XjX1)SSR(X1,Xj)SSR(X1),表示模型已存在变量X1的条件下新加入变量

Xj对因变量的贡献。若最大的偏F统计量在给定的显著性水平下是显著的,则对应的

14

自变量则被加入到模型中,否则不再加入其他变量,选元结束。

③对已在模型中的每个变量进行显著性检验。若检验不显著,则去掉该变量,

再重复进行第二步和第三步,否则保留该变量,重复进行第二部和第三步,这一过程一直进行到待选的全部自变量根据给定的显著性水平没有一个再能被选入模型或排除出刚构成的回归模型为止。

模型求解: 红葡萄:

通过分析,在舍去部分无关理化指标后,以X1,X2...X28这28个变量代表酿酒葡萄的28个理化指标(即代表氨基酸,蛋白质…出汁率,果皮质量,芳香物质这28个理化指标),用Y1,Y2,...,Y7代表葡萄酒的7个理化指标(即代表花色苷,单宁,总酚,酒总黄酮,白藜芦醇,DPPH半抑制体积,芳香物质这7个理化指标)(见附录excel表),通过编写SAS程序得到Y1,Y2,...,Y7与X1,X2...X28之间的线性关系: (见chengxu5.sas—chengxu11.sas)

花色苷:Y1438.392.6562X4-6.7622X26

单宁:Y2-12.6250.0005X1-0.0602X80.0036X917.37X100.0602X18 总酚:Y31.68380.0082X4+0.2528X11 酒总黄酮:Y40.95130.3976X11

白藜芦醇:Y538.0010.0708X20.0314X40.3131X50.7697X6 0.3424X130.1497X14 DPPH半抑制体积:Y60.0240.0168X11

芳香物质:Y7=0.881+5.6689X121.3464X151.6079X18

葡萄酒的指标(Yi) 花色苷 单宁 总酚 酒总黄酮 白藜芦醇 DPPH半抑制体积 芳香物质 相关性较强的葡萄的指标(Xi) 花色苷,出汁率 氨基酸,多酚氧化酶活力,褐变度,DPPH自由基1/IC50,可溶性固形物 花色苷,总酚 总酚 蛋白质,花色苷,酒石酸,苹果酸,葡萄总黄酮,白藜芦醇 总酚 单宁,黄酮醇,可溶性固形物

白葡萄:

与上述类似,以X1,X2...X27这27个变量代表酿酒葡萄的27个理化指标(即代表氨基酸,蛋白质…出汁率,果皮质量这27个理化指标),用Y1,Y2,...,Y6代表葡萄酒的6个理化指标(即代表单宁,总酚,酒总黄酮,白藜芦醇,DPPH半抑制体积,芳香物质这6个理化指标)

15

Y1,Y2,...,Y6与X1,X2...X27之间的线性关系:(见chengxu12.sas—chengxu17.sas)

单宁Y10.01130.2416X124.7049X27

总酚Y22.50390.1731X130.016X18

酒总黄酮Y32.9280.0004X10.0071X20.3594X112.9394X190.0615X21 白藜芦醇Y40.3664

DPPH半抑制体积Y50.10470.0484X30.008X130.0006X16 芳香物质Y6=-213.33+65.496X5746.98X10

葡萄酒的指标(Yi) 单宁 总酚 酒总黄酮 白藜芦醇 DPPH半抑制体积 芳香物质 4.4问题四 相关性较强的葡萄的指标(Xi) 单宁,果皮质量 葡萄总黄酮,可溶性固形物 氨基酸,蛋白质,总酚,PH值,固酸比 无 VC含量,葡萄总黄酮,总糖 酒石酸,DPPH自由基 问题的提出:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 红葡萄:

与问题二类似,利用主成分分析法,将红葡萄酒的理化指标得分计算出,结合问题二中已经算出的红葡萄理化指标得分以及葡萄酒质量(即评酒员评分),将三者的得分数据绘制出如下的表格及其折线图:

样本序号 1 2 3 4 5 6 7 8 9 红葡萄理化指标得分 0.55 0.93 0.60 -0.56 0.28 -0.46 -0.53 0.00 1.42 红葡萄酒理化指标得分 1.28 1.02 0.58 -0.19 0.07 0.11 -0.64 0.81 0.79 葡萄酒质量 -0.61 0.88 1.03 0.17 0.40 -1.06 -1.31 -1.13 1.93 样本序号 10 11 12 13 14 15 16 17 18 红葡萄理化指标得分 -0.42 -0.14 -0.11 0.26 0.05 -0.46 -0.02 0.02 -0.56 红葡萄酒理化指标得分 -0.60 -1.14 -0.30 -0.28 -0.78 -0.52 -0.55 0.29 -0.75 葡萄酒质量 -0.43 -2.24 -0.56 -0.43 0.52 -1.21 -0.15 1.00 -1.29 样本序号 19 20 21 22 23 24 25 26 27 红葡萄理化指标得分 -0.02 -0.25 0.48 -0.15 0.50 -0.07 -0.63 -0.19 -0.53 红葡萄酒理化指标得分 -0.04 -0.69 0.53 0.50 1.45 0.12 -0.50 -0.67 0.11 16

葡萄酒质量 0.52 1.33 0.42 0.27 1.66 0.25 -0.58 0.37 0.25

观察该折线图,可以非常直观地看出红葡萄和红葡萄酒的理化指标得分与评酒员打分的折线变化规律大体相似,随后对其做相关性分析,得到相关系数表: 红葡萄理化指标红葡萄酒理化指标葡萄酒质量(评酒员打 得分 得分 分) 红葡萄理化指标得分 1 红葡萄酒理化指标得0.6709 1 分 葡萄酒质量(评酒员打0.5840 0.4825 1 分) 17

由三条曲线良好的一致性,相关系数较大,且显著性检验的值均明显小于0.05,说明在0.05的显著性水平下,可以接受两者的是相关的,因此能用红葡萄和红葡萄酒的理化指标来评价红葡萄酒的质量。

并通过主成分分析过程中的数据寻找出了几个对葡萄质量影响较大的红葡萄与红葡萄酒的理化指标,具体sas运行结果如图:

从图中可以看到第十主成分的贡献率最小,为0.0053,接近于0,且从图中可看到,其最大的权数为-0.800388,所对应的变量为x7,即x7对主成分的影响最小,故删除了x7这个指标,同理,第六至第九主成分的特征值也相对很小,故我们删掉其最大权数对应的指标后,剩下的指标作为主要指标x1,x2,x3,x5,x9,即酸类,糖类,蛋白质,葡萄总黄酮,芳香物质为影响红葡萄酒质量的主要红葡萄理化指标。

同理可得,红葡萄酒理化指标影响红葡萄酒的主要因素是花色苷,单宁,酒总黄酮,白藜芦醇,芳香物质。

18

白葡萄:

方法与上述类似: 样本序号 1 2 3 4 5 6 7 8 9 10 白葡萄 -0.74 -0.01 0.04 -0.03 -0.08 0.30 -0.86 -0.03 -0.03 0.13 白葡萄酒 -0.22 -0.40 0.84 -0.13 -0.40 -0.15 -0.08 -0.03 0.27 -0.06 葡萄酒质量 0.43 -0.23 -0.29 -0.12 1.57 -0.33 -0.74 -1.33 1.22 1.03 样本序号 11 12 13 14 15 16 17 18 19 20 白葡萄 0.14 1.64 -0.47 0.63 -0.26 -0.80 -0.28 -0.59 0.83 -0.44 白葡萄酒 -0.47 -0.39 -0.30 0.66 -0.30 -0.50 0.77 -0.21 -0.39 0.24 葡萄酒质量 -1.62 -1.30 -0.83 0.18 0.59 -2.91 1.19 0.05 -0.04 0.02

样本序号 21 22 23 24 25 26 27 28 白葡萄 -0.19 0.46 0.24 -0.02 0.31 0.43 -0.23 -0.11 白葡萄酒 0.01 0.14 0.01 0.65 0.14 -0.49 1.06 -0.30 葡萄酒质量 0.84 0.90 0.27 -0.14 0.94 -0.70 0.15 0.97

19

显然,三条曲线无明显规律,相关系数很小,且显著性检验的值均大于0.05,说明在0.05的显著性水平下,两者的相关性不能通过,因此可以认为两者无关,说明不能用白葡萄和白葡萄酒的理化指标来较为明确的评价白葡萄酒的质量。

总结:本小问中,酿酒红葡萄和红葡萄酒的指标对红葡萄酒质量有影响,但酿酒白葡萄和白葡萄酒的指标对白葡萄酒质量无影响,故评价葡萄酒的质量需要具体分析酿酒葡萄和葡萄酒的理化指标。

五、模型评价

优点:

1. 简化掉了与建模目的无关或关系不大的因素;并且随着问题逐渐深入,几个模型之间也是相互联系

2.本文主要使用SAS软件,模型的算法计算的速度也比较快,占用的内存空间也比较小。

缺点:

1.本文中数据量较大,我们以经验及查阅到的相关文献适当舍取了一些数据 2. 本文中对模型的一些方面进行简化,会影响到计算的精确及结果的准确性

3. 一些问题中的模型较简单理想化,忽略了很多实际中的其它很多因素,因此在实际中的运用有一定局限性。

六、模型推广

本文主要是对葡萄酒和葡萄的不同的指标和大量的数据进行处理的一个过程,⑴对于第二问中的主成分分析,可以把该方法运用到生活中的其他领域,因为生活中的一个因素往往会收到多个因素的影响,但考虑到多个因素的复杂性以及各个因素是否对我们的研究都有帮助,该方法起到了很好的简化作用,通过多个因素中的主要因素代表总体,大大简化了问题的研究难度。⑵另外对于处理多个因素对一个因素的影响,我们考虑其将多个因素结合起来对该因素的影响,让得到的结果更具有代表性

20

七、参考文献

[1]. 《应用多元统计分析》 高惠璇编著 北京大学出版社

[2].《SAS与现代经济统计分析》 岳朝龙 黄永兴编著 北京大学出版社

[3]. 《概率论与数理统计教程》 茆诗松 程依明 濮晓龙编著 高等教育出版社

21

因篇幅问题不能全部显示,请点此查看更多更全内容