3
对原始数据进行方差分析出现的问题相应选取合适的数据处理方法,处理后根据检
验的效果进行分析,并对数据处理方法进行优劣比较。
2.2 问题二的分析
该问题要求根据酿酒葡萄的理化指标和葡萄酒的质量对题目附件中的酿酒葡萄
进行分级。
首先,考虑到酿酒葡萄理化指标的数量和种类较为繁杂,可借鉴现有的葡萄品
质评价体系,确定影响葡萄品质的大方向类别,再结合题目数据中提供的理化指标,
筛选一定数目的理化指标构建葡萄品质等级划分体系。
然后,针对指标体系中的每一种方向类别,可使用聚类方法基于指标间数值的
相似性将其初步划分成若干类别,则对于类别中的理化指标,可引入优势因子以等
级方式刻画其数之间的差异性,建立相应的优势因子矩阵,再通过计算聚类所得的
类别内所有指标的优势因子总和并进行比较,确定类别间的优势值的高低,进而确
定聚类所得的类别对应的等级,通过对各方向类别应用优势矩阵,可分别得到类别
中各等级的优势值,最后通过加权求和或均值等数值处理,将基于优势值的各方向
类别的等级划分综合得到总的等级划分。
此外,结合实际情况进行考虑,酿酒葡萄是为酿造葡萄酒而规模性种植的品种,
因此酿酒葡萄的品质等级划分应与其酿造的葡萄酒质量构建关系,可借助问题一的
求解结果,以较可信合理评酒员组评价结果作为葡萄酒质量的量化值进行等级划分,
基于其等级赋予相应的优势因子,最后通过权衡酿酒成品的质量和方向类别的理化
指标的重要性程度,将两者综合得到总的葡萄品质优势值,并以此为基准进行等级
划分,求算出红种类葡萄和白种类葡萄样本的所属等级。
2.3 问题三的分析
该问题要求分析酿酒葡萄与葡萄酒的理化指标之间的联系。
葡萄酒是酿酒葡萄通过多重酿酒工艺制得的,中间必然发生多种交叉复合的化
学反应。分析酿酒葡萄与葡萄酒的理化指标之间的联系,可以理解为通过对理化指
标的数据进行相关分析,得到指标和指标之间的关联性,进而分析酿酒过程中指标
代表的物质之间相互可能产生的促进性或阻抗性影响。
此外,考虑到化学反应的复杂性,指标之间的相互影响更可能属于多因素影响
单一因素,或者多因素综合影响另一组多因素。考虑到酿酒葡萄和葡萄酒之间,只
能存在酿酒葡萄理化指标对葡萄酒理化指标作单方面的影响,则问题可转化为探究
酿酒葡萄的理化指标对葡萄酒理化指标的多种影响可能性,其中一种可能性对应着
一种因素组合的关联。针对多因素之间的关联性分析则需要通过回归方法,寻求多
因素之间贴近数值关联的函数关系,依次进一步分析多因素在对单一因素或多因素
产生影响时,各影响因素的影响力贡献程度。对于寻求多个解释变量与被解释变量
的关系时,可以借助逐步回归分析法进行计算。其核心思想是通过不断地增减解释
变量并反复检验显著性以得到与被解释变量关联最为显著的因素组合。通过使用逐
步回归,以酿酒葡萄理化指标为解释变量分别求解对应各项葡萄酒理化指标为被解
释变量的回归方程,得到相应的数量关系并以此作分析。