多元统计方法应用分析

(整期优先)网络出版时间:2021-06-08
/ 2

多元统计方法应用分析

崔永诗

哈尔滨商业大学统计学 黑龙江省哈尔滨市 150028

摘要:随着经济研究的飞速发展,传统的一对一的数理统计理论已不再适用,多元统计方法的作用日益凸显,不仅可弥补传统梳理统计的信息缺失,还可以对数据进行验证。本文介绍了多元统计方法的基础理论,并且结合实际的案例,分析了多元理论的实际案例。从中国人口增长,经济投资行为以及企业生产管理为切入点,介绍了不同的多元分析方法。

关键词:多元分析发方法,人口增长,经济投资,企业生产管理

1.多元统计分析理论基础

近年来随着我国经济的全面发展,多元统计分析逐渐成为数理统计研究的热门分支,它是一种综合的统计方法,由多个变量之间相互作用,统计其中的关联和规律,能够客观真实的反应数据的真实情况。多元分析方法有很多细小的分支其中最主要的方法包括多元回归分析,聚类分析,主成分分析和因子分析等。实际的应用有经济学中的计量经济学本质就是多元回归分析,通过建立预测模型,进而分析变量之间的相互作用和数量关系,利用模型来预测和探究未知变量。主成分分析是从多个变量中选取几个对问题有实质性影响的变量,研究它们的相互作用。

2.多元统计分析在经济投资方面的应用

多言统计分析在经济学领域有着十分重要的应用,下面通过聚类分析与主成分分析的具体实例为切入点,介绍多元分析从建模到数据整合再到最后的策略制定的具体应用实例。

首先要明确需要统计的财务指标,通常影响股价和投资的主要财务指标有公司的盈利能力、营运能力、偿债能力。盈利能力试制企业的净资产收益率,即净利润与净资产的比值。而营运能力是指存货的周转速度,即销售额与存货额的比值,偿债能力是指流动资产包括现金加证券与流动负责的比值。选取2018年12家上市公司的财务数据指标,建立数学模型。通过表1可以看出不同的统计数据量纲是不同的,不能看出其中的关联性,要想对数据进行处理,将其量纲标准化。并提取主成分。统计结果如表1所示:



表1 标准化后的各公司财务数据

60bec214bb3b8_html_5e7dc7744ad64de3.png

通过标准化数据和进行方差处理得出数据如表2:

3.多元统计分析在企业管理中的应用

生产能管理是企业发展的核心要素之一,随着企业的发展和壮大,生产管理的作用日益凸显,而影响生产管理的因素绝不是单一因素,而是多个变量的共同作用,这里多元统计分析就能发挥很好的作用。这里用到的多元统计方法有多元正太分布,这种统计方法与矩阵正态分布有很大关联,首先要识别出数据的正太分布特征,然后利用概率密度函数统计描述数据特征。另一种方法是队员方差分析,与上文投资方案中的类似,是利用将数据统一量纲,用方差进行反映。第三种方法是直线回归分析,这是在数学统计中常用的一种方法,将两个服从正太分布的数据进行直线回归拟合,找到二者的从属关系。将多元统计分析利用到企业的生产管理中可以大大的提升数据统计的效率,降低数据统计的维度,确保数据的可靠性和真实性,提高决策者的工作效率。

多元分析统计在企业管理中的应用可以分为三个主要部分:物料分析,设备故障,质量促进。随着经济的不断发展,企业的竞争压力显著加大,如何能够降本增效是企业持续关注的问题,多元方差分析可以为企业的物料消耗提供数据支撑。首先要做的就是确定均值,采用多元方差确定随机变量,根据企业的生产数据,计算均值和方差,通过方差与数学期望的偏离度来调整和改进企业的生产和采购计划。例如汽车主机厂,每个月螺丝消耗是12.5万颗,而数学期望是12.3万颗,则可以节约16%的成本,只要做到备货充足,每个月按照12.3万进行采购即可。在设备故障上的分析则可以提高企业的工作效率,减少因设备而停产的时间,此时直线回归分析更具有明显的优势,首先要统计设备运行正常,元件磨损和故障三种功况的时间和频次,统计数据的相关性,根据数据反映的规律制定合理的检修时间。还是以汽车厂为例,如果设备每年出现2次检修,故障率为30%,故障时间为3天;3次检修,故障率为10%,故障时间为1天;4次检修,故障率为8%,故障时间为0.5天,则可以通过线性回归分析得出,检修2次的特征值为0.65,检修三次为0.92,检修4次为0.85,通过比较得知每年检修3次是最合理的频次可以做到经济性和合理性兼顾,停产时间不长,对企业的经营不会造成很大影响。对于质量分析,则采用正太多元分析法,以卷烟厂为例,影响香烟质量的因素有香烟的长度,重量,直径和吸阻。在进行质量分析时可将各种数据纳入到多元正态统计的分析中,对不同的组进行编号,确定组的平均值,建立相关矩阵,确定规格参数的关联,通过数据关联性找出主要影响因素,设置合理上限,超差则视为质量不合格。

4.利用多元统计分析疫情数据

多元线性回归方法还被广泛应用到医疗统计中,例如2020年的疫情统计,通过搜集湖北省2020年1月20日至5月31以来的疫情数据,通过的数据包括每日新增确诊,每日新增治愈,每日新增死亡,每日累计确诊,每日累计治愈和每日累计死亡6项数据,连成如下的曲线

60bec214bb3b8_html_2ee3181ba3d9070d.png

图1 湖北省的疫情发展数据图

数据解读如下:每日新增确诊是指湖北省卫健委每日公布的当日新增确诊人数,每日治愈是指卫健委公布的当日治愈人数,每日新增死亡是指卫健委公布的当日新增的死亡人数,累计确诊是指1月20以来共计的确诊人数,累计治愈是指1月20日以来共计的治愈人数,累计死亡是指卫健委公布的1月20以来的共计死亡人数。

接下来通过数据建立多元线性回归模型,将自变量定为新增确诊,新增治愈,新增死亡,累计治愈和累计死亡,因变量为累计确诊数量。使用软件建立线性回归关系,从而抽象出数据的现象关系。

通过计算拟合度,经过迭代计算,因变量与五个自变量存在一定的现象关系。R(拟合度)为0.977表示的是自变量能够反映因变量的方差的百分比,R越高则自变量就能更好的反映因变量。调整后的R方表示对拟合度的矫正,从表5中可以看出调整后的R为0.952,减少了自变量的影响。拟合度接近1则表明多元线性回归分析是有意义的

总结

本文讨论了多元统计分析的基本方法,通过多元统计在经济投资,企业管理,疫情数据统计以及失孤悲伤指数上面的统计案例,对多元统计的实际应用加以分析,其中应用了,多元线性回归分析,主成分分析、聚类分析,逻辑回归分析和随机森林等方法,突出了多元分析在日常生产生活中的重要作用。

参考文献

[1]陈希孺,倪国熙.数理统计教程[M].中国科学技术大学出版社,2019

[2]韦来生.数理统计[M].科学出版社,2018

[3]张忠占,徐兴忠.应用数理统计[M].机械工业出版社2018