基于主成分分析的肝纤维化无创诊断指标聚类探讨

(整期优先)网络出版时间:2019-02-12
/ 1

基于主成分分析的肝纤维化无创诊断指标聚类探讨

张子岩毛敏吴彦亭

(重庆交通大学经济与管理学院,重庆)

摘要:肝纤维化无创诊断鉴于其避免肝纤维化患者行肝活检、减轻慢性乙肝患者的经济负担等特征正在逐步为广大慢性乙型肝炎患者所接受。我们基于主成分分析法以及Logistic回归分析法建立肝纤维化无创诊断模型,来对肝纤维化无创诊断的相关指标聚类情况进行探讨。

关键词:肝纤维化无创诊断;主成分分析法;Logistic回归分析

一、国内肝纤维化无创诊断的发展状况

就目前状况而言,肝穿刺活检在我国临床上进行肝纤维化检查和纤维化等级分划领域中仍然占据着举足轻重的地位。有部分研究表明,肝活检一方面可能会存在抽样误差。另外一方面对患者而言,肝活检不仅有创伤性,还有存在并发症的风险。因此,对简单、精确和重复性比较好的肝纤维化无创诊断方法的研究非常具有现实意义。

二、建立基于主成分分析的指标聚类模型

2.1模型背景介绍

我们通过主成分分析法可以对多个指标进行遴选,将30项指标转化成少数几个不相关的综合指标。故而,为了准确定位以上指标并对他们对病人带来的支配性影响作出定量分析,我们采用主成分分析法[1]来对指标进行遴选归类,以期找出他们的内在联系。

2.2分级综合评价指标体系的构建

第一步,计算指标矩阵的特征值与特征向量;

第二步,确定p个主成分,进行统计分析。我们通过SPSS统计软件实现此主成分分析模型,并得到相应主成分的特征值和累计贡献率

第三步,经过KMO和Bartlett的检验得到如下表所示的检验结果,检验报告表明此主成分矩阵KMO系数为0.73>0.5,即通过检验。故而我们分析得到的数据信度和效度符合数学标准。

根据正交矩阵分析可得,PTS、IV型胶原等多项指标会对剩余指标起到潜在影响的作用,并且分别在不同角度影响着病人的病况。另外,B超、WBC等指标可能在同一方面对病人的病况产生重要的作用。

三、建立基于Logistic回归分析法的肝纤维化无创诊断模型

通过将项原始的独立测量样本数据进行增添归类,得到294×9的回归模型样本数据(其中219组实验组,75组对照组),来进行对照实验。

3.1背景介绍

在实际生活中当因变量是类别变量(离散变量)且不具备一定的分布规律时,以致无法进行合理的假设检验,因而在医学病理定量研究分析中受到了存在诸多局限。鉴于本文的样本数据已经通过了样本数据的显著性检验,所以选择Logistic逐步回归模型对肝纤维化无创诊断加以应用和求解。

3.2模型求解及结果

第一步:提取自变量和因变量。在此,我们以肝纤维化无创诊断模型为因变量,以问题一双模型筛选的九项指标为自变量。设置变量为模型求解做准备。

3.3模型诊断效果评价

经过统计,回归分析的预测准确率高达78.11%,模型拟合程度较好,所以我们认为指标体系内的PTS、IV型胶原、III型前胶原、体重、身高、AST、透明质酸、年龄和ALT这9作为肝纤维化无创诊断的具有说服力的病理诊断依据。

参考文献

[1]姜启源谢金星叶俊,数学模型(第三版)北京,高等教育出版社,2006.9.12;

[2]姜广辉,张凤荣,陈军伟,等.基于Logistic回归模型的北京山区农村居民点变化的驱动力分析[J].农业工程学报,2007,23(5):81-87.