基因表达数据的高维数、高噪声的特点,使得对其做判别分析之前进行数据降维是必要的。特征提取和变量选择作为降维方法各有利弊。本文针对基因表达数据分析的特点,提出了一种在特征提取过程中嵌入变量选择的方法,并将该方法应用于前列腺癌基因表达数据库中。结果显示,该方法所提取的特征不仅具有良好的判别能力,而且能够在特征提取过程中实现变量选择,从而增加了模型中单个基因对判别癌症的解释意义。
郑州师范教育
2012年4期