基于稀疏极大边界特征的癌症基因表达数据分析

(整期优先)网络出版时间:2012-04-14
/ 1
基因表达数据的高维数、高噪声的特点,使得对其做判别分析之前进行数据降维是必要的。特征提取和变量选择作为降维方法各有利弊。本文针对基因表达数据分析的特点,提出了一种在特征提取过程中嵌入变量选择的方法,并将该方法应用于前列腺癌基因表达数据库中。结果显示,该方法所提取的特征不仅具有良好的判别能力,而且能够在特征提取过程中实现变量选择,从而增加了模型中单个基因对判别癌症的解释意义。