基因表达数据可以用于分析表达变化的基因、基因之间的相关性以及不同环境对基因活动的影响。然而,标记大量的基因表达数据既费力又耗时。标记数据不足对构建深度学习模型提出了挑战。我们提出了一种新的半监督图神经网络模型(SFWN: Semi-Supervised Feature Weighted Neural Network)。首次利用基因表达数据的外部知识构建了特征图、相似性核和样本图,同时提出了一种新的半监督学习算法(SGA)来提取数据关系,更好地获得全局样本结构,还提出了一种图稀疏模块(SGCN)来处理基因表达数据分类的稀疏表示。为了克服过平滑问题,提出了一种新的基于双空间特征计算方法来分析和计算该模型中的特征表示。所提出的SFWN模型具有较强的基因表达特征学习和表征能力,可能为相关疾病的诊断和临床实践提供新的见解和工具。
研究成果以“SFWN: A Novel Semi-Supervised Feature Weighted Neural Network for Gene Data Feature Learning and Mining with Graph Modeling”为题发表在著名的生物医学和健康信息学国际期刊《IEEE Journal of Biomedical and Health Informatics》(IF=7.7,中科院一区Top)上,福建师范大学光电与信息工程学院为第一单位,研究生王庆为第一作者,陈冠楠教授为通讯作者,该工作得到了福建省卫生教育联合攻关计划和中央引导地方科技发展专项资金等项目的资助。