随着社会经济发展,糖尿病患病率不断增加,威胁大众健康。糖尿病对人体造成损害主要是由糖尿病并发症引起的,其中糖尿病肾病(Diabetic Kidney Disease,DKD)是最常见的糖尿病并发症之一,实现DKD早期诊断对改善糖尿病患者生存质量,提高患者生存率有着重要意义。本文研究基于机器学习方法构建一种DKD预测诊断模型,以对2型糖尿病(Type 2 Diabetes Mellitus,T2DM)患者当前是否合并DKD进行评估。本文回顾性收集徐州医科大学附属医院相关患者信息,建立T2DM-DKD临床数据集作为研究资料,包括55个特征和一个分类标签,共收录1351lung infection条样本数据。在数据预处理方面,本文使用四分位点内距箱型图法处理异常值,针对数据集存在随机缺失的情况,构建了一种计算特征权重的K近邻(K-Nearest Neighbor,KNN)缺失值填充模型,对比均值填充法和KNN填充法,验证发现该模型补全效果更好。筛选高相关性特征及识别DKD危险因素。本文使用特征选择方法数据降维,经对比实验,使用递归特征剔除法从原数据集55个特征中提取18个高相关性特征建立数据子集,作为算法模型的训练数据。对提取的特征进行DKD影响因素分析,通过特征间相关分析以及单因素/多因素Logistic回归分析,发现其中收缩压、尿微量白蛋白等特征为DKD发生独立危险因素。基于Stacking集成学习算法构建DKD预测模型。本文分析改进了Stacking集成学习基本框架,使用机器学习分类方法构建了多种DKDselleckchem CCRG 81045预测模型,从中选择Liblinear LR、RBF-SVM、SCH772984半抑制浓度Ada Boost和Random Forest作为Stacking个体学习器,使用SVD-LDA作为次级学习器。对比单一模型,Stacking模型准确率提升5%,F1分数提升4%,AUC值提升7%。使用NPHDC公共数据集中200条DKD相关数据进行外部验证,对比Ada Boost和Random Forest集成学习模型,Stacking模型预测准确率提高3%,F1分数提高5%。经验证,在本文构建的DKD预测诊断模型中,Stacking模型综合表现最优。本文构建的Stacking模型能够对T2DM患者罹患DKD情况做出准确判断,经外部验证展现出较好泛化能力,可以协助医生进行相关诊断,为专家询诊提供一些参考。