目的:1.回顾性分析多中心Ig A肾病(Ig A nephropathy,Ig AN)患者的临床资料,按照病理牛津分型(MEST-C)分别进行分组,并根据估计肾小球滤过率(estimated glomerular filtration rate,e GFR)进行分层,以分析患者的临床特征及病理进展危险因素。2.采用贝叶斯网络(bayesian network,BN)及其它机器学习(machine learning,ML)模型构建Ig AN无创诊断模型,并对模型的效能进行评估,为Ig AN的诊断提供新模式。方法:1.收集2014年7月至2022年7月就诊于吉林大学第二医院、吉林省人民医院和吉林市人民医院经肾穿刺后首诊断为Ig AN患者的临床实验室资料及肾脏病理学资料。牛津分型为肾脏病理资料的评价标准。比较不同病理分组的临床特点以及病理损害进展危险因素。2.收集2018年1月至2022年8月在吉林大学第二医院接受肾穿刺活检术并首诊为原发性肾小球疾病患者的临床和病理资料,将其分为Ig AN组和非Ig AN组。使用R4.1.3软件对数据进行分析和建立模型,同时利用LASSO回归方法筛选变量。选择禁忌搜索算法建立BN结构,并根据所建立的BN结构使用最大似然法估计每个节点的概率。将BN模型与其他三种ML模型进行比较,并评估它们的效能表现。结果:1.不同牛津分型Ig AN患者的临床病理资料比较(1)不同牛津分型Ig AN患者的基本特征共纳入了456例患者参与研究,平均年龄为38.93±12.98岁,男女比例为1.2:1,女性占45.4%,平均BMI为24.35±3.8,存在前驱感染症状所占比例为9.6%。(2)牛津分型M与Ig AN患者的临床病理资料比较在M分组中,M1组舒张压、尿红细胞、白蛋白均高于M0组,双下肢水肿、总胆固醇、LDL-C、24小时尿蛋白、C3均低于M0组。多因素Logistic回归结果表明,在Ig AN患者中,白蛋白是牛津分型M进展的独立危险因素,而LDL-C和C3是独立的保护因素。(3)牛津分型E与Ig AN患者的临床病理资料比较在E分组中,E0组与E1组相比,尿红细胞、SCys-C、饮酒、双下肢水肿、尿素氮、血肌酐、白细胞数、尿α1-微球蛋白以及24小时尿蛋白均显著升高,而血红蛋白、白蛋白、e GFR、血Ig G均显著下降。多因素Logistic回归结果表明,饮酒、尿红细胞以及SCPLX-4720细胞培养ys-C是Ig AN患者牛津分型E进展的独立危险因素,而白蛋白则是该病理类型进展的独立保护因素。对于肾功能不全的Ig AN患者,饮酒、尿红细胞和尿α1-微球蛋白都是牛津分型E进展的独立危险因素。(4)牛津分型S与Ig AN患者的临床病理资料比较在S分组中,S1组尿素氮、SCys-C均高于S0组,血C3低于S0组。多因素Logistic回归结果表明血小板、SCys-C是Ig AN患者牛津分型S进展的独立危险因素,与在肾功能不全分层中相一致。双下肢水肿是Ig AN患者牛津分型S进展的独立保护因素。在肾功能正常的Ig AN患者中,LDL-C是牛津分型S进展的独立保护因素。(5)牛津分型T与Ig AN患者的临床病理资料比较在T分组中,T0组与T1/2组相比,T1/2组的收缩压、舒张压、尿素氮、尿酸、血肌酐、SCys-C、尿α1-微球蛋白、24小时尿蛋白和血C4升高,而谷草转氨酶、血红蛋白、白蛋白和e GFR降低。多因素Logistic回归得出谷草转氨酶、e GFR是Ig AN患者牛津分型T进展的独立保护因素,与在肾功能不全分层中一致。在肾功能正常的Ig AN患者中,血红蛋白是牛津分型T进展的独立保护因素,血肌酐是牛津分型T进展的独立危险因素。(6)牛津分型C与Ig AN患者的临床病理资料比较在C分组中,C1/2组尿红细胞、血肌酐、SCys-C、尿α1-微球蛋白和LDL-C都明显高于C0组,而白蛋白、血红蛋白和e GFR都明显低于C0组。多因素Logistic回归表明白蛋白、e GFR、HDL-C是Ig AN患者牛津分型C进展的独立保护因素,与在肾功能分层中一致。尿红细胞是牛津分型C进展的独立危险因素。2.Ig AN诊断模型的构建与评估(1)Ig AN和非Ig AN的人口学资料和临床特征在Ig AN和非Ig AN两组中,性别无明显差异,女性比例分别为44%(117/265)和40%(214/531)。年龄、血红蛋白、白蛋白、血尿酸、血肌酐、e GFR、LDL-C、总胆固醇、24小时尿蛋白、Ig G、Ig A、Ig M、C3和C4指标在两组患者之间呈现出显著差异。(2)LASSO回归选择变量LASTofacitinib溶解度SO回归参数log(λ)1se=-3.62时筛选出的8个变量为:白蛋白、血肌酐升高、LDL-C、总胆固醇、24小时尿蛋白、Ig G、Ig A、Ig M。Ig AN主要的因素是血肌酐升高,其次为胆固醇和血清Ig A。(3)BN的建立与评估共建立四种模型:贝叶斯网络、决策树(depain biophysicscision trees,DT)、随机森林(random forest,RF)、支持向量机(support vector machine,SVM)。在训练集中,AUC值从高到低依次为:BN(0.948)、DT(0.934)、SVM(0.905)、RF(0.872)。BN的准确率达85.8%,精确率达77.1%,召回率达75.0%,F1评分为0.761。结论:1.牛津分型MEST-C各分组病变与Ig AN患者临床实验室指标有一定差异性和相关性,肾功能、白蛋白、蛋白尿等临床指标是Ig AN患者牛津分型进展的共同危险因素。部分临床危险因素在e GFR分层中存在一定差异。2.应用BN和其他ML算法建立了Ig AN的诊断预测模型,经评价BN的AUC值及综合评估指标F1评分在四种模型中最高,可认为BN的临床效能最佳。