本發(fā)明屬于人工智能,具體涉及一種重癥卒中患者感染風(fēng)險動態(tài)預(yù)測模型。
背景技術(shù):
1、感染是卒中患者在icu中最常見的并發(fā)癥之一,主要包括肺炎、泌尿道感染和血液感染等。特別是在重癥監(jiān)護室中,卒中患者由于長期臥床、免疫功能受損以及經(jīng)常需要進行侵入性醫(yī)療操作等原因,感染風(fēng)險顯著增加。感染不僅可能延長患者住院時間,增加醫(yī)療成本,還可能加重病情,增加死亡率。因此,及時準確地預(yù)測感染風(fēng)險,對于改善患者預(yù)后、優(yōu)化資源分配以及提高護理質(zhì)量具有至關(guān)重要的意義。
2、研究表明,科學(xué)合理的預(yù)測重癥卒中患者感染風(fēng)險對醫(yī)生制定治療方案具有重要意義,有助于改善患者的預(yù)后,指導(dǎo)抗生素的使用,降低患者的死亡率。因此,如何建立一種能夠直接應(yīng)用于重癥卒中患者感染風(fēng)險的預(yù)測模型變成了本領(lǐng)域亟需解決的一個問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種重癥卒中患者感染風(fēng)險動態(tài)預(yù)測模型,以解決現(xiàn)有技術(shù)存在的不足,為重癥卒中患者的感染問題提供有益的參考和指導(dǎo)。
2、本發(fā)明提供的重癥卒中患者感染風(fēng)險動態(tài)預(yù)測模型,首先根據(jù)臨床經(jīng)驗和文獻檢索確定特征變量,提取數(shù)據(jù);然后對數(shù)據(jù)進行規(guī)范化,進行缺失值處理;接著通過統(tǒng)計學(xué)方法進行單因素邏輯回歸分析,篩選出與感染具有相關(guān)性的特征變量;最后基于這些特征變量,利用lstm算法結(jié)合dropout方法構(gòu)建模型,對重癥卒中患者感染風(fēng)險進行動態(tài)預(yù)測。
3、本發(fā)明提供的重癥卒中患者感染風(fēng)險動態(tài)預(yù)測模型,構(gòu)建的具體步驟如下:
4、(1)根據(jù)臨床經(jīng)驗和文獻檢索確定特征變量,共20個;其中,18個動態(tài)變量,分別為:陰離子間隙、碳酸氫鹽、肌酐、血細胞比容、血紅蛋白、血小板、鉀、鈉、血尿素氮、白細胞計數(shù)、心率、收縮壓、舒張壓、平均動脈壓、呼吸頻率、體溫、血氧飽和度、血糖;2個靜態(tài)變量,具體為年齡、性別;此外,在模型的設(shè)計中,將抗生素的使用作為預(yù)測感染風(fēng)險的標簽。
5、(2)對數(shù)據(jù)進行預(yù)處理;包括:首先刪除存在缺失值、內(nèi)容錯誤、格式錯誤、邏輯錯誤以及與研究無關(guān)的數(shù)據(jù);其次將靜態(tài)特征(如性別、年齡)和動態(tài)特征(如生命體征、實驗室測試結(jié)果)數(shù)據(jù)整理為按天采樣的患者數(shù)據(jù),解決臨床變量在時間軸上出現(xiàn)的頻次不均勻問題;然后對數(shù)據(jù)進行進一步的關(guān)聯(lián)性驗證,包括,數(shù)據(jù)呈正態(tài)分布,使用均值插補法進行插補,如數(shù)據(jù)呈非正態(tài)分布,使用中位數(shù)插補法進行填補;
6、(3)對預(yù)測變量與感染發(fā)生情況進行單因素邏輯回歸分析,根據(jù)單因素回歸結(jié)果篩選出p值小于0.05的變量,作為建模所用的特征;
7、(4)對經(jīng)預(yù)處理的數(shù)據(jù)進行滑動窗口處理,獲得觀察窗口大小相同的數(shù)據(jù),提取篩選出的特征,利用lstm算法[1]結(jié)合dropout方法[2]構(gòu)建lstm-dropout模型,對重癥卒中患者感染風(fēng)險進行動態(tài)預(yù)測。lstm-dropout模型結(jié)構(gòu)如圖4所示,包括lstm模塊、relu函數(shù)、dropout層、全連接層、oftmax函數(shù);具體各部分描述如下:
8、模型輸入數(shù)據(jù)xt的維度是sequencelength×num_features,其中sequence_length是時間窗口的大小,num_features是篩選出的特征數(shù)量;
9、輸入xt經(jīng)過標準的lstm模塊得到隱藏狀態(tài)ht,其中隱藏單元hidden_units的數(shù)量設(shè)置為50;
10、最后一個隱藏狀態(tài)ht通過relu函數(shù)處理以增加非線性,表示為at=relu(ht);
11、在全連接層之前,加入dropout層以進行正則化,表示為a't=dropout(at,0.3);
12、經(jīng)過dropout的激活值a't進入全連接層,得到z=wf·a't+bf;
13、其中,wf和bf分別為全連接層的權(quán)重和偏差,全連接層有兩個輸出神經(jīng)元,分別對應(yīng)于是否有感染風(fēng)險;
14、全連接層的輸出通過softmax函數(shù)分配每個類別的概率,表示為:y=softmax(z);
15、其中,y是模型的最終輸出預(yù)測,表示是否存在感染風(fēng)險。
16、此外,設(shè)batch_size為每次訓(xùn)練輸入的數(shù)據(jù)個數(shù)。當(dāng)batch_size=32時,ht的維度是(32,50)。在訓(xùn)練中,使用基于自適應(yīng)矩估計的adam優(yōu)化器,損失函數(shù)采用交叉熵損失函數(shù)。
17、本發(fā)明與現(xiàn)有技術(shù)相比,創(chuàng)新之處在于:通過提取卒中患者從入icu直到出院或死亡的時間序列數(shù)據(jù),利用統(tǒng)計學(xué)的方法篩選特征,建立了基于lstm-dropout的感染風(fēng)險動態(tài)預(yù)測模型,充分利用卒中患者的時序數(shù)據(jù),提高了預(yù)后預(yù)測的準確性。在公開數(shù)據(jù)庫mimic-iii(medical?information?mart?for?intensive?care?iii)[3]的數(shù)據(jù)上的測試結(jié)果表明,本發(fā)明的方法相對于現(xiàn)有方法具有更好的預(yù)測性能。
1.一種重癥卒中患者感染風(fēng)險動態(tài)預(yù)測模型,其特征在于,由如下步驟構(gòu)建得到:
2.根據(jù)權(quán)利要求1所述的預(yù)測模型,其特征在于,所述lstm-dropout模型的結(jié)構(gòu)包括:lstm模塊、relu函數(shù)、dropout層、全連接層、oftmax函數(shù);