1.一種生物分子序列搜索方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從多個(gè)已知生物分子序列表示對(duì)應(yīng)的已知生物分子序列中,篩選出所述未知生物分子序列對(duì)應(yīng)的同源生物分子序列,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)多個(gè)已知生物分子序列表示對(duì)應(yīng)的已知生物分子序列進(jìn)行序列重排序,得到目標(biāo)生物分子序列排序,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述序列評(píng)分模型包括特征提取網(wǎng)絡(luò)和關(guān)系評(píng)分網(wǎng)絡(luò),所述將所述生物分子序列對(duì)輸入至序列評(píng)分模型進(jìn)行序列關(guān)系評(píng)分預(yù)測,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述分子序列表示對(duì)差值輸入至所述關(guān)系評(píng)分網(wǎng)絡(luò)進(jìn)行序列關(guān)系評(píng)分預(yù)測,得到所述生物分子序列對(duì)的序列關(guān)系評(píng)分,包括:
6.根據(jù)權(quán)利要求3至5任一項(xiàng)所述的方法,其特征在于,所述根據(jù)每個(gè)序列關(guān)系評(píng)分進(jìn)行已知生物分子序列的序列重排序,得到目標(biāo)生物分子序列排序,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述從所述目標(biāo)生物分子序列排序中,篩選出所述未知生物分子序列對(duì)應(yīng)的同源生物分子序列,包括:
8.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述序列評(píng)分模型的訓(xùn)練步驟包括:
9.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)多個(gè)已知生物分子序列表示對(duì)應(yīng)的已知生物分子序列進(jìn)行序列重排序,得到目標(biāo)生物分子序列排序,包括:
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過所述未知生物分子序列表示,分別對(duì)生物分子序列向量數(shù)據(jù)庫中不同的候選向量集進(jìn)行相似性搜索,包括:
11.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述序列編碼模型包括蛋白質(zhì)編碼器、核苷酸編碼器和池化層,所述將所述未知生物分子序列輸入至序列編碼模型進(jìn)行序列編碼,得到未知生物分子序列表示,包括:
12.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過所述未知生物分子序列表示,分別對(duì)生物分子序列向量數(shù)據(jù)庫中不同的候選向量集進(jìn)行相似性搜索之前,所述方法還包括:
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,所述通過所述序列標(biāo)簽,對(duì)生物分子序列向量數(shù)據(jù)庫中每個(gè)向量數(shù)據(jù)段進(jìn)行向量過濾,得到每個(gè)向量數(shù)據(jù)段對(duì)應(yīng)的候選向量集,包括:
14.根據(jù)權(quán)利要求12或13所述的方法,其特征在于,所述生物分子序列向量數(shù)據(jù)庫根據(jù)如下步驟得到:
15.一種生物分子序列搜索裝置,其特征在于,所述裝置包括:
16.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1至14任一項(xiàng)所述的生物分子序列搜索。
17.一種計(jì)算機(jī)設(shè)備,其特征在于,包括:
18.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或計(jì)算機(jī)指令,其特征在于,所述計(jì)算機(jī)程序或計(jì)算機(jī)指令被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1至14任一項(xiàng)所述的生物分子序列搜索。