两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

生物分子序列搜索方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40574871發(fā)布日期:2025-01-03 11:39閱讀:來源:國知局

技術(shù)特征:

1.一種生物分子序列搜索方法,其特征在于,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從多個(gè)已知生物分子序列表示對(duì)應(yīng)的已知生物分子序列中,篩選出所述未知生物分子序列對(duì)應(yīng)的同源生物分子序列,包括:

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)多個(gè)已知生物分子序列表示對(duì)應(yīng)的已知生物分子序列進(jìn)行序列重排序,得到目標(biāo)生物分子序列排序,包括:

4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述序列評(píng)分模型包括特征提取網(wǎng)絡(luò)和關(guān)系評(píng)分網(wǎng)絡(luò),所述將所述生物分子序列對(duì)輸入至序列評(píng)分模型進(jìn)行序列關(guān)系評(píng)分預(yù)測,包括:

5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述分子序列表示對(duì)差值輸入至所述關(guān)系評(píng)分網(wǎng)絡(luò)進(jìn)行序列關(guān)系評(píng)分預(yù)測,得到所述生物分子序列對(duì)的序列關(guān)系評(píng)分,包括:

6.根據(jù)權(quán)利要求3至5任一項(xiàng)所述的方法,其特征在于,所述根據(jù)每個(gè)序列關(guān)系評(píng)分進(jìn)行已知生物分子序列的序列重排序,得到目標(biāo)生物分子序列排序,包括:

7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述從所述目標(biāo)生物分子序列排序中,篩選出所述未知生物分子序列對(duì)應(yīng)的同源生物分子序列,包括:

8.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述序列評(píng)分模型的訓(xùn)練步驟包括:

9.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)多個(gè)已知生物分子序列表示對(duì)應(yīng)的已知生物分子序列進(jìn)行序列重排序,得到目標(biāo)生物分子序列排序,包括:

10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過所述未知生物分子序列表示,分別對(duì)生物分子序列向量數(shù)據(jù)庫中不同的候選向量集進(jìn)行相似性搜索,包括:

11.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述序列編碼模型包括蛋白質(zhì)編碼器、核苷酸編碼器和池化層,所述將所述未知生物分子序列輸入至序列編碼模型進(jìn)行序列編碼,得到未知生物分子序列表示,包括:

12.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過所述未知生物分子序列表示,分別對(duì)生物分子序列向量數(shù)據(jù)庫中不同的候選向量集進(jìn)行相似性搜索之前,所述方法還包括:

13.根據(jù)權(quán)利要求12所述的方法,其特征在于,所述通過所述序列標(biāo)簽,對(duì)生物分子序列向量數(shù)據(jù)庫中每個(gè)向量數(shù)據(jù)段進(jìn)行向量過濾,得到每個(gè)向量數(shù)據(jù)段對(duì)應(yīng)的候選向量集,包括:

14.根據(jù)權(quán)利要求12或13所述的方法,其特征在于,所述生物分子序列向量數(shù)據(jù)庫根據(jù)如下步驟得到:

15.一種生物分子序列搜索裝置,其特征在于,所述裝置包括:

16.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1至14任一項(xiàng)所述的生物分子序列搜索。

17.一種計(jì)算機(jī)設(shè)備,其特征在于,包括:

18.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或計(jì)算機(jī)指令,其特征在于,所述計(jì)算機(jī)程序或計(jì)算機(jī)指令被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1至14任一項(xiàng)所述的生物分子序列搜索。


技術(shù)總結(jié)
本公開提出一種生物分子序列搜索方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。包括:獲取未知生物分子序列;將未知生物分子序列輸入序列編碼模型進(jìn)行序列編碼,得到未知生物分子序列表示;通過未知生物分子序列表示對(duì)生物分子序列向量數(shù)據(jù)庫中不同的候選向量集進(jìn)行相似性搜索,候選向量集的每個(gè)候選向量的候選生物分子序列的序列長度相同;根據(jù)相似性搜索結(jié)果從每個(gè)候選向量集中搜索出預(yù)設(shè)數(shù)量的已知生物分子序列表示;從多個(gè)已知生物分子序列表示對(duì)應(yīng)的已知生物分子序列中,篩選出未知生物分子序列對(duì)應(yīng)的同源生物分子序列。該方法在相似性搜索的多個(gè)準(zhǔn)確已知生物分子序列中進(jìn)一步篩選出高質(zhì)量的同源生物分子序列,提高同源生物分子序列搜索的精確度和搜索效率。

技術(shù)研發(fā)人員:何冰,姜一諾,姚建華,秦陳陳,趙宇
受保護(hù)的技術(shù)使用者:騰訊科技(深圳)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/2
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
灵丘县| 沿河| 前郭尔| 高清| 莱阳市| 吉首市| 峨山| 祁门县| 孝义市| 改则县| 岳阳市| 福贡县| 大丰市| 榕江县| 南京市| 扎赉特旗| 通城县| 平凉市| 高唐县| 新化县| 永仁县| 内江市| 仁化县| 盐边县| 潞西市| 巴林右旗| 长岛县| 虎林市| 清新县| 平顶山市| 庆安县| 桂平市| 乐亭县| 曲麻莱县| 舒兰市| 萝北县| 潮安县| 监利县| 易门县| 杭锦后旗| 黎平县|