国产激情综合五月久久_国产丝袜无码一区二区视频_双乳奶水饱满少妇小说_韩国三级《诱人的乳》_《熟妇荡欲》欧美电影_有码+日韩+在线观看_地铁羞耻挤入h_久久久WWW免费人成精品_国产香蕉97碰碰久久人人

首頁 > 資訊 > 數(shù)字化

中國科學(xué)家運用人工智能算法發(fā)現(xiàn)大量全新 RNA 病毒,大幅拓寬 RNA 病毒庫

2024/10/10 17:11      IT之家


   IT之家從中山大學(xué)官方微信公眾號獲悉,10 月 9 日,中山大學(xué)醫(yī)學(xué)院施莽教授團隊與阿里云李兆融團隊在《細(xì)胞》(Cell)雜志上發(fā)表論文,報告了 180 個超群、超過 16 萬種全球 RNA 病毒的發(fā)現(xiàn),這是迄今為止規(guī)模最大的 RNA 病毒研究,大幅擴展了全球 RNA 病毒的多樣性,該研究將人工智能技術(shù)應(yīng)用于病毒鑒定,發(fā)現(xiàn)了傳統(tǒng)方法未能發(fā)現(xiàn)的病毒“暗物質(zhì)”,探索了病毒學(xué)研究的新路徑。

  據(jù)介紹,傳統(tǒng)的病毒發(fā)現(xiàn)方法包括病毒分離和生命組學(xué)的生物信息學(xué)分析,高度依賴既有知識,面對 RNA 病毒這種高度分化、種類繁多且容易變異的病毒識別效率低。該研究團隊開發(fā)的 LucaProt 人工智能算法能夠?qū)Σ《竞头遣《净蚪M序列深度學(xué)習(xí),并在數(shù)據(jù)集中自主判斷病毒序列。

  據(jù)IT之家了解,LucaProt 是一種能夠深度學(xué)習(xí)的 Transformer 模型,在大量學(xué)習(xí)病毒和非病毒基因組序列后,可以自主形成一套關(guān)于病毒的判斷標(biāo)準(zhǔn),從而在大量的 RNA 測序數(shù)據(jù)集中挖掘出病毒序列。在測試中,LucaProt 表現(xiàn)出極高的準(zhǔn)確性和特異性,假陽性率為 0.014%,假陰性率為 1.72%。在與其他病毒挖掘工具的對比中,它也在處理較長序列的方面展現(xiàn)出優(yōu)勢。

  利用 LucaProt,研究團隊對來自全球生物環(huán)境樣本的 10,487 份 RNA 測序數(shù)據(jù)進行病毒挖掘,發(fā)現(xiàn)了超過 51 萬條病毒基因組,代表超過 16 萬個潛在病毒種及 180 個 RNA 病毒超群(相當(dāng)于門或綱的分類級別),使 RNA 病毒超群數(shù)量擴容約 9 倍。其中 23 個超群無法通過序列同源方法識別,被稱為病毒圈的“暗物質(zhì)”。

  在這項研究中,團隊報告了迄今最長的 RNA 病毒基因組,長度達到 47,250 個核苷酸;發(fā)現(xiàn)了超出以往認(rèn)知的基因組結(jié)構(gòu),展現(xiàn)出 RNA 病毒基因組進化的靈活性;識別到多種病毒功能蛋白,特別是與細(xì)菌相關(guān)的功能蛋白,進一步表明還有更多類型的 RNA 噬菌體亟待探索。

  研究指出,新發(fā)現(xiàn)的病毒分布在地球的各類生態(tài)環(huán)境中�?傮w上,落葉層、濕地、淡水和廢水環(huán)境的病毒多樣性最高。然而,在南極底泥、深海熱泉、活性污泥和鹽堿灘等極端環(huán)境中,RNA 病毒的多樣性和豐度并不低,甚至在深海熱泉的高溫環(huán)境中,仍有 RNA 病毒在活躍復(fù)制。

  LucaProt 雖然是一個專門為 RNA 病毒發(fā)現(xiàn)設(shè)計的模型,但它同時融合了對蛋白質(zhì)序列和隱含結(jié)構(gòu)信息識別的功能,也可用于蛋白質(zhì)功能的鑒定。在論文中,研究團隊開源了 LucaProt 模型,并通過在線網(wǎng)站分享給全球科學(xué)家。

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門新聞