10月10日消息,國際頂級學(xué)術(shù)期刊《Cell》公布了中山大學(xué)與阿里云互助的科研后果,研討團(tuán)隊(duì)使用云盤算與AI武藝發(fā)覺了180個(gè)超群、16萬余種全新RNA病毒,是已知病毒品種的近30倍,大幅提升了業(yè)界對RNA病毒多樣性和病毒演化汗青的認(rèn)知。
《Cell》是國際公認(rèn)學(xué)術(shù)名譽(yù)最高的期刊,代表生命封建范疇的最高水平。國內(nèi)每年中選《Cell》的論文數(shù)目僅多數(shù)十篇。此次中選的論文提出了一種基于深度學(xué)習(xí)的RNA病毒發(fā)覺辦法,是深度學(xué)習(xí)算法在病毒發(fā)覺范疇的里程碑式歷程,為病毒學(xué)研討創(chuàng)始了全新范式。
病毒與人類的康健親密干系,但人類已知已確認(rèn)的病毒品種僅有5000余種,這只是病毒天下的冰山一角。傳統(tǒng)RNA病毒判定辦法高度依托于序列同源性比對,即經(jīng)過比力未知病毒與已知病毒的序列相似性來舉行識別。但是,RNA病毒品種多樣且高度分化,傳統(tǒng)辦法難以捕捉缺乏同源性或同源性極低的“暗物質(zhì)病毒”,新病毒發(fā)覺的聽從較低。
AI與病毒學(xué)研討的團(tuán)結(jié)正在打破這一困難。本篇論文提出了全新的深度學(xué)習(xí)模子"LucaProt",它基于Transformer框架與大模子表征武藝,團(tuán)結(jié)卵白質(zhì)序列和內(nèi)在布局性特性,在獨(dú)立的測試數(shù)據(jù)集上體現(xiàn)精良,具有極高的準(zhǔn)確性(假陽性率僅為0.014%)和特異性(假陰性率為1.72%)。
據(jù)先容,研討團(tuán)隊(duì)對來自舉世生物情況樣本的10,487份數(shù)據(jù)舉行病毒發(fā)掘,發(fā)覺了513,134條病毒基因組,代表161,979個(gè)潛伏病毒種及180個(gè)RNA病毒超群。使RNA病毒超群數(shù)目擴(kuò)容約9倍,病毒品種增長約30倍,此中23個(gè)超群無法經(jīng)過序列同源辦法識別,被稱為病毒圈的“暗物質(zhì)“。
該論文還展現(xiàn)了多個(gè)病毒學(xué)范疇新發(fā)覺:發(fā)覺迄今為止最長的RNA病毒基因組,長度到達(dá)47,250個(gè)核苷酸;識別出超出以往認(rèn)知的基因組布局,展現(xiàn)了RNA病毒基因組提高的機(jī)動性;別的,在低溫的深海熱泉等極度情況中,RNA病毒仍舊存在多樣性。
中山大學(xué)醫(yī)學(xué)院傳授施莽表現(xiàn):“在科研范疇,AI的使用以前勢不成擋,經(jīng)過AI辦法探究封建成績已取得了緊張打破。這種研討范式將成為將來封建界的常態(tài),也約莫成為我們認(rèn)知天下的緊張伎倆。”
該論文協(xié)同第一作者、阿里云飛天實(shí)行室算法專家賀勇表現(xiàn):“基于AI+病毒學(xué)的新研討框架改造了人類對病毒圈的熟悉,隨著這種熟悉的不休完滿,有助于人類對將來約莫產(chǎn)生的大盛行舉行預(yù)警,以及進(jìn)一步推進(jìn)RNA病毒疫苗的研發(fā)。”
據(jù)悉,已往幾年,阿里云積極與國內(nèi)高校和研討機(jī)構(gòu)掀開互助,在生命封建范疇已公布核酸和卵白質(zhì)一致基本模子-LucaOne、RNA病毒發(fā)覺-LucaProt、磷循環(huán)卵白家屬識別-LucaPCycle等研討后果。
版權(quán)聲明:本文來自互聯(lián)網(wǎng)整理發(fā)布,如有侵權(quán),聯(lián)系刪除
原文鏈接:http://www.freetextsend.comhttp://www.freetextsend.com/shenghuojineng/55094.html