AI又立功了。
這次一項新的AI機器學(xué)習(xí)算法「Ikarus」,可破解癌細(xì)胞和正常細(xì)胞的基因特征差別。
這項研究由MDC生物信息學(xué)家Altuna Akalin團(tuán)隊完成,并發(fā)表在Nature子刊「Genome Biology」上。
另外,負(fù)責(zé)本次研究的機構(gòu)MDC(Max Delbrück center)還是德國四大研究機構(gòu)之一的亥姆霍茲聯(lián)合會的16個研究中心之一。
既然這么大來頭,那這份研究為啥重磅?
從浩如煙海的數(shù)據(jù)集里篩選出一種「共通的特征」,人類肯定比不上AI。
而要將癌細(xì)胞和正常細(xì)胞區(qū)分開來,就需要篩選出它們之間的共通特征。
這次MDC的研究團(tuán)隊開發(fā)的Ikarus發(fā)現(xiàn)了腫瘤細(xì)胞中的共通模式(Pattern),它由一系列基因組特征組成,并且常見于各種類型的癌癥。
另外,算法還檢測到了從未和癌癥掛鉤的基因種類。
于是研究團(tuán)隊提出了一個簡單的問題:
是否有可能制作一個分類器,將腫瘤細(xì)胞與多種癌癥類型的正常細(xì)胞正確區(qū)分開來?
于是就有了Ikarus的誕生。它囊括兩個步驟:
1、通過整合多個經(jīng)過專業(yè)注釋的單細(xì)胞數(shù)據(jù)集,以基因集的形式發(fā)現(xiàn)全面的腫瘤細(xì)胞特征;
2、訓(xùn)練穩(wěn)健的邏輯回歸分類器以嚴(yán)格區(qū)分腫瘤和正常細(xì)胞,然后使用定制的細(xì)胞-細(xì)胞網(wǎng)絡(luò)進(jìn)行細(xì)胞標(biāo)簽的基于網(wǎng)絡(luò)的傳播。
團(tuán)隊負(fù)責(zé)人Altuna Akalin說:
為開發(fā)一種強大、靈敏和可重復(fù)的計算機腫瘤細(xì)胞分選儀,我們已經(jīng)在使用不同測序技術(shù)獲得的各種癌癥類型的多個單細(xì)胞數(shù)據(jù)集上測試了Ikarus,以確定它適用于不同實驗環(huán)境。
驚人的成功率
該論文的第一作者Jan Dohmen表示,在專家已經(jīng)清楚地區(qū)分健康細(xì)胞和癌細(xì)胞的情況下,獲得合適的訓(xùn)練數(shù)據(jù)是一項重大挑戰(zhàn)。
單細(xì)胞測序數(shù)據(jù)集通常很冗雜。
這意味著它們包含的關(guān)于單個細(xì)胞分子特征的信息不是很精確,因為在每個細(xì)胞中檢測到不同數(shù)量的基因,或者因為樣本的處理方式并不總是相同。
Dohmen和該研究的聯(lián)合負(fù)責(zé)人Vedran Franke博士說,
我們篩選了無數(shù)出版物并聯(lián)系了相當(dāng)多的研究小組,以獲得足夠的數(shù)據(jù)集。團(tuán)隊最終選擇來自肺癌和結(jié)直腸癌細(xì)胞的數(shù)據(jù)來訓(xùn)練算法,然后再將其應(yīng)用于其他類型腫瘤的數(shù)據(jù)集。
在訓(xùn)練階段,Ikarus需要找到一個「特征基因列表」,然后將其用于對細(xì)胞進(jìn)行分類。
我們嘗試并改進(jìn)了各種方法,Ikarus最終使用兩個列表:一個用于癌癥基因,另一個用于來自其他細(xì)胞的基因,弗蘭克解釋道。
經(jīng)過訓(xùn)練之后,該算法就能夠區(qū)分其他類型癌癥中的健康細(xì)胞和腫瘤細(xì)胞,比如來自肝癌或神經(jīng)母細(xì)胞瘤患者的組織樣本。
而在其他樣本中的結(jié)果令人雀躍,成功率出奇地高,最高可達(dá)99%。
「我們沒想到會有一個共同的特征可以如此精確地定義不同類型癌癥的腫瘤細(xì)胞」,Akalin說。
「但我們?nèi)匀徊荒苷f這種方法是否適用于所有類型的癌癥」,Dohmen補充道。
不只是癌細(xì)胞區(qū)分
為了將Ikarus變成一種可靠的癌癥診斷工具,研究人員現(xiàn)在希望在其他類型的腫瘤上對其進(jìn)行測試。
在最初的測試中,Ikarus已證明該方法還可以將其他類型(和某些亞型)的細(xì)胞與腫瘤細(xì)胞區(qū)分開來,不僅限于腫瘤細(xì)胞檢測。
它可用于檢測任何細(xì)胞狀態(tài),比如細(xì)胞類型,唯一的要求是細(xì)胞狀態(tài)至少存在于兩個獨立的實驗中。
Akalin說:
我們希望使這種方法更加全面,進(jìn)一步發(fā)展它,以便它可以區(qū)分活檢中所有可能的細(xì)胞類型。
在空間測序數(shù)據(jù)集上應(yīng)用自動腫瘤分類可以直接注釋組織學(xué)樣本,從而促進(jìn)自動化數(shù)字病理學(xué)。
在醫(yī)院,病理學(xué)家通常只在顯微鏡下檢查腫瘤的組織樣本,以識別各種細(xì)胞類型。這是一項費時費力的工作。
有了Ikarus,這一步驟有朝一日可能成為一個完全自動化的過程。
另外,Akalin指出,這些數(shù)據(jù)可用于得出關(guān)于腫瘤直接環(huán)境的結(jié)論。這可以幫助醫(yī)生選擇最好的療法。對于癌組織和微環(huán)境的構(gòu)成,通常表明某種治療或藥物是否有效。
另外,AI也可能有助于開發(fā)新的藥物。
「Ikarus讓我們能夠識別出可能導(dǎo)致癌癥的基因,然后可以使用新的治療劑來靶向這些分子結(jié)構(gòu)」Akalin說。