根據(jù)最新一項研究發(fā)現(xiàn),機器學習正在成為高精度預測分析和診斷領(lǐng)域的有力工具。近期,印第安納大學與普渡大學印第安納波利斯聯(lián)合分校的研究人員開發(fā)了一種機器學習算法,可以90%準確預測急性骨髓性白血病(AML)的復發(fā),以及100%準確預測緩解(Remission:緩解,當患者在初診時,白血病細胞為1012,經(jīng)過導入療法的化學治療以后,白血病細胞減少到大約109以下時,就不能再從血液和骨髓中發(fā)現(xiàn)白血病細胞, 這時病人即達到完全緩解(complete remission,CR))。
這項小型研究凸顯了機器學習具備取代傳統(tǒng)診斷方法的潛力,研究者使用的是來自AML患者的骨髓細胞、病史數(shù)據(jù)以及其他健康個體的信息。
傳統(tǒng)診斷方式主要是手動分析來自流式細胞術(shù)(流式細胞術(shù)是對懸液中的單細胞或其他生物粒子,通過檢測標記的熒光信號,實現(xiàn)高速、逐一的細胞定量分析和分選的技術(shù))的數(shù)據(jù),而機器學習方法體現(xiàn)了它的高準確率和及時性。
普渡大學生物科學中心計算生物學研究助理教授Bindley Bartek Rajwa解釋:我們的計算系統(tǒng)采用流式細胞術(shù)的數(shù)據(jù)作為輸入。流式細胞術(shù)是一種廣泛使用的技術(shù),可以快速提供樣本中單個細胞的特性,如血液或骨髓細胞。Rajwa是該研究的第一作者,該論文被IEEE生物醫(yī)學工程學期刊收錄。
“傳統(tǒng)的流式細胞術(shù)的結(jié)果是由受過高度培訓的人類專家評估,而不是機器學習算法,”他補充說,“但是計算機通常比人類更擅長從復雜數(shù)據(jù)中提取知識。”
斯坦福大學醫(yī)學院教授和遺傳學教授Michael Snyder博士,同意計算機在復雜癌癥病例診斷中是關(guān)鍵的輔助工具, 也許最終會取代人類醫(yī)生。
在8月份的時候,他使用機器學習來區(qū)分不同類型的肺癌,他認為病理學的觀點非常主觀,“兩個高度熟練的病理學家評估同一張幻燈片時,只有60%的部分是共同認可的。使用機器學習的方法,可以用復雜、定量的測量結(jié)果來取代主觀性,我們認為很有希望改善患者的診斷結(jié)果。
據(jù)了解,根據(jù)國家癌癥研究所的數(shù)據(jù), 2016年有接近20,000名患者可能接受AML診斷,預計超過10,000人將死于該疾病。
機器學習正在迅速成為許多疾病類別預測分析和診斷的流行工具,包括膿毒癥,創(chuàng)傷護理,心臟病,人群健康管理,視力保健和精神衛(wèi)生保健。2015年,來自哥倫比亞大學,布宜諾斯艾利斯大學和IBM計算生物學中心的一項研究也使用機器學習實現(xiàn)準確無誤的預測診斷記錄,他們使用自然語言處理技術(shù)來標記可能進入精神病發(fā)作的心理健康患者。
隨著開發(fā)人員和研究人員改進他們的機器學習方法,以及供應商發(fā)布更多工具,從事高級分析的機構(gòu)可以訪問龐大的計算能力,診斷準確率會普遍得到顯著提升。
印第安納大學與普渡大學印第安納波利斯聯(lián)合分校的病毒進展研究的高級作者、計算機副教授Murat Dundar表示,教會計算機識別AML是非常簡單的,一旦你開發(fā)了一個強大的魯棒算法,能將以前的工作提升到接近100%的準確率。
“有挑戰(zhàn)性的是如何超越確診AML工作本身。我們要讓計算機準確地預測AML患者的疾病變化方向,從新的數(shù)據(jù)中理解并預測未知走向,知道哪些新的AML患者將進入緩解狀態(tài),哪些會進入復發(fā)狀態(tài)。
該研究為臨床決策的支持工具提供了一個框架,該工具可以識別來自AML患者的骨髓樣本中極少量的惡性細胞,可用于快速預測疾病進展方向的變化。
“機器學習不是數(shù)據(jù)建模,”Dundar補充說,“而是從你所擁有的數(shù)據(jù)中提取知識,所以你可以構(gòu)建一個強大且直觀的工具,可以預測未來的數(shù)據(jù)。機器是在學習,而非記憶,而這就是我們所致力實現(xiàn)的。