點內科技:基于3D深度學習自動預測肺腺癌EGFR突變狀態,預測精準度超過傳統影像組學

IM2Maker 6年前 (2019-07-12)

點內科技與多單位聯合研究成果《基于3D深度學習自動預測肺腺癌EGFR突變狀態》登上Cancer Medicine封面。

2019年7月,國際期刊CancerMedicine以封面文章的形式,刊登了點內科技、復旦大學附屬華東醫院、上海交通大學等多單位的最新聯合研究成果,《基于3D深度學習自動預測肺腺癌EGFR突變狀態》,研究顯示預測精準度超過傳統影像組學。

基于3D深度學習自動預測肺腺癌EGFR突變狀態,預測精準度超過傳統影像組學

肺癌是腫瘤相關死亡的首因[1],肺癌患者中80%為非小細胞肺癌(NSCLC),腺癌為其最常見的病理類型[2]。近數十年來基于基因組學而發展的針對驅動基因的靶向治療,如靶向特定表皮生長因子受體(EGFR)突變的酪氨酸激酶抑制劑(TKI)吉非替尼、靶向ALK基因的TKI 克唑替尼等,已成為肺癌精準醫學不可或缺的重要組分[3]。然而,對于無EGFR突變或非ALK陽性的肺癌患者,靶向治療卻并無臨床獲益,有時還可能導致PFS縮短以及不必要的醫療支出[4],因此,選擇靶向藥物前需要提前明確驅動基因狀態。此外,EGFR TKI治療期間可能出現EGFR T790突變而導致耐藥,出現病情進展,因此,也需要動態監測相關基因的突變狀態以調整治療藥物[5]。

對活檢或外科手術切除后的樣本進行突變檢測是明確EGFR突變類型的標準手段,但取樣的侵入性、為監測治療所必須的反復取樣等問題,以及DNA質量不佳、腫瘤異質性、患者床位周轉時間、檢測費用等諸多難題限制了分子檢測的推廣,也一定程度上影響了肺癌精準醫療在臨床實踐中的推廣規模[6-9]。

腫瘤的表型源于特定的基因型,因此,通過甄別特定表型來預測基因型是一種潛在可行的手段。已有研究顯示,特定的影像組學特征與EGFR突變類型相關[10,11]。然而,傳統影像組學面臨諸多挑戰,如在檢測、分隔、提取特征等過程中大量依賴手工操作,費時費力;不同讀片者之間的可復制性較低。

近年來以深度卷積神經網絡為代表的深度學習在醫學圖像計算方面顯示出令人難以置信的優越表現,并在很大程度上降低了人工操作的必要性。此前,點內科技聯合復旦大學附屬華東醫院和上海交通大學SJTU-UCLA機器感知與推理聯合研究中心等利用3D深度學習技術,成功證明了3D深度學習在預測肺腺癌侵襲性方面的有效性和效能,準確率高達88%[12]。受其鼓舞,點內科技再次與華東醫院李銘、Hua Yanqing團隊、以及上海交通大學SJTU-UCLA機器感知與推理聯合研究中心、上海第十人民醫院、同濟大學同濟醫院等合作,探索了3D深度學習在基于CT影像預測EGFR突變方面的潛能。研究結果近期發表于 Cancer Medicine (IF=3.2,TowardautomaticpredictionofEGFR mutationstatusinpulmonaryadenocarcinomawith3Ddeeplearning),華東醫院李銘、滑炎卿教授為論文的共同通訊作者,華東醫院趙偉和上海交大楊健程為共同第一作者。

研究流程

研究的影像數據來自華東醫院CT數據庫(HdH數據庫579例,包括訓練集348例、開發集116例和測試集115例)。為測試所建模型的通用性,從獨立的腫瘤公共影像庫TCIA選取37例肺結節也作為測試集。全部病例均由人工進行定位、分割和標記EGFR突變/野生型狀態。通過訓練集采用3D DenseNets深度學習方法訓練,采用強大的數據擴增技術mixup以提升規范化/正則化(regularization),通過有監督的端到端學習模型完成擬合。與此同時,對全部影像數據進行傳統的影像組學分析,與3D深度學習對照,計算成對關聯系數分析二者的關聯性。

結果顯示,3D深度學習在預測EGFR突變狀態方面明顯優于傳統的影像組學方法(P=0.021),3D深度學習對HdH數據庫測試集和公共測試集測試的AUC分別為75.8%和75.0%(表1)。更重要的是,不同于傳統影像組學要求人工對感興趣的病灶部位進行分割,非常耗時耗力,3D深度學習的興趣部位與肺結節病變部位有良好的一致性。

研究者對提取的401個傳統影像組學特征(上圖A)與從3D DenseNets提取的114個深度學習影像組學特征(上圖C)進行分析發現,3D深度學習方法提取的特征較通過人工提取的特征更具代表性,因此聚類分析的結果更佳。研究首次用矩陣的方法進一步比較了深度學習特征與傳統影像組學特征(上圖B),分析發現,深度學習特征與傳統影像學之間存在著強關聯,從分類性能的ROC曲線方面,深度學習特征的敏感性和特異性更高,這說明深度學習通過增強的影像組學方式,從魯棒性(robustness)、緊密度(compactness)和表達能力(expressiveness)方面可以發揮強大的預測效能。

深度學習系統在各數據庫的預測表現匯總

研究者發展的這一深度學習體系實現了非侵入性、自動預測肺腺癌EGFR突變型,從而通過明確EGFR靶向治療的獲益人群,輔助肺腺癌的臨床治療決策。研發過程中整合了近期關于深度監督學習的一些進展,比如深度連接、mixup技術等,從而顯著降低了過度擬合等風險。由于這一方法因無需對肺結節進行精細的分隔,因此非常節省勞動力,同時,因為采用的學習算法的增強特性,可望獲得更加穩定的表現。

研究者稱,未來還需進一步對成果進行驗證,比如本研究EGFR突變是通過ARMS-PCR檢測的,未來還需對有二代測序的EGFR突變數據的樣本進行驗證;目前的模型僅納入了CT影像信息,未來還需整合更多的臨床信息如病理、血檢驗結果、蛋白組學等。

2019年7月刊 CancerMedicine封面

關于點內科技

點內科技成立于2016年4月,是一家創新型高科技企業,總部位于中國上海。公司核心管理團隊均來自世界500強制藥及醫療設備企業;核心技術團隊實力雄厚,多位核心研究人員為國家中組部千人計劃成員和美國科學家榮譽協會( Sigma ⅪSociety)會員。

此外,公司匯聚了一批人工智能行業、深度學習領域及醫療行業的資深專家學者,通過國內肺部??漆t院和大三甲醫院近50000例肺部CT數據的訓練,將人工智能與大數據技術緊密結合,利用部署在地面端的人工智能輔助診斷系統和云端的智能引擎系統,為醫生提供針對肺部結節的早期輔助診斷和治療建議的產品。

2017年,參加“2017天池醫療AI大賽——肺部結節智能診斷大賽”,點內科技從來自全球的2887支隊伍中脫穎而出,獲得大賽第一名。

2018年8月,點內科技順利獲得國家CFDA醫療器械注冊證(二類)。同年,點內科技作為肺結節輔助診斷處理軟件(AI類)送檢企業,參與中檢院主導的肺部結節標準數據庫建立以及AI產品相關標準制定,或將成為國內首批獲準CFDA三類注冊證的AI企業。

【參考文獻】

1.Bray F, Ferlay J, Soerjomataram I, Siegel RL, Torre LA, JemalA. Global cancer statistics 2018: GLOBOCAN estimates of incidenceand mortality worldwide for 36 cancers in 185 countries. CACancer J Clin. 2018;68(6):394-424.

2.Ettinger DS, Wood DE, Aisner DL, et al. Cell lung cancer, Version5.2017, NCCN Clinical Practice Guidelines in Oncology. J NatlCompr Canc Netw. 2017;15(4):504-535.

3.NCCN臨床實踐指南:非小細胞肺癌(2019.V4)

4.Mok TS, Wu Y-L, Thongprasert S, et al. Gefitinib or carboplatin-paclitaxel in pulmonary adenocarcinoma. N Engl J Med.2009;361(10):947-957.

5.中國臨床腫瘤學會腫瘤生物標志物專家委員會《中國非小細胞肺癌患者EGFR T790M基因突變檢測專家共識》制定專家組 中國非小細胞肺癌患者EGFR T790M基因突變檢測專家共識 中華醫學雜志2018,98(32:2544-51)

6.Bedard PL, Hansen AR, Ratain MJ, Siu LL. Tumour heterogeneity in the clinic. Nature. 2013;501(7467):355-364.

7.Lindeman NI, Cagle PT, Beasley MB, et al. Molecular testing guideline for selection of lung cancer patients for EGFR and ALK tyrosine kinase inhibitors: guideline from the College of American Pathologists, International Association for the Study of Lung Cancer, and Association for Molecular Pathology. J Mol Diagn. 2013;15(4):415-453.

8.Kim TO, Oh IJ, Kho BG, et al. Feasibility of re-biopsy and EGFRmutation analysis in patients with non-small cell lung cancer.Thorac Cancer. 2018;9(7):856-864.

9.Kobayashi K, Naoki K, Manabe T, et al. Comparison of detection methods of EGFR T790M mutations using plasma, serum, and tumor tissue in EGFR-TKI-resistant non-small cell lung cancer.OncoTargets Ther. 2018;11:3335-3343.

10.Yip S, Kim J, Coroller TP, et al. Associations between somatic mutations and metabolic imaging phenotypes in non‐small cell lungcancer. J Nucl Med. 2017;58(4):569-576.

11.Rios Velazquez E, Parmar C, Liu Y, et al. Somatic mutations drive distinct imaging phenotypes in lung cancer. Can Res. 2017;77(14):3922-3930.

12.Zhao W, Yang J, Sun Y, et al.3D Deep Learning from CT Scans Predicts Tumor Invasiveness ofSubcentimeter Pulmonary Adenocarcinomas. Cancer Res. 2018 Dec 15;78(24):6881-6889.

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到