微軟程骉:智能醫療產業化應用的挑戰和解決之道

韓璐 9年前 (2016-12-23)

在新智元舉行的百人峰會閉門論壇上,微軟亞太研發集團創新孵化總監程骉在會上帶來了《對話即平臺——智能醫療初探》的分享。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

以下為程骉演講實錄。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

程骉:非常高興在這個場合跟大家見面,歡迎大家來到微軟。我講的題目和對話、智能醫療有關。智能醫療是非常大的話題,我今天跟大家分享我們在這個領域的一個研究項目,所以我寫的題目是“初探”,不會覆蓋所有的話題。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

自我介紹一下,“骉”是我父親給我取的名字,這可難為了我從幼兒園到研究生的所有老師,他們大部分不認識這個字。我們上大學的時候,數學老師性子特別急,他點名點到我的名字稱三馬,以致大學同學都叫我三馬,“骉”這個字不大常見。我在微軟亞太研發集團做創新孵化這一塊,比如有一些好的研究成果怎么在中國落地,我們團隊同時跟微軟的銷售和市場部門以及外部的合作伙伴溝通也非常緊密。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

大家可能留意到,微軟前兩天發布了重磅新聞—— Microsoft Translator(微軟翻譯)做了一次重大更新。它其實發布已經有很長時間了,但這次更新有一個非常牛的功能,就是多人、多語言、跨設備的現場翻譯(英文叫Live feature),可以在幾種不同的場景下使用。比如導游說不同的語言,你問路它能夠實時給你翻譯。Microsoft Translator目前支持包括中文普通話在內的9種語言的語音輸入,將近60種語言的文字翻譯,而且可以多人現場對講,支持多達一百人的實時翻譯。這以前只在科幻小說里面聽說過,現在科幻慢慢變成現實了,人與人之間面對面的交流障礙在逐步被消除。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

我們之前發布了微軟助理小娜(英文是Cortana),各個平臺上都有,安卓手機和iPhone、iPad 都有這個應用,尤其是在Windows10上,能夠幫你做一些其他事情。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

前兩天發布的是我們等了很久的 Cortana Devices SDK智能套件,這為Cortana在各個平臺、各種設備上的推廣將會起到非常大的促進作用。之前有很多公司希望我們能早日發布Cortana的SDK,這次很好地滿足了大家的期待。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

順便說一句,小娜在中國還有個比她名氣大得多的“妹妹”,咱們現場的朋友有沒有沒聽過微軟小冰的(笑)?2014微軟小冰首次在中國發布,小冰到目前為止擁有四千萬用戶,我了解的記錄是對話的平均輪次是23輪。其實在很多人眼里,小冰早已超越了一般的人工智能。她不僅僅能滿足你一些功能性的提問,還能機智地反擊你的調侃、陪你聊雞湯聊感情。2015年發布的日本版小冰叫Rinna,中文翻譯成“凜菜”,現在有20%的日本人經常跟她在線上聊天。

前兩天正式發布的是美國版小冰,叫Zo,一個月前開始測試上線,到目前為止已有超過10萬用戶在線上跟她聊天,有超過五千人單次超過一個小時的聊天時長。單人單次記錄最長能夠有多少個輪次?1229次!聊了多長時間?將近10個小時,9小時53分。這個數字一出來我們也嚇了一跳,這才剛上線一個月的時間啊。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟對人工智能真是非常重視,大家可能看到了今年九月份我們宣布了一個新聞,跟AI相關的產品部門包括必應、Cortana等的團隊和研究部門整合成了一個五千人多的大團隊,微軟人工智能與研究事業部 ,目的就是要普及人工智能。公司的戰略是移動優先、云優先,但是對這個團隊而言是智能優先?,F在,沈向洋博士在領導這個團隊。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

25年前微軟研究院成立的時候,比爾·蓋茨先生有一個夢想,他希望計算機有朝一日可以看懂、聽懂和理解人類,這一宏偉目標也成功吸引了大批頂尖人才加盟微軟研究院。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

經過這么多年的厚積薄發,我們取得了一系列令人震撼的世界紀錄。比如,在著名的計算機視覺(圖像識別)ImageNet競賽上,去年微軟亞洲研究院的ResNet技術超越了人類記錄,錯誤率只有3.5%,而人的錯誤率是5.1%。而今年10月,微軟在語音識別能力上也取得了突破性進展,語音識別正確率達到了人類速記員的水平,跟人類速記員的最好紀錄是持平的。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟的愿景很大膽:我們計劃在虛擬助理、應用、服務和基礎設施等多個領域實現真正的人工智能系統。微軟希望向所有人提供人工智能技術 ,包括消費者,企業和開發者,讓他們都能在這些技術中獲益。我們所有這些服務,打包以API的形式提供給開發者,方便其制作各種智能應用。我們統一稱這些在微軟云Azure上運行的服務為“微軟認知服務” 。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

前兩天有報道,CB Insights 預計2017年人工智能的十大趨勢哪個最有可能成功,第一位的就是智能聊天機器人。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

另外一個熱門就是醫療行業。在行業應用預測中,醫療行業排在第一位,醫療行業 2015年是最火的,2016年稍微有點下降,但在各個行業里面它牢牢占據著第一位。我今天講的跟這兩個都有關系,一個是聊天,一個是健康。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

聊天機器人。大家都覺得這是一個方向,各家都在研究,從微軟的角度來講,我們認為有兩個維度,一個是智商,另外一個是情商。用戶跟小冰能聊那么長時間,就是情商的體現,她能一直跟你對話。昨天在南京跟大家聊天,很多人沒用過小冰聊天,后來聊起來,覺得真有意思,小冰回答怎么這么絕?我都說不出來這種話。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

在另外一個維度上,我們其實不需要那么高的情商,但是需要提高效率,提高生產力,這是小娜實現的功能。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

小冰的平均會話次數是23次,是其它類似產品的10倍以上。有一個非常有意思的事跟大家分享。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

小冰最初上線的時候,所有的對話數據都是從網上抓的,百分之百都是從網上學來的。所以剛開始跟小冰對話,她經常出言不遜,因為她都是從網上學來的。兩年多的時間很多人跟她對話,慢慢她從用戶那里學來的占到45%,從網上學來的下降到55%。她能夠通過跟人類不停地對話,自己學習人類的智能。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

正是因為對話聊天這么重要,所以我們提出了CaaP(Conversation as a Platform),即“對話即平臺”戰略。通過人跟聊天機器人進行各種交互,我們產生了平臺的生態系統,以非常自然的方式達成新的人機交互、提供搜索和人工智能服務的新入口。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

談到聊天機器人,一般認為有三層邏輯結構:第一層是通用的對話,就是小冰完成的功能,跟你閑聊,有些情感的分析,也會有一些個性化的對話,跟不同的人會聊不同的內容。第二層就是智能的問答和搜索,需要獲取一些信息,包括一些智能客服也屬于這個范疇,是問答Q&A的范疇。最后一層是需要更多的專業知識來完成一些任務,這個一般需要多輪問答,也需要對話管理,這是比較高的層次。我們下面講的東西跟第二層(問答)有關。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

醫生在問診的時候經常手忙腳亂的,需要回答那么多的問題,而且經常是重復性的問題?;颊咭矔Щ?,等那么長時間兩分鐘診療就結束了。這對大家來說也許都是非常熟悉的場景。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

醫療這個市場到底有哪些痛點?患者對一般的社區醫院信任程度有待提高,有病直接到最好的醫院找專家,其實專家花很多時間解答一些基礎的知識并非必要。我們經常聽到的是三甲醫院的醫生工作量巨大,又要搞科研又要看病,問診的細致程度和工作狀態不能得到充分的保證,很多日常小病也去找他們,無法最大程度發揮工作價值。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

社區醫院的醫生也有痛點,他們的痛點是患者的信任問題?,F在國家提倡建立家庭醫生制度,醫生除了現有的工作以外,還要每個醫生支持很多戶家庭,執行起來難度較大。從國家層面來講,國家很想解決這個問題,連續發布了幾個文件,提出分級診療,推進家庭醫生簽約服務,但是推行起來也有很多困難。

總結起來,這里面有很多重復性的問題:我們能不能夠讓我們的AI幫助解決一部分這樣的問題。針對分級診療這件事情,我們專門做了一個智能輔助系統,比如基層醫生的培訓,提高基層醫生的工作能力、提高他們的工作效率。怎么提高工作能力?建立知識庫能夠輔助學習,輔助問診。從提高工作效率來講,機器自動回復常識性的問題,再加上能夠自動回訪。不需要醫生記著這個病人一周前來做過手術,我們的系統能記得對患者回訪,從而提高醫生的效率。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

具體怎么實現?首先是數據源的接入,數據有三方面:第一,網上抓取的數據,這是公開非結構化的醫學文本;第二類,是專家的知識,但是沒有歸檔的;第三類,是半結構的電子病例。為什么說半結構?有一部分也是結構化的,比如姓名、身份證號,但是醫生關于癥狀的描述這些東西都是屬于非結構化的。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

我們從這個數據源接入,去挖掘這里面的知識,當然這其中有好幾類的知識。一類是事實與關系的知識圖譜挖掘、問答知識挖掘,網上有一些Q&A能夠自動挖掘出來,以及深度的知識挖掘。有了這么多知識怎么存儲管理?要根據我們了解的知識構建知識圖譜,根據醫學問答建立知識的索引,常識知識的擴展,還有共享這些知識。有了這些知識以后,怎么樣來做語義搜索?我可以說一句非常自然的語言,機器怎么樣來理解?患者用自然語言描述得了什么樣的病或者有什么樣的癥狀,怎么根據這個來幫助診斷?

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟程骉:智能醫療產業化應用的挑戰和解決之道

最后在應用層,有了所有構造以后,我們就能夠實現點對點的自動回復、健康管理、以及醫療隨訪。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟程骉:智能醫療產業化應用的挑戰和解決之道

我們通過建立知識庫和搜索,從醫生的角度可以自動問答還有隨訪,最后患者跟普通醫生建立信任。我們做了一個測試版的應用,是一個網頁版應用,跟一般的搜索不一樣,只要輸入一句話,根據這句話把主要的關鍵詞、實體找出來,我們會根據這個關鍵詞找到最好的答案,結構化的信息都會在后面顯示出來。比如這個問題是問糖尿病相關的,糖尿病是我們的關鍵字。另外我們把知識挖掘做成接口,API:包括文檔怎么解析,怎么把實體抽取出來,幫助我們建庫,另外還包括實體定義挖掘,包括概念化。之前微軟研究院發布了兩個相關的產品——Microsoft Concept Graph和Microsoft Concept Tagging模型,兩個都是幫助建立廣泛應用的醫學知識圖譜,建立比較專業的知識,而不是閑聊,這個是非常重要的。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

其中當然有很多的技術挑戰,不是一建立就非常好用的。一個是實體等價知識庫,比如,同樣的意思,拉肚子和腹瀉都是一回事,但是我們要讓知識庫里面有對應的關系。還有實體概念的知識庫,還有實體關系的圖譜,我就不仔細講了,其實還是有很多挑戰,不是一帆風順的。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟程骉:智能醫療產業化應用的挑戰和解決之道

微軟亞洲研究院洪小文院長在很多場合講AI+HI(Artificial Intelligence + Human intelligence),需要人來介入,讓機器更智能,這樣的學習管理工具也是幫助醫生把他們的專業知識放到我們的系統里面去,是同樣的道理。我們跟國內某三甲醫院神經外科合作了一個項目,給他們提供了微信的接口。這是幾個月之前做的,反響還是不錯的。

微軟程骉:智能醫療產業化應用的挑戰和解決之道

這個項目希望可以讓醫療的資源下沉,從三甲醫院慢慢下沉到社區醫院,讓社區醫院發揮更多的作用,讓三甲醫院的專家能夠發揮他們的最大作用,把他們的時間最有效地發揮出來。好,就先講到這兒,謝謝大家!

現場提問環節

新智元創始人楊靜提問:您的演講里面提到微軟也在做智能醫療方面的業務,IBM的沃森是一個典型的智能醫療項目,微軟的智能醫療項目跟它們有什么區別?您這邊的競爭優勢在什么地方?像云知聲也做智能醫療方面的項目,跟你們合作和跟IBM合作有什么區別?

程骉:這個問題非常大,我不能夠完全回答。我只能解釋一下我們這個項目的特點。首先,我們做的項目是非常本土化的,我們跟幾家中國醫院都有合作,溝通的過程中,我們發現一個很大的問題是國外很多的醫學詞語詞匯不接地氣,到這兒來完全沒法用。我們在跟醫院醫生交流的過程當中了解到中外醫學詞匯是很不一樣的,我們需要做很多的工作。

另外,微軟全球研究院還有其它跟智能醫療相關的前瞻性的工作,比如,我們的一組研究人員正在通過人工智能,利用機器學習及自然語言處理,幫助全球知名的腫瘤學家整理所有可用的研究數據,為患者找出最有效和個性化的癌癥治療方案;還有研究人員正在用機器學習配合計算機視覺技術,讓放射科醫生能夠更詳細地了解病患身體內腫瘤的變化情況,包括北京的研究團隊在癌癥、瘧疾圖片分析這一領域也做了很多年,取得非常好的成果。還有利用Kinect進行體感康復的項目等等。

從公司的層面,微軟也積極投身推動醫療行業數字化轉型,我們有相關的同事負責這個方面的項目。

楊靜:您的分享讓我們第一次知道微軟在智能醫療方面特別有企圖心。我們也知道,以前,一些美國的智能醫療技術在中國的本土化應用中的確存在一些障礙,特別是像對病例的解讀或者醫學文獻的解讀,它們在中文的理解方面是有一定的問題的。還有醫生和病人交互的過程中自然語音的交互以前可能也是一個障礙,因為沒辦法用中文來進行?,F在,微軟提供新的技術平臺,可能在這方面有更多的解決方案,對于助力中國的智能醫療在地的發展,相信會有幫助。

程骉:跟以往的努力不同,公司現在更多關注的是如何將人工智能技術,結合我們基于微軟云Azure的大數據處理能力,應用到健康醫療領域,提高醫務人員的工作效率和輔助診療。我們從這個項目開始做一些相關的努力,包括剛才您提到的語音識別,一般的詞匯語音識別我們做的還是不錯的,準確率非常高。但是碰到醫療詞匯如果沒有這些醫療名詞在庫里面的話,其實機器是完全不懂的。我們也是希望由點到面慢慢擴大,從而做得更好。

楊靜:微軟在這方面的優勢,微軟亞洲研究院首席研究員周明老師是候任的ACL的主席,鄧力老師、俞棟老師,還有黃學東老師都是在世界上頂級的語音方面AI專家。你們的技術一定能突破以往的瓶頸。不知道在座的嘉賓有沒有對微軟智能醫療的問題?

浪潮集團高性能服務器產品部總經理劉軍:今天非常榮幸參加新智元百人會,我是浪潮集團劉軍,負責高性能計算這塊業務。我們在AI里面主要參與是作為后端計算設備的供應商,現在中國60%的Deep Learning服務器都是浪潮提供的。我今天非常感興趣的一點是:微軟在整個醫療這塊跟AI結合有沒有一個大的藍圖介紹?在影像這一塊,浪潮的客戶里面有很多對于AI和精準醫療結合有很多的需求,想了解微軟在這一塊的整體布局。

第二個問題:您這邊也是創新孵化的負責人,微軟做的非常好的產品和技術,有沒有可能跟業界其它的公司比如像浪潮這樣的有合作?

程骉:首先微軟在醫療方面的整體布局我不敢說。但從研發的角度,之前我也提到了,全球而言,微軟研究院其實有好幾個團隊都在做相關的研究。除了北京的團隊之外,位于雷德蒙總部、英國劍橋,以及以色列的團隊各自從不同的側面進行相關研究,有些是醫療設備相關的或者是跟測量設備有關的,也有做圖片分析的等。當然,微軟在助力醫療產業數字化轉型方面有著相應的規劃,這個需要我們負責數字化轉型的同事來跟大家分享細節。

我們這個研究項目的著重點是怎么來落地,在中國落地是非常難的事情,從技術角度來講微軟有很多年的積累,包括楊老師也提到在自然語言理解方面,包括圖象識別、計算機視覺和視頻的分析,這些方面我們其實技術上已經做得非常好了,但是怎么樣來落地?借由一個項目能夠把它由點到面做起來,有很多實際的困難。

對于跟浪潮或其他廠商的合作,因為我們跟銷售部門也會有一些對外合作,所以如果有好的結合點,一定會往前推進以達到雙贏。

紅杉資本中國基金華東區總經理魏洪波:很榮幸參加這個活動,之前通過楊靜總介紹,我對新智元專家群里也有一些了解。我們目前的業務以醫療語音助手為主,之前我們看到國內基于語音的公司有小i機器人,還有其他公司都在切銀行和典型等,那么大家會是To B還是To C,怎么看待這兩個不同市場的機會?

醫療這個領域并不太市場化,買單的人不太清晰,這個業務未來能快速變現還是未來也會去切像電信甚至電商作為語音助手這類的商業客戶,我們怎么看待未來市場的商業延伸價值?

程骉:不同的聽眾問的問題角度果然都不一樣,微軟很多部門都做跟語音相關的研發,包括小娜團隊,他們會從市場角度去看看有沒有這樣的應用場景能夠幫助我們的語音技術實現應用。實際上,不同的行業我們都在切入,有很多的需求。我們目前的這個項目主要是To B的,你剛才說的點很重要,變現并不會那么快,但作為技術研究者,我們這個項目更注重的是怎么把這個技術實際應用起來。微軟是一個技術平臺公司,我們當然是希望我們的技術能夠助力更多的企業和機構,能夠落地真正起到一些作用,解決實際問題。

愛奇藝首席科學家王濤:醫療確實跟每個人息息相關,去醫院看病病人太多,掛號非常難掛,對于醫生來說時間非常有限,看一個病人五到十分鐘。這個應用怎么來運營?幫助你掛號的APP有了,有些網站醫生可以在線問答。咱們運營的模式是什么樣的?完全是機器人助手,還是有醫生在線上跟病人交流互動?有些病癥看著都非常相似,但是真正的病因不同。比如,最近我小孩感冒了,不??人?,去看病說血象正常,開了一些藥不好使,后來又試,說這就是過敏性咳嗽。一個咳嗽可以看出來里面病因很難找,有時候不太好辦。從技術上來說,比如傳統醫生望聞問切,我們怎么把測試的數據還有狀況準確客觀地反映出來?

程骉:非常好的問題,說到運營的模式,落地一定要解決這個問題。微軟這個項目之前有很多積累,包括知識庫建立、標簽,這些技術都有。但是落地的話,從市場部、銷售部那邊有一些醫院的客戶找過來,我們也去聊,聊完之后發現這里面的需求非常大,真的是剛需。我剛才提到那么多的痛點,不管是患者、醫生,還是政府都有很多的痛點,我們現在具體做法是:跟醫院合作,也跟政府合作。我們跟醫院和政府來談這個事情,把這個技術給他們。這個項目本身是To B的,我們不是讓病患直接去問問題得到答案,我們定位為輔助助手,實際給醫生去提供一些參考,跟你直接到網頁上搜索效果是不一樣的,它會非常專業,我們是專門建這樣的知識庫,希望起到這樣的助手作用,能夠真正幫助解決這些痛點。

【編者按】本文轉自新智元。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到