深度學習應用系統分析:應用組合和形態矩陣找到正確路徑

鎂客 9年前 (2016-11-28)

對深度學習研究和應用的興趣從未這么熱過。深度學習最迷人的地方是,神經網絡似乎能夠解決以前只能用定制方法解決的各種問題。

深度學習應用系統分析:應用組合和形態矩陣找到正確路徑

【導讀】本文收錄了arXiv.org上關于深度學習的一些最新的研究論文,列出了這些文章的內容,包括“深度學習八大靈感應用”、“深度學習用例”、“科學與工程中的深度學習應用”、“深度學習應用程序的下一次浪潮”等。針對這些文章缺乏系統方法的問題,提出了具體的組合矩陣、形態矩陣解決方案,并給出了預測示例。

隱藏的潛力

對深度學習研究和應用的興趣從未這么熱過。幾乎每天都可以在arXiv.org找到無數的新研究論文。這些論文為我們描述了新的方法,人工神經網絡可以靠這些方法應用于我們日常生活的各個領域。深度學習最迷人的地方是,神經網絡似乎能夠解決以前只能用定制方法解決的各種問題。

此外,每天都會出現新的文章或博客,告訴我們更多奇特的應用深度學習的方式。這些文章、博客甚至書籍的問題是,它們不對神經網絡應用程序進行系統性的處理。至少到目前為止,我還沒有看到有人這么做。如果你知道有人這么做過,請告訴我。

最先進的方法

在搜索這篇文章的材料時,我發現了一些總結深度學習應用程序的文章。下面是來自那些文章的許多引用與相關鏈接。

1.第一篇文章是 Jason Brownlee 發表的深度學習八大靈感應用”,來自博客 Machine Learning Mastery。

下面是這些應用的列表:

1. 黑白圖像的著色。

2. 添加聲音到無聲電影。

3. 自動機器翻譯。

4. 照片中的對象分類。

5. 自動手寫生成。

6. 字符文本生成。

7. 圖像字幕生成。

8. 自動游戲。

正如上表所列的,這些應用都可以歸到聽覺、視覺和空間這幾種感覺模態,這些模態也是人工智能研究最初得到應用的地方。

2 ,第二篇文章名為“深度學習用例”,來自專門用于Java的Deeplearning4j 機器學習庫網站。

深度學習應用系統分析:應用組合和形態矩陣找到正確路徑

和上一篇一樣,我們可以將這里的所有應用程序歸類為聽覺,視覺和空間三種模態。其實并不存在空間模態,但出于一般性的考慮,我用“空間模態”來指代對序列的處理。

3 下一篇是為John Murphy的“科學與工程中的深度學習應用”。本文介紹了和前面幾篇類似的深度學習應用,但也提供了另外一些奇特的應用,例如科學實驗設計、高能物理和藥物發現方面的應用。

4.此外,我想提及“深度學習應用程序的下一次浪潮”這篇文章。文中充滿各種最奇異的、你可能聞所未聞的應用程序。例如:天氣預報和事件檢測、用于腦癌檢測的神經網絡。

5,最后一篇文章來自 Quora,是關于深度學習應用程序的一組問答。

上面所有這些文章缺乏的是系統方法。這種系統方法不僅描述深度學習的當前應用,而且能夠預測未來的可能應用。

組合矩陣

我建議使用組合矩陣:所有當前的深度學習應用程序可以從矩陣中推導出來,該矩陣還具有提示未來應用程序的優點。

在該矩陣中,每一行和每一列都枚舉出了各種類型的感覺模態,這樣,我們可以在矩陣中找到任意兩個感覺模態配對后的選項對,例如,語音 - 圖像識別便是一個這樣的選項對。矩陣中的每一個選項對都可以根據當前或未來可能的深度學習應用來解釋。

深度學習應用系統分析:應用組合和形態矩陣找到正確路徑

預測示例

如果我們看第4行、第B列,將找到來自音頻模態的“語音識別器 - >語音生成器”選項對,這可以被解釋為從語言到語言的翻譯應用,例如Google翻譯。此外,如果我們選擇第6行,第D列,將找到“圖像識別器 - >圖像生成器”,這正是arXiv.org上的深度卷積逆向圖形網絡論文背后的想法。

可以看出,該矩陣中的可能選項對的總數是 12 *(12-1)= 132。一般而言,選項對總數為 N *(N-1)。

如果我們想要構思一個新的應用程序,我們可以系統性地遍歷矩陣并尋找新的選項對,或選擇一個隨機的選項對,例如第4行和第H列,將得到“圖像識別器 - >自然語言生成器”。它可能是這樣一個應用:讀取對著手機攝像頭說話的人的唇語,并生成文本發送到另一應用。當身處嘈雜環境時,這個應用程序會很有用。(想法來自這鏈接)。

注意,我這樣組織這個矩陣,只是為了舉例子方便。也可以用其他方式來組織矩陣,那樣就會產生其他的深度學習應用的可能組合。此外,該矩陣可以是多維的,以便考慮各種參數組合。

形態矩陣

嘗試預測深度學習應用的另外一種方法是,使用由加州理工學院的瑞士天體物理學家 Fritz Zwicky 開發的形態矩陣法。順便說一句,這種方法已經成功地用于預測中子星的存在。在瑞典形態學學會的網站上,可以找到關于形態矩陣及其應用的詳細解釋?,F在,我們只需知道,該矩陣是以這樣的方式構成:其第一行具有各種感覺模態,例如聽覺,視覺,觸覺等,其余的行則為這些模態提供可能的選項。下面的屏幕截圖將有助于澄清這一點。

深度學習應用系統分析:應用組合和形態矩陣找到正確路徑

預測示例

既然我們有了形態矩陣,我們就可以把深度學習應用看作一個模態選項的集合。例如,當我們從表格中鎖定“語音識別/生成和圖像識別”這個選項后,我們就可以理解 2016年11用 16日剛剛提交到 arXiv.org 的《在野外環境讀取唇語》這篇最新的深度學習應用論文的本質。

請注意,此矩陣可以以其他方式組合,以產生深度學習可能應用的不同組合。

結論

正如本文所示,通過組合和形態矩陣來系統地尋找深度學習以及一般意義上的機器學習應用,這是可能和有效的。

【編者按】本文轉自新智元。文章來源:gettocode,作者:Andrei Cheremskoy。編譯:朱煥

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到