谷歌Waymo與DeepMind合作,開發出新訓練方法提高自動駕駛訓練質量和效率
兩家公司最終希望訓練出一個能夠保持99%以上的總體障礙物識別率,并且減少誤報的AI模型。
Alphabet旗下的兩家公司終于合作了。
日前據媒體報道,Alphabet旗下的Waymo公司和DeepMind公司進行了合作,他們開發出一種模擬進化論的新訓練方法,以此提高訓效率和質量。
首先要知道一個AI算法模型是通過成千上萬次的實驗來自我改進的。通常工程師會給一個模型制定一個任務,模型通過多次實驗以及收到的反饋來進行調整,然后學習并執行任務。執行任務的表現主要依賴于訓練方案,因此對于研究人員和工程師來說,尋找最合適的訓練方案是其主要工作。他們會精心挑選接受培訓的AI模型,將表現差的模型剔除并釋放資源,然后從零開始訓練新算法,這需要消耗研究人員和工程師的大量精力與時間。
據悉DeepMind基于PBT(基于人口的訓練)中設計出了一種勞動密集度低的方法,該法法從隨機變量生成的多個機器學習模型開始。模型會被定期評估,多個機器學習模型之間則會以進化的方式互相競爭,表現不佳的模型會被“進化”更好的、表現更好的模型副本取代,這個副本則被稱為“后代”。每個后代會繼承父網絡的狀態,因此PBT也就不需要從零開始重新訓練,而整個訓練過程中,后代將會積極更新超參數?;诖?,最終PBT可以將其大量的資源用來訓練“好的”超參數值。
不過PBT也并不完美,這種方法側重于短期、當前的優化,但并不是從長期出發,因此不利于后期發展的AI模型。為了解決這種情況,DeepMind的研究人員又培育了大量模型(人口),并創建名為“利基”的子人口,算法只會和其自己子群中的模型競爭。
目前,DeepMind和Waymo已經將PBT應用到AI對行人、自行車和摩托車的識別任務,希望以此來檢驗算法是否能夠得到進一步提升。對于測試結果,Waymo表示PBT算法的精度更好,與手工調整的等效物相比,誤報率能夠減少24%,并且識別率仍然能夠維持比較高的水平,此外該算法還能夠節省時間和資源。Waymo稱,已經將PBT納入了Waymo的技術基礎架構,公司的研究人員可以通過點擊按鈕來應用該算法。
兩家公司最終希望訓練出一個能夠保持99%以上的總體障礙物識別率,并且減少誤報的AI模型。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
