AI總會有低潮,但為什么科學家們一直有快感?

鎂客 8年前 (2017-08-29)

攻克技術難關本身就是一件很有成就感的事情,那當然也是很有快感的事情。

自1956年,4位年輕的美國科學家提出“人工智能(AI)”的概念以來,在長達61年的發展中,AI更是歷經了“三起兩落”的曲折歷程。

在這期間,有對技術盲目崇拜的瘋狂,也有對未來充滿疑惑的低潮。不過從總體上看,我們還是可以說人工智能一直在螺旋式上升的狀態,其中有一些技術甚至對社會的很多相關行業都產生了重大影響和顛覆(具體請見文章:「深度」跨越一甲子的AI已在何處迎來爆發?16位頂級專家給出了答案)。

由此,也引發了業內對人工智能的眾多思考和期待。

AI總會有低潮,但為什么科學家們一直有快感?

郭延文 南京大學計算機系教授

南京大學計算機技術與科學系教授、博士生導師,計算機軟件新技術國家重點實驗室的郭延文,一直致力于計算機技術方面的研究,對目前最熱門的AI和VR相關領域有著深刻而獨到的見解。

郭延文認為,終極狀態下的人工智能,借助VR的強力和全面加持,將會讓人類無所不能,甚至人們進入虛擬現實也不再需要任何介質。那時,誰都可以隨時將自己置身于一個包括視覺、聽覺、觸感和嗅覺全體感的虛擬環境中,而不用借助人體器官的感覺。

做AI技術研究這么枯燥,科學家會有快感嗎?

據研究表明,人的感覺器官中接受信息最多的是視覺器官,視覺信息占大腦接受外部信息的80%,AI的研究是為了讓機器像人一樣智能,為了達到這個目標,讓機器能夠像人一樣通過眼睛觀察、理解和感知現實世界就尤為重要,這就是計算機視覺的研究范疇,是AI應用的關鍵技術。

郭延文教授和他的技術團隊一直以來都在做計算技術方面的研究,在常人眼里這是一份會枯燥而乏味的工作。自然,從事這項工作何來快感?

AI總會有低潮,但為什么科學家們一直有快感?

事實恰好相反,科學家的快感始終是滿滿到讓人羨慕的!

他們的快感來自于攻關克難的過程。

郭延文說:“在計算機科學領域,我做兩個方面的研究,一個是計算機圖形學與虛擬現實,另一個是圖像視頻處理和計算機視覺。

“做圖形,就是在計算機中把我們看到的現實世界進行建模,然后把它繪制出來,就像你打的計算機游戲、看的三維動畫電影等,都是借助計算機圖形技術生成的;另外的圖像視頻處理和計算機視覺,作為人工智能技術重要的落地場景,比如說視頻里的人、車和物的檢測、家里門禁系統的人臉識別等,都非常具有現實應用價值。”

從這個層面上看,在做這些工作,從過程到結果,相對于其他技術門類來說似乎顯得更形象、更直觀。但是,其中仍然不乏大量的枯燥內容。

“話又說回來,這一領域里畢竟也有很多偏向于基礎理論方面的研究,比如說理論計算機科學、量子計算等等。我也有多位同事從事這方面的研究,在外人看來這多少略顯枯燥,然而專注于這方面的科研人員、科學家,他們對自身領域的感情,那絕對都是真愛!

“就像偉大的數學家發現數學之美,我們也能發現計算之美,大家都很享受研究的過程。另外,攻克技術難關本身就是一件很有成就感的事情,那當然也是很有快感的事情。”

如果一項技術遲遲未能突破,科學家會鳴金收兵、偃旗息鼓嗎?

很顯然,這是個尷尬而難堪的話題。

數學史上最著名的“無解難題”之一、由法國數學家皮耶·德·費瑪在17世紀30年代提出的“費馬大定理”,就是一個典型的案例。這一定理在提出之后,憋死了無數英雄好漢!直到三百多年后的1995年,才被英國數學家安德魯·懷爾斯徹底證明。

AI總會有低潮,但為什么科學家們一直有快感?

幾乎在任何人的生活和工作中,失敗或是挫折總是不可避免的。對此,郭延文也有著自己的切身體會:“說一個典型的例子吧。前年我們做了一個借助航空攝影進行三維場景重建的科研項目,用無人機為城市、工廠和港口等做三維實景建模,我們研發了國內第一個自帶操作系統的航空攝影器材。記得有一次進行實驗的時候,無人機在天上拍了一圈,落地后我們發現,系統盤里竟然一張照片、一點數據都沒有!

“我現在還清楚的記得,當時大家的看到之后,心都涼了......心想是不是系統設計方向錯了、理論模型有缺陷?......那種蒼涼、失望,以至于懷疑人生的感覺,到現在仍然記憶猶新。”

不過,我們相信,在成功的解決了問題之后,那種絕望的經歷就成了科學研究路上美麗的墊腳石。

因此說,做研究的很多時候很難設定一個時間表。但是研究也是有時效性的,如無人駕駛技術,很多巨頭都在做,這里的各種研究大概都是有時間表的。如果說你慢了,就會被別人超越。

所以,這一般也是學術和產業的區別。

計算機視覺完全達到甚至超過人眼,我們還要等多久?

眾所周知的是,目前計算機視覺在一個特定場景下的特定任務,已經達到和超過人眼的水平。比如正面的人臉識別,已經有一些較成熟的算法了。

AI總會有低潮,但為什么科學家們一直有快感?

不過在一般環境下的場景,計算機視覺技術距離人眼的認知水平還有較大差距。

郭延文說:“計算機視覺跟人眼的差距主要在兩個方面。一個是信息的采集。人眼是天然感知深度的,對環境、光照等具有很好的魯棒性。但是計算機視覺是通過配備的攝像設備實現的,單目視覺對視點和光線等的變化以及復雜環境的魯棒性較差。”

“第二就是對信息的歸納和推理,雖然目前人工智能技術已經有了很大發展,經典學習理論和深度學習技術等也在不斷進步,但相比人類歸納、聯想和推理的能力,還有很大的差距,從而也造成了計算機視覺和人眼認知的較大差距。”

但是我們相信,隨著大數據、人工智能的發展,其距離人眼視覺的差距將會越來越小,并最終實現超越。

擴展:自在特殊情況下,如強光、相似障礙物(如一群讓人眼花的斑馬)等,如何實現準確的視覺識別與處理?

這兩個場景下的問題,是傳統的基于可見光的圖像處理領域,比較難以處理的問題。

不過現在的圖像處理技術已經開始在做基于RGB-D的、含深度圖像的分析和理解。如強光或陰影環境下,如果沒有深度信息,計算機經常就會識別不準。但是如果有了深度信息,那計算機的各種算法、處理就會工作的更好。

另外對于相似障礙物,也是一樣的道理。

就像手機來說,以后大家的手機應該會逐步標配含有深度感知功能的攝像頭了。

在VR的加持下,終極的人工智能將會讓人類自由穿梭時空

計算機早期叫計算器、電腦、微機等,人工智能就是讓機器具有像人一樣的智能。近些年由于大數據、機器學習、深度學習等的興起和發展,計算機和人工智能都到了很高的水平。

AI總會有低潮,但為什么科學家們一直有快感?

“我所設想的,他們的最終形態應該是計算機或者機器,具有像人一樣的智能,能夠用我們所能想到的各種方法,讓我們人類的生活更美好。再加上虛擬現實,未來你想干什么、想要什么,計算機都能幫你實現。”郭延文說到。“人們進入虛擬現實也不再需要任何介質,隨時可以將自己置身于一個包括視覺、聽覺、觸感和嗅覺全體感的虛擬環境中。最終讓人不想區分哪里是現實、哪里是虛幻,這種似夢非夢的感覺肯定會棒極了!”

由此再加以延伸的話,我們是不是可以這樣理解:在虛擬現實的加持下,終極的人工智能將會讓人類自由穿梭時空?

比如你要去火星又坐不起航天飛機,那就來個虛擬現實吧,它會讓你“想到就到”。剛開始,你還想著動動手腳,走兩步或者觸摸個什么東西。到后來,如果加入腦神經觸發等技術,你根本不用動,就能完全實現諸如走動、觸摸等各種由肢體或器官帶來的感覺。

到了那個時候,物質的存在似乎就不那么重要了。

VR和AR是一對手足兄弟,誰也不會取代誰

近來,業內一直有觀點稱,今后AR將取代或吞并VR,因為人們更喜歡在真實的場景中實現VR的各種效果。事實真的是這樣嗎?

對此,郭延文教授有自己的理解,“VR和AR各有各的用途。VR主要應用領域包括文化教育、數字娛樂、醫療、科學仿真等等;對比來說,AR的話,看到現實場景,利用VR技術,用虛擬物體去增強我們對現實世界的觀察和感知。它的意義不僅僅是對場景的顯示,更重要的是對現實世界更強化的理解和認知。而要做到這種理解,就必須要用到人工智能技術,如計算機視覺、圖形圖像識別等。”

這樣來看,我們很難斷定VR和AR誰會取代誰,只能說二者在未來會在各自特定的領域和行業內實現越來越多的結合,從而獲得更大的發展。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到