吳恩達:深度學習革新人工智能


2015-04-20 14:31:31   出處:中國信息主管網-中國信息化周報   作者:   
 毫無疑問,這是一個好的時代,也是充滿挑戰的時代,挑戰來源于我們這些國內的IT企業是否已經做好了迎接這個時代的到來準備。

  最近,有新的人工智能技術出現,我們把它稱為深度學習,深度學習不僅會為互聯網IT公司帶來巨大價值,人類也將因此迎來巨大變革。

  
人工智能的迅速發展

  現在,三個領域正在發生重大的創新,一個是圖像,第二個是語音,第三個是行為。

  圖像 新的人工智能技術的出現,使計算機學習了更多人類的神經系統,更好地解決了譬如圖形識別的問題。若想真正把深度學習做好,就必須要了解人腦在做什么,人腦當中發生了什么。然后我們使用這些計算的結果和海量數據,從而獲得更好的計算機視覺,做更好的辨識。

  為什么人工智能在最近幾年才獲得比較快速的發展?

  我們以如何構建火箭為例,火箭構建中很重要兩件事情,一個是發動機,另外一個是燃料,兩者比例配合得當才能夠確保火箭準確地發射到軌道當中。這給我們深度學習也帶來了一些啟示。巨大的神經網絡每天都在發生著巨大的活動,我們在深度學習的過程當中就像發射火箭那樣,人們的活動多數都是圍繞著其手機和電腦來開展的。我們如何利用這種新的情況呢,或者新的環境更好地幫助我們了解巨大的神經網絡呢?

  當今社會越來越多地進行數據化或者數字化。在很多年前,當深度學習這個概念剛剛開始的時候,更多的是使用CPU技術,構建小的神經元網絡只有100萬或1000萬的連接,我所說的是計算機連接的數目。之后我們取得了一些進展,其中在2008年,GPU技術的發展,讓我們看到它的連接數目也發生了巨大的增長。GPU是手機上、平板上的硬件,作用是幫助做計算,有些人就意識到了硬件對加速深度學習的重要性——我們借助GPU可以構造越來越大的神經元網絡。在往后,我們看到了更多大規模的發展,像谷歌的深度學習項目,使我們更多地了解相關的知識,我們有了更多的云,更多的CPU來推動相關的發展。現在我們看到的,我認為這也是下一階段的趨勢,就是我們要從云技術或者說僅僅利用純技術跳到HPC (High Performance Computing,高性能計算)。HPC和云,這可能是兩個比較分離的社區,研究云和研究HPC的人也是兩類人。隨著云技術的發展,你可以同時使用上千臺計算機,不用擔心這么多計算機會發生崩潰。而HPC技術比較小數目,但卻是更貴、更高性能的硬件,而我們也認為這對于我們構造更好比例的“火箭引擎”也是更佳的一個解決方案。

  和其他公司相比,例如谷歌、臉書,他們的“火箭燃料”(數據)比我們多。但是我們在發動機上的投資比他們多,這給我們帶來了巨大的好處。我們在發動機和燃料的比例方面要做得好才能確保這是一個好的火箭,我們正在發動機方面進行大量的投資,所以我們才在人臉識別領域和其他領域比其他國際上領先的大公司要做得好,我們在人臉識別只有0.3多的錯誤率。

  語音識別 我們過去是用鍵盤來敲字,這是比較浪費時間的,現在大家用語音進行溝通,所以語音識別是一個非常重要的發展方向。

  而大家現在普遍反映在手機上進行語音通信時,如果手機離得較遠,效果不是很好,要比較近時語音識別才做得比較好。我們在相關的IT技術方面也做了一些探索,從傳統領域來看,這是語音識別所做的事情,基本上所有做語音識別的公司都是使用非常復雜的管道——改善語音系統,突出聲音特征,做一些不同的模塊組合起來識別這個人到底講了什么。

  現在,我們把所有這些東西用先進的人工智能技術替代掉,用先進的深度學習技術進行替代,這就是百度的深度語音,也是我們的火箭發動機。百度還將用1萬的數據集進行人工智能處理,這就是我們的火箭燃料。這些研究結果是不可想象的。

  人們之前從來不會想到能利用這么多的數據,我們使用神經元系統以及數據燃料可以極大地提高語音識別的準確性。在百度,我們已經看到了使用語音識別的用戶越來越多了,然而在這個領域,我們還有很多需要提高的。很多人低估了語音識別95%的準確率和99%的準確率的差別。如果我們能夠做到95%,也就是今天的狀況——你說話要非常清楚,而且要離話筒非常近,必須這樣才能識別出來。如果我們將來能做到99%的準確率,我們甚至可以把所有手機的接口做重新的設計和修改,使我們更加習慣于語音通話指令的發送方式,從而推動這個領域的革新,到那時你手里的東西也將不是傳統上的手機了。

  在手機之外,我認為語音識別還會推動物聯網的革命,從汽車界面到家用設備再到可穿戴設備將會發生很多的改變。遙控電視、遙控空調等是不夠的,在未來幾年,我們將能夠和電視通話,和更多的家電通話,這將是未來面臨的發展,我們將有很多的路由器內置到這些機器當中。

  行為 我們看到很多技術公司現在都能夠獲取到一些大數據來了解人們在互聯網的環境中究竟是什么樣的行為,這是技術的發展。我們可以從這些數據中挖掘更多的價值。正如很多人都知道的,百度的廣告在人工智能方面也下了很大的工夫,我們搜集了很多關于人的行為的數據,而這些深度學習可以使我們了解人們的行為——他們傾向于做什么事情,他們喜歡做什么事情。因為我們的數據中心還有很多其它數據搜集起來,使我們了解不僅僅是人的行為,還有機器的行為,從而使我們更好地管理數據中心,提高安全性。美國、中國和歐洲現在越來越多地使用深度學習來了解人的行為、機器的行為,在IT世界當中以及IT世界之外挖掘更多的機會,這也推動了我們未來的成功。

  趨勢、機會和挑戰

  人工智能的循環發展是非常迅速的,15年前,我們提出AI人工智能的良性循環。那時我們認為如果構造優秀的產品就可以吸引更多的用戶,有了更多的用戶就可以獲得更加大量的數據。事實證明,現實就是這樣。

  而我們以前想過但還未發生的事情就是把更多的數據通過人工智能被更好地利用,推動更多的優秀產品被生產出來,這是我們在最近幾年才做的事情。如今現實情況是我們的火箭引擎已經不夠大了,而燃料卻越來越大,所以不能深度地利用這些數據。而深度學習之所以能給我們帶來更多的價值是因為我們現在可以從越來越多的數據當中受益,開發越來越多的潛能。深度學習確實會改變我們的生活,改變傳統的人工智能,使我們最終可以把 “發動機”和“燃料”的連接做得更好,把產品、大量用戶和海量數據之間的連接做得更加通暢。

  雖然之前我們主要關注了圖像、語音和行為,但是對于人工智能的機會來說遠不止這三個方面,譬如自然語言的處理方面以及在生物技術方面的人工智能,這些創新都在發生的過程當中,人工智能也可以更多地被應用到機器人的開發。

  百年前的工業革命在當時推動了一些新技術的發展,未來的工業革命將把人們從日常重復繁重的工作當中解放出來,把人性解放出來,把人的思想解放出來,使人們不再成為思想的奴隸。我很期待未來的發展,當人力、大腦和思想被解放后,我們能做的事情將更多。

  (本文系根據吳恩達博士在“2015深圳IT領袖峰會”上的演講整理而成)

責任編輯:侯沁

相關熱詞搜索:深度學習 人工智能 IT

上一篇:吳秀誠:暢談企業郵箱發展趨勢
下一篇:索為系統:打開兩化融合突破口

分享到: 收藏

專題

more>>

中國軟件園區發展...

當前,我國經濟已由高速增長階段轉向高質量發展階段,..

第三屆中國大數據...

2018年12月11日下午,作為第十一屆中國信息主管年會的..
Email:

藏經樓

more>>

論壇熱議

more>>
欧洲超级杯