智能時代將由大數據、和算力二者驅動,為什么這樣講,這一撥AI熱潮的興起有三個關鍵原因。
一是通過物聯網和移動物聯網等技術的大規模普及應用,大數據的爆炸式增長成為常態,產生了大數據燃料。隨著互聯網、移動互聯網和物聯網的高速發展,可以說已經構建了地球人類文明以來最強大的知識庫、數據庫和記憶庫,然而大數據燃料還在源源不斷地補充。
二是得益于強化學習和深度學習算法設計訓練的突破,在機器學習和智能算法層面進行了極大的拓展,讓機器學習算法得以走出實驗室,應用于工業界。這也是通過大數據分析預測解決不確定性問題的可行路徑之一,大數據條件下的多方博弈和復雜性預測問題,越發難以應用傳統數據建模技術加以解決。
由于客觀世界的復雜性和大數據的相關性,傳統人工設定的淺層學習模型和編程規則更是難以應用于大數據挖掘分析和預測,而神經網絡的再次崛起已經讓機器緩緩睜開了眼睛,不僅能看圖說話還能聽會道,初步具備了對外在環境的感知能力。
三是GPU計算設備的普及,為大規模深度學習提供了強有力的計算資源。
數據:智能燃料如果大數據智能是我們要飛抵的AI星球,那么大數據就是火箭燃料,數據是智能系統與環境交互的第一手資料。AlphaGo為什么能在短短幾個月時間內學會圍棋,而且戰勝了人類頂尖棋手?歸根結底,離不開棋譜大數據的支持(初期版本),短短幾天就能學習和對弈上百萬盤棋譜,而人類頂尖棋手一輩子才下多少盤棋?人類的成長是一樣的道理,幼兒經過幾百天的數據訓練,而且是在看到的物體、聽到的話語等輸入數據很有限的條件下,就能激發大腦里的神經網絡,形成基本的聽說經驗和學習能力。
算力:智能加速大數據智能的成功,數據、算法和算力,一個都不能少。自從深度學習于2012年大放異彩以來,GPU計算走入我們的生活并日益普及,從此大規模深度神經網絡的訓練再無大的性能瓶頸。最早的神經網絡已提出了數十年,為什么現在才能大規模應用,這跟計算機的高性能處理能力有莫大關系。大數據的處理離不開高性能計算(High Performance Computing, HPC),其核心目標就是解決算力這一根本問題,這些是實現大數據智能的必備要件。