科大訊飛副總裁于繼棟
年初,2018深圳機器人創新與發展論壇在深圳威尼斯睿途酒店隆重舉辦,本次論壇以“創新驅動灣區智造”為主題,來自全國機器人及人工智能領域產業上下游的精英大咖、專家學者齊聚一堂,共同探討推動新的一年機器人產業在技術、應用、金融和服務等方面的創新應用。論壇上,科大訊飛副總裁于繼棟以《智慧AI,智享未來》為題演講,現將全文發布,以饗讀者。
經過2015年到2018年三年時間,從數據上能夠看出整個機器人產業已經進入了高速發展的狀態,未來三到五年內,機器人非常有可能達到萬億級規模。智能機器人是人工智能一個非常重要的載體,因為提到人工智能,所有人的第一反應就是有各種各樣的人形機器人,所以機器人本身就是一個AI在物理世界的載體,機器人時代可能凝聚了這樣四種不同層面的智能,包括運動智能、感知智能、運算智能、認知智能,現在人類比機器人厲害很多的地方在于認知這一塊,但是認知智能最近幾年一直在快速地發展,相信很快就會取得成果。
現在業界有兩個通用的方向,第一類是用現在DNN算法加上大數據,加上一些專家知識,從而形成一些在不同行業不同場景下快速應用的人工智能方案,第二類是如何運用算法去模擬人的大腦,使得AI完全像人一樣的去思考和決策。各個企業和機構還有科研單位都在不同的方向探索,科大訊飛其實也在這兩個方向都有各自的布局。
人工智能有三級推進體系,第一層是基礎算法,就是過去DNN到CNN、到現在的JNA、RNA的算法,第二層被稱之為技術體系,是把通用的算法通過數據、結構化、決策組合成的一套技術體系,第三層是應用體系,是技術的落地場景應用。科大訊飛在過去十幾年建立了非常行之有效的算法、技術、應用推進體系,在最近幾年整個AI的發展中也獲得非常多的成績,包括科大訊飛在去年參加的最權威的語音遠場識別技術比賽,獲得了全球第一的成績。
現在深圳機器人廠家幾乎90%以上都在用訊飛的遠場識別方案,其中六麥克風陣列方案去年已經發布,現在有很多的合作伙伴在用這樣的方案了。另外,科大訊飛在語音合成、語音識別、圖象識別、自動駕駛圖像識別技術上也紛紛取得了世界第一的成績。AI通過現在的算法已經達到了普通人的說話自然度,未來可能做得比普通人還要更好。
另一方面,科大訊飛在認知方面也獲得了很大的進步,但全世界范圍內人工智能的認知領域還是遠弱于正常人。認知技術非常難,也是人工智能取得突破的非常關鍵一點,所以現在各個領域也都在嘗試這樣的一些技術,相信隨著技術的進步,這一突破很快會產生,從此可以讓機器人真正地自我學習、進步。
實際上,在認知學習的一些領域,尤其在特定的一些專家領域,人工智能已經獲得很大的進步。例如科大訊飛在國家醫師資格考試領域實現了機器人可以通過學習試卷、書籍上的知識后,和人一樣參加考試,并且取得了前一百名這樣優異的成績。同時,科大訊飛也成為首批國家新一代人工智能開放創新平臺,這得益于訊飛從2010年開始到現在為止將近七年半時間,持續地把最先進的技術開放給合作伙伴。
從數據上來看,2017年年底該開放平臺上的合作伙伴達到了五十萬家,在深圳這樣創新聚集的地方已經超過了三萬家合作伙伴在使用科大訊飛的技術;另外活躍的終端也達到十五億,每天的語音交互次數達到四十億。
以科大訊飛輸入法為例,去年平均每個人每天在訊飛輸入法上使用的次數達到15.2次,這個數據在前年大概只有7次。可以看到隨著語音能力的提升,大家用語音的頻次也在快速地增長。而以機器人終端,每天平均交互次數達到了53次之多,機器人已將成為人工智能典型的載體,它在未來還可能成為人機交互最主要的智能終端。人類90%的信息來源于視覺,但是80%的信息輸出都是靠語音。所以機器人需要非常強的語音交互能力才能夠實現跟人類自然地交流,幫助人們解決問題,或者創造新的生活方式。
科大訊飛開放平臺對開發者的支持也是業界最豐富的。從軟件,到芯片,到軟硬一體化,包括一站式整體解決方案,包括在2017年6月發布的成品級解決方案MORFEI,使得開發應用的門檻大大地降低,開發速度大幅度提升。2017年10月科大訊飛發布了新一代AIUI開放平臺2.0,解決了開發者很多的“痛點”,包括開發升級、輸入輸出多樣化、語義聯系、個性化等,現在平臺已把一百多個技能、六十多個內容開放給合作伙伴。
科大訊飛希望將開發分成兩類,一是原來的應用開發,二是通過他們的能力去創造一些新的技能和新的內容發布在科大訊飛的平臺上,然后共建一個開發者生態。未來每個應用開發者都能夠獲取到遠不止一百個的內容,甚至是幾千、幾萬乃至更多的內容。
科大訊飛希望開發者能夠快速地構建自己的應用,并且成品級解決方案MORFEI已經有快速集成的案例。為此,科大訊飛在云端增加了一些能力,希望通過云端框架,實現云和端的聯系,讓開發者能夠快速的接入。AIUI把過去的所有的單點能力組合在了一起,科大訊飛希望AIUI通過持續地迭代、集成,讓開發者未來只要集中關注他們的工作就可以了,而不用去關注如何使用單點技術。
過去叫極客時代,現在則進入產業時代,包括科大訊飛也發布了芯片方案,2麥DSP就是其中最新推出的方案,它只有芝麻粒大小,卻能夠實現3米距離95%左右的識別率,并且功耗非常低,科大訊飛希望這樣的芯片能夠應用到越來越多的終端上去。
科大訊飛整體的思路就是希望把算法軟核跟開源硬件結合在一起,促進整個行業的快速發展。例如MORFEI麥克風,它是業界第一個實現全方位拾音功能的,把它放置在桌面上、墻上、天花板上都可以,這樣的拾音性能可以促進一些智能家居上的應用。此外,MORFEI還提供了遠場精準識別、多合成發音人自由切換等能力,未來還會有分布式的拾音能力。考慮到大部分開發者沒有聲學結構設計經驗,科大訊飛推出聲學評估服務,可以幫用戶檢驗產品的遠場交互性能是否達到標準。
另外科大訊飛最新的一個機器人解決方案RAIBOO主要應用在商場的智能導購、客服營銷。科大訊飛希望機器人服務合作伙伴能夠一起接入線上,融入線下,把機器人輸送到各種各樣應用場景中去。科大訊飛不光為合作伙伴提供技術,在后臺還是一套大數據的營銷平臺,通過線上跟線下數據的整合,為所有的企業提供營銷服務,這樣才能發揮機器人更大的應用價值。