【中國傳動網 市場分析】 中國與美國的AI差距有多大?真相比你想的更恐懼:根據AI領域頂會NIPS兩年論文統計結果,無論是學術、產業,還是產學結合,美國至少領先中國10倍。是時候給國內浮躁的AI圈,澆一盆清醒的涼水了。
西方在AI研究方面仍然遙遙領先,中國并沒有展現出要取代西方地位的迫在眉睫的威脅。
這是美國風險投資公司Thundermark的執行合伙人、MIT計算機科學和AI實驗室碩士和賓夕法尼亞大學沃頓商學院的金融與戰略管理MBAGlebChuvpilo通過深入研究最負盛名的國際AI研究會議——神經信息處理系統會議(NIPS)得出的結論。
NIPS2017在加州長灘舉行,吸引了8000多位注冊參會者,比前一年增加了2000人。3240篇投稿論文中有679篇被接收,錄取率為21%。其中,華人(第一)作者占了不小的比例,但是,換一個角度看,你就能發現完全不一樣的事實。
中國論文數量并沒有想象的多,先進AI研究方面美國領先中國10倍
通過這些會議會議論文集,我們查閱了679篇被接受的論文,并編制了一個完整的列表,列出了2497名作者和他們的所屬機構(當然,很多都是重復的),然后計算出一個發表指數(PublicationIndex)。
下面是生成的圖表,大致遵循了因子為3的冪律分布:美國處于明顯領先的地位,發表指數為414;其次是西歐,指數為136;中國第三,但較美國和西歐的距離很大,發表指數只有39。(需要提一下的是,西歐的定義為歐洲經濟區EEA+瑞士,EEA包括歐盟、挪威和盧森堡;我們認為將這些歐洲國家作為一個整體是合理的,因為它們在研究資金協調和跨國合作方面十分緊密。)
圖:在NIPS2017上發表AI研究的Top10地區(藍色為學術發表指數,橙色為企業發表指數)
發表指數(PublicationIndex)的機制是這樣的:每發表一篇文章得一分,然后在它的N個作者之間平均分配,每個作者的得分就是1/N(我們假設每個作者貢獻相等)。然后,我們將這些得分分配給每個作者的主要所屬機構(有些作者所屬多個機構,這些在本研究中被忽略)。
例如,如果一篇論文有5位作者——3位來自麻省理工學院,1位來自牛津大學,1位來自谷歌——每個作者將得到1/5分,即0.2分。因此,僅從這篇論文來看,MIT的發表指數增加3*0.2=0.6,牛津大學的發表指數增加0.2,谷歌也是增加0.2。由于MIT是美國大學,所以MIT的隸屬關系將使美國的發表指數增加0.6。同樣,由于牛津大學是英國的大學,EEA+瑞士這一項的發表指數將增加0.2。最后,谷歌是一家總部位于美國的跨國公司,因此美國的發表指數再增加0.2,總增加0.8。
某篇NIPS論文:五位作者(3位來自MIT,1位來自牛津大學,1位來自Google)
MIT:+0.6
牛津大學:+0.2
Google:+0.2
美國:+0.8
EEA+瑞士:+0.2
這里的想法是建立一種一致的方法論,即根據發表論文中作者數量的反比來分配分數,從而得出一套公平的綜合統計數據。
具體國家/地區的排名如下圖:
在NIPS2017上發表AI研究排名Top10的國家
具體國家的排名結果更加引人注目,美國以414的發表指數(一如既往地)主導著AI領域的研究;接下來的三個國家的發表指數都比美國要小一個數量級,中國為39,法國為37,英國為34。換句話說,在發表先進的AI研究方面,美國領先中國10倍。
這些數據還顯示了什么呢?猜猜看,學術界和工業界的全球AI研究領導者Top5分別是哪些呢?
基于NIPS2017的論文發表數,AI研究領域全球排名前25的機構(學術界和產業界)
這個類別也是美國領先。毫無疑問,谷歌憑借DeepMind、GoogleBrain和GoogleResearch等研究部門,以及可獲取PB級的消費者數據和商業數據,位列第一。接下來是任何AI和機器人學PhD學生夢想進入的四大強校——卡內基梅隆大學(CMU)、麻省理工學院(MIT)、斯坦福大學和加州大學伯克利分校(UCBerkeley),分別排名第二,第三,第四和第五。
接下來,讓我們看看在AI人才爭奪戰中學術界和產業界的競爭態勢:
NIPS2017中學術界vs產業界的AI研究情況
有意思的的是,近五分之一的AI研究來自產業界。即將畢業的博士生、博士后和主要研究人員在進入企業工作時,不得不放棄公開發表研究成果的日子一去不復返了。
這是一件大事,AI研究社區堅持保持研究結果開放,這令人鼓舞。這場戰斗尚未取得勝利,因為我們沒有看到蘋果公司在NIPS2017上發表任何研究,而蘋果是AI領域的關鍵參與者之一,憑借其Siri應用程序和HomePod產品。
接下來,讓我們看看企業之間的競爭情況:
NIPS2017上AI研究領先的全球Top20企業
當然,我們已經預料到谷歌是第一。微軟以其精英研究部門MicrosoftResearchunit位居第二,而Facebook以其FAIR位居第三。IBMWatson排在第四。得益于豐田研究院,豐田排名第五。
最后一個問題是,如果你想要與頂尖的AI研究人員一起工作,你應該去哪里讀研究生(僅參考從NIPS2017得到的了解)?從美國的學校開始:
在NIPS2017發表AI研究領先的Top20美國大學
如果將范圍擴大到全世界,以下是排名前25的大學:
在NIPS2017發表AI研究領先的全球Top25大學
僅從在NIPS2017發表AI研究的數量來看,全球Top25大學中,中國僅清華大學入榜,排名第19。
在此基礎上,我們總結了對NIPS2017的分析。當然,仍有許多懸而未決的問題。例如,你可能會問,中國是否對最新的AI研究保密,這是中國的大學和企業沒有發表更多論文的原因。雖然存在這種可能性,但我們傾向于認為這不太可能。畢竟,在NIPS發表論文對任何中國的AI研究人員來說,都是在全球獲得就業機會的一個敲門磚(假設這是有價值的)。
更有可能的解釋是,中國落后了,他們的AI策略很大程度上是從其他地方復制研究結果,然后應用到國內數據集。用PeterThiel《從0到1》一書的觀點來說:“中國已經直接復制了發達國家的有用之物:19世紀的鐵路、20世紀的空調,甚至整個城市。也許這種復制可以使中國在建設道路上少走幾步—比如,不用安裝陸上線路,直接實現無線通信,但是,這依然是在復制。”
美國新安全中心的一份人工智能報告也傾向于認為:“在奧巴馬執政的最后一年,白宮發布了幾份旨在使美國走向更加連貫的人工智能策略的白皮書。這些報告涵蓋了從監管到創新再到偏見的各種問題,推動了科學家與政府官員之間的一系列對話。該報告的一些作者認為,中國的人工智能戰略反映了奧巴馬政府報告中的關鍵原則——現在是中國采納了這些原則,而不是美國。”
NIPS2018:美國依舊是老大哥,高校和產業論文數量質量均占優
再來看看今年NIPS2018的論文接收情況。
產業界論文入選,谷歌加上DeepMind,一共入選了152(107+45)篇,幾乎占了所有論文的15%。
騰訊AILab的表現也算搶眼,以17篇論文接收排在第8。但不要忘記,根據此前騰訊AILab負責人張潼在接受采訪時表示,騰訊AILab的考核指標之一,就是發頂會論文的數量。
不僅如此,看第一作者,谷歌研究院也是產業機構里數量最多的,其次是DeepMind。這說明,谷歌和DeepMind不僅參與/資助了大量研究,不少原創性的新想法或者新技術也源自這里。
在產學結合方面,根據高校與企業合作的被接收論文數量,可以看出谷歌與許多高校有著密切合作關系,排名前17的名單中,谷歌就與7所頂尖高校有著合作。
不僅如此,谷歌共與其他企業/院校合作并入選了85篇論文!
學術機構方面,今年排在NIPS入選論文數量前十名的依次為:MIT、斯坦福、CMU、伯克利、佐治亞理工、普林斯頓、牛津、UIUC、康奈爾和清華。
其中,清華大學以21篇論文被接收排在第10名,這個成果單獨看實際上已經很優秀,只是美國的高校占據了前十名中的8個位置,并且前6名都是美國。
而根據學術界論文的第一作者,可以看到,斯坦福、MIT、CMU、伯克利在附上“第一作者”這項約束條件下,論文接收數量依然排名前四(雖然具體位置有所變化),勢頭強勁。
不過,清華在這里排名有所上升,超過了康奈爾和UIUC,位列第8。香港中文大學排在第14位。
進步中的東方古國:中國學者越來越多擔任頂會領域主席和程序主席
從NIPS論文接收當中,可以看出中美之間的學術實力差距還有很大的距離。不過,這也是國內很多學者不斷在強調,并且已經意識到且開始采取行動的。
中國確實是在進步。
今年7月的IJCAI,中國學者獲多篇接觸論文獎,華人一作論文占總接收論文的65.5%。南京大學教授周志華還當選IJCAI2021年程序主席,成為IJCAI史上第二位華人大會程序主席。今年,南大也有多篇論文被NIPS接收,周志華教授本人署名參與的也有5篇。
此外,除了論文接收數量,我們更應該看中國學者在各個頂會中擔任領域主席和各種主席的占比,特別是在大會報告上何時能有所突破。這些,是比論文(包括最佳論文獎)更重要的影響力的體現。
8月25日,國際模式識別會議ICPR2018歷經40年首次在中國大陸舉辦。作為模式識別領域的旗艦學術會議,ICPR自1972年起,每兩年召開一次。在2014年國際模式識別大會的理事會全體會議上,中國和澳大利亞圍繞2018年國際模式識別大會舉辦權展開了激烈角逐。中國科學院自動化所模式識別國家重點實驗室學術委員會主任、中科院院士譚鐵牛和實驗室主任劉成林代表中國作申辦報告并回答了理事會的質詢,最終贏得理事會青睞。
AAAI2019,兩位程序主席之一,是南京大學的周志華教授,這也是AAAI大會自1980年創辦以來,歐美之外國家的學者首次擔任AAAI大會程序主席。
計算機視覺領域的頂會,2019年的CVPR,微軟資深研究員華剛博士將擔任大會程序主席,華剛博士也是CVPR2017、ICCV2017的領域主席。
2020年多媒體領域頂會ACMMultimedia(ACMMM),阿里巴巴副總裁華先勝博士將擔任大會主席,本屆大會也將由阿里巴巴與意大利佩魯賈大學和香港中文大學共同舉辦。
CVPR2021主辦團隊也歸屬中國,中科院譚鐵牛院士擔任大會主席,上海科技大學的虞晶怡教授擔任程序主席之一。虞晶怡教授也是CVPR2017的領域主席,他當時接收新智元采訪時表示:“CVPR2017的大會主席張正友老師、程序主席吳郢和劉燕西老師,以及其他各個委員會近40名華人學者功不可沒!”
此外,京東副總裁的裴健博士,是現任的ACMSIGKDD主席(任期為2017.07.01—2019.06.30)。ACL2018宣布成立國際計算語言學協會亞太地區分會(AACL,TheAsia-PacificChapteroftheACL),百度高級副總裁、ACL前任主席王海峰將出任AACL創始主席,2020年AACL的會議地點也將設置在亞太地區。更早一點,微軟亞洲研究院副院長周明博士在2016年當選為ACL候任主席。
如今,中國的AI實力距離美國仍然有很大的差距。但是,我們也在追趕,我們也在進步。客觀看待事實,并且不懈努力,沒有捷徑,通往第一的路都是一步一步走出來的。