ICML和MLSS兩大機器人會議齊聚北京,被業(yè)界認為是破天荒的第一次。由此可見,中國人工智能的發(fā)展在國際上已經異軍突起,越來越吸引各界的目光。
最近在科技界,人工智能、機器學習可謂炙手可熱;叵脒@一年,機器學習大佬們紛紛從學術界“跳槽”工業(yè)界,祖師爺Geoffrey Hinton被谷歌招入麾下,泰斗Yann Lecun加盟Face book,前“谷歌大腦之父”Andrew Ng成為百度首席科學家。作為人工智能最重要的分支,近幾年,機器學習取得的突破進展,讓世界不得不為之矚目。
這個六月,一場機器學習領域的饕餮盛宴正在上演。國際機器學習大會(ICML)和機器學習暑期國際研討會(MLSS)這兩個機器學習頂級會議首次來到北京。人工智能為何如此火爆?學術界與工業(yè)界有哪些新進展?人工智能下一突破會在何處?筆者抓住這個千載難逢的機會,來到現場,不僅能近距離膜拜大師,更期待找到問題的答案。
兩大盛會首來中國,原因何在
今年,ICML和MLSS齊聚北京,可謂史無前例。究竟是什么吸引兩大機器學習頂級會議從歐美移駕中國、各位人工智能大師千里迢迢赴京?筆者認為,中國目前在人工智能領域可謂異軍突起,無論學術界還是工業(yè)界都有亮眼表現。
從國家層面,政府高度重視發(fā)展人工智能技術,人才方面,越來越多就讀于世界頂級名校的中國學子學成歸國,工業(yè)方面,中國真正做到了技術的工業(yè)落地,尤其在互聯(lián)網產品上變現能力極強。
人工智能研究新成果
去年ICML大會上,Andrew Ng帶領學生Adam Coates利用2萬美金的GPU集群做到了谷歌價值約100萬美金服務器集群識別貓臉同樣的效果。今年,谷歌實驗室科學家QuocLe帶來了提取語句和文本特征的新方法。通過加入一層Paragraph Vector來表示語境,巧妙的解決了傳統(tǒng)“bag-of-words”(詞袋)模型無序和語意缺失的問題。
自然語音處理領域鼻祖,加拿大蒙特利爾大學的Yoshua Bengio教授將傳統(tǒng)Denoising Auto-encoder(DAE)算法訓練循環(huán)(training epoch)中數據的損失邊緣化(marginalized),實現了用少量的訓練循環(huán)達到或超過DAE模型的效果。
機器學習泰斗GeoffreyHinton的學生,加拿大多倫多大學教授Ruslan Salakhutdinov則介紹了關于自然語言的多模態(tài)神經語言模型(multi modal neural language)。在圖文(image-text)模型中,通過一個卷積網絡,可以同時學到關鍵詞和圖像特征。
每屆ICML,最受關注的便是Best Paper花落誰家。要知道,ICML的評委們對文章的篩選一向以“苛刻”著稱。今年,最終歸屬于北京大學2009級博士生唐建的《Understanding the Limiting Factors of Topic Modeling via Posterior Contraction Analysis》,這是繼去年百度深度學習實驗室負責人余凱獲得Best Paper銀獎后再次爭得國際頂級榮譽。
百度引領人工智能創(chuàng)新
據筆者不完全統(tǒng)計,本次大會收錄了17篇來自中國的regular paper,其中來自工業(yè)界共計5篇,百度4篇,阿里1篇。百度大數據實驗室負責人張潼從理論上解決了機器學習不同方向上的優(yōu)化問題。例如,他提出AccProx-SDCA框架,優(yōu)化了機器學習三大關鍵問題SVM、Lasso和Ridge Regression的運行時間。
從MLSS到ICML,AndrewNg、張潼、余凱等豪華陣容先后亮相百度展臺;產品上,從搜索廣告CTR預估到各種預測的實現,再到移動產品的落地,顯示出了領跑人工智能、機器學習領域的雄心和決心。
人工智能的下一突破
那么,人工智能新的突破在哪里?在深度學習晚宴的Panel discussion環(huán)節(jié)中,從AndrewNg的回答中或許能找到答案。Andrew Ng談到,近些年深度學習取得的顯著進展,得益于基于大量標記數據(tagged data)的有監(jiān)督學習(supervised learning)的研究。隨著物理世界的數字化,大量標記數據產生,并且被提供給深度學習算法。如谷歌、百度這樣的互聯(lián)網公司已經從中獲得價值。所以,有監(jiān)督學習將在短期內仍是人工智能的研究重點,并在機器視覺、語音識別、廣告和推薦系統(tǒng)等方面產生重要作用。
Andrew Ng認為,基于深度學習技術,App和硬件都將變得更加智能。試想這樣一個應用場景,在開車的時候,只要說出“發(fā)件人我”,“回復給誰”,再說出郵件內容,手機會自動將語音準確轉化為文本郵件,最終成功將郵件發(fā)送給接收人。在Andrew看來,未來幾年手機將會是連接一切的橋梁,人類通過手機將開啟智能生活。
另一方面,神經學家相信,動物和孩子往往是通過無標記數據(untagged data)來學習的。目前已經有科學家嘗試在無標記數據上應用深度學習技術,但還沒有找到合適的算法。未來,在這方面,可能會出現很多突破。據說,Andrew Ng帶領的百度人工智能實驗室將在這方面有所建樹。