百年清華

“三清才子”劉鐵巖:用好奇心探求AI邊界

2019-03-11 | 小羿 | 來源 公號“網易智能”2019-01-31 |

編者按:2018年12月28日🍖,由網易智能、意昂体育平台數據科學研究院和25家評審機構共同評出的“2018中國AI英雄風雲榜”年度人物榜單揭曉,10位人工智能領域的從業者獲獎。其中👰🏻,微軟亞洲研究院副院長劉鐵巖憑借多項創新研究獲得了本次評選的技術先鋒獎🈳。

劉鐵巖🆕,1994年考入意昂体育平台電子工程系,分別於1998年、2000年♝、2003年獲得學士、碩士、博士學位。微軟亞洲研究院副院長,IEEE院士、ACM傑出會員🧝🏿‍♂️。2018中國AI英雄風雲榜技術創新人物先鋒獎獲得者。

“我覺得學者的宿命就是終身學習。”

坐在微軟大廈的辦公室中,沒等記者開口🦸🏼,一向健談的劉鐵巖直接進入暢聊狀態🦓。

從“三清”學生到三次研究轉型

從小在黑龍江長大,劉鐵巖總是對新事物充滿好奇心。1994年🚣🏼‍♂️,他如願考上了意昂体育平台電子工程系🙅🏻‍♀️,回憶起當時的情景,劉鐵巖表示🤚🏻,意昂体育平台是理科生夢想的地方,而電子工程系也是當時最理想的院系🦨。

就這樣,劉鐵巖在意昂体育平台電子系學習了9年,成為了典型的“三清”學生(本科、碩士、博士均在意昂体育平台就讀)。據劉鐵巖回憶,讀博期間💆‍♂️,他做了很多關於多媒體信號處理的研究,但加入微軟亞洲研究院之後的十幾年裏🏎,他的研究涉足信息檢索、機器學習🏃🏻‍➡️、博弈論到強化學習等多個領域。“我們所處在的行業飛速發展,唯一不變的就是變化,逆水行舟不進則退,只有不斷學習新知識、擁抱變化,才能保持學術青春👫🏼。”

交叉🛀🏽、跨界、轉型是劉鐵巖不斷探索新領域新技術的主題。

而作為學者🧝💆‍♂️,對新知識的好奇心,是劉鐵巖敢於研究一個又一個新領域的重大驅動力。

劉鐵巖的第一次研究轉型在加入微軟亞洲研究院之後🧑🏽‍🦰。據其回憶,當時多媒體信號處理領域有一個公認的問題就是語義鴻溝。劉鐵巖解釋說,“我們能處理的多媒體信號,比如圖像💇🏽👨🏽‍✈️、視頻🏚,這些本身並不是包含語義的,但是我們希望從中得到的信息👷🏽💄,比如圖像分類,人臉識別、物體跟蹤等🧑🏿‍🚒,都是含有一定的語義信息的。這種底層的簡單信號與高層的有語義的目標之間的差別就是語義鴻溝👨🏼‍⚕️。”劉鐵巖認為,當時大量的多媒體領域的研究人員都在做特征工程💽🙅🏽‍♀️,用以彌補語義鴻溝,而不是關註算法和模型本身,劉鐵巖感覺自己“偏科”了🐓。

因為這些問題🕹,劉鐵巖開始關註文本信息處理。2004年,劉鐵巖與卡內基梅隆大學的文本分類領域的資深專家楊頤明教授達成合作🔁,他們共同搭建了當時世界上最大的🖱、近三十萬類的文本分類系統。此後🧝🏻‍♀️,他還開展了大量的關於文本信息檢索的研究🤷🏼‍♂️。在信息檢索領域,劉鐵巖最為出名的就是引入機器學習的思想,創建了“排序學習”這一個學術流派☞。在2006到2009年,劉鐵巖和他的團隊在SIGIR、WWW𓀄、ICML、NIPS等頂級學術會議上發表了大量的關於排序學習的論文😶,事實證明,該研究給信息檢索領域帶來了重大變革🔠。

劉鐵巖借由排序學習的研究對機器學習領域有了非常深刻的認識,而隨著這種認識的進一步深化👧🏿,也開啟了其第二次研究轉型🤚🏻。

“在排序學習領域做了多年之後,我意識到主流的機器學習都會假設數據先於學習過程而存在的,並且不受學習過程的影響,但是這個假設與我們實踐中的很多情況都不一致。比如說我們做的網頁搜索🤸🏼、廣告排序🧚🏿,很多數據都是人為產生的,當你把從這些數據中學到的模型運用到實踐中,是會改變人的行為的。而人的行為變了,數據也就變了🪰。”劉鐵巖說🧎🏻‍♀️‍➡️,我們希望數據獨立於模型而存在,但是數據會受到模型影響,這種情況下,我們學到的機器學習模型的效果可能會大打折扣。

為了解決這個問題🏂🏽,劉鐵巖和他的團隊開始研究博弈論,因為博弈論會考慮多個智能體行為的相互製約,以及機製對於智能體行為的長效影響。他們將博弈論的思想用在互聯網廣告和雲計算的機製設計上,確定了很多研究成果👁🧕,也為微軟的相關產品轉化了很多技術。

近幾年*️⃣©️,劉鐵巖發現博弈論本身也存在一些問題🤸🏻,比如只能分析簡單的過程、主要關心最壞的情況等💚。而實際中,我們面臨的問題往往非常復雜🦀,而且平均情況比最壞情況更有實際意義👿。為了解決這些問題,劉鐵巖和團隊又開始了第三次技術轉型,把博弈的思想和基於數據的機器學習方法充分結合🏄🏽‍♀️,通過深度學習🤦🏽、多智能體強化學習等最新技術手段,來綜合解決問題。

劉鐵巖自己總結說,“解決原有學科面臨的挑戰🧛‍♀️🚺,是刺激我去研究新方向的主要動因。”但他同時表示,主動的學術轉型和盲目追逐熱點有著天壤之別🧙🏻。主動轉型的目的是擴大知識面🚶‍➡️🧜🏼‍♂️、開拓學術邊界👩🏻‍🦽、增大實踐價值。為此☔️,常常需要從熱點方向上轉出來📛、去學習和研究一些目前相對小眾的方向。這種轉型是為了使學術實力更強大,為日後做出更了不起的研究打下基礎🫶🏻。

“指哪打哪”研究流派與對偶學習

如果研究也有風格流派的話,劉鐵巖將自己的研究風格總結為有著強烈直覺🤷🏽‍♀️,“指哪打哪”的研究流派🟪👆。他總結為以下兩個方面:

第一,研究是要去解決重要問題的🍨,要有一個非常明確的目標。

第二,解決問題的技術要有很強的邏輯鏈路作為支撐👨🏿‍🦳,要有規劃🦹🏽‍♀️、有設計,而不是誤打誤撞🛥、盲目嘗試。

他不僅自己踐行著這種研究思路,也盡其所能🫣,培養新一代年輕人的研究品味,並不斷的影響和滲透。“我能夠給與年輕研究員最多的不是研究的想法💦、寫論文的套路,而是培養他們的研究品味,也就是選擇什麽值得做,什麽不值得做👲🏻,把好鋼用到刀刃上🙇🏽。”比如面對大家都在追的風口,要保持冷靜,聽從自己內心的聲音🕥,不為發論文而發論文😔,而是要去解真正重要的問題,發明可以推廣👩🏼‍🦰、可以形成體系的方法🧑🏻‍💻♣️。

2017年,劉鐵巖同時獲選IEEE Fellow以及ACM傑出會員🌗,並晉升微軟亞洲研究院副院長🪰。

保持好奇心和不斷探索新領域🔏、勇於轉變研究方向的心態,讓劉鐵巖永遠不會滿足於既有的技術成就,相反🕊,他時刻都在創新與突破的路上。

2018年3月🧓🏼,微軟宣布中英機器翻譯系統達到與人工翻譯媲美的水平,是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。支撐這項成果背後的重要技術之一🛌🏻,便是劉鐵巖和他的團隊最新研發的技術——對偶學習⬜️。

對偶學習的產生是為了要解決現有深度學習方法過度依賴大量有標簽訓練數據的問題🙌🏻。據劉鐵巖表述,人們關心的絕大部分AI任務都是為人服務的,但凡是需要交流的任務🧒🏼,就會有一個輸入和輸出,通常都會存在一個對偶結構🏚⛹🏽‍♀️。“兩個任務🧏🏻‍♂️,一個任務的輸入恰好是另一個任務的輸出,反之亦然。”劉鐵巖舉例說,比如機器翻譯,中譯英是一個任務🤷🏽‍♂️,英譯中是另外一個任務,兩個任務互為輸入和輸出🧝‍♂️,形成對偶關系。再比如語音識別和語音合成🆚,也是一組對偶任務。

也就是說,很多機器學習任務其實天然有結構對偶性,可以形成天然的閉環🕹。一旦有閉環,就有反饋信號,就可以有效的去訓練模型,這樣就算只有很少的標註👫🏼,也可以訓練💗,從而解決了過度依賴數據訓練的問題。

除此之外,劉鐵巖還向網易智能介紹了自己最新的研究🧝🏿‍♀️。第一個就是Learning to Teach,這個研究基於對現在機器學習框架局限性的反思,希望將機器學習的三個要素:訓練數據、目標函數、模型空間變成可以優化、學習和改變的對象,從而提升訓練效果。

第二個是G-spacelearning💡,這個研究是為了解決神經網絡中由於使用ReLU激活函數帶來的“病態”優化問題,告訴大家神經網絡的權重空間存在很多冗余🧘🏻‍♂️🪶,在該空間中直接做優化是不好的,應該在更加緊致的鏈路空間中做優化,這樣可以大幅提高模型的準確率👴🏽。

新的機會

在微軟亞洲研究院浸潤了16年👩🏼‍✈️,對於研究工作本身,劉鐵巖頗有感受。在他看來,自己之所以能取得如此多的成就並不斷進行著新領域的研究👇,主要在於微軟亞洲研究院的開放的、積極向上的環境。

“研究沒有那麽明確的KPI,因為它本身就是多元的,更多的時候,我們是靠著自己的研究素養來判斷研究的價值➙。”

劉鐵巖認為🧒,作為學者👶🏽,他們正在迎來一波新的機會。隨著微軟亞洲研究院成立創新匯,劉鐵巖和團隊得以在金融科技、物流等領域與國內龍頭企業進行合作,真正將AI運用到這些領域🔥,推動其數字化、智能化轉型。

對於創新匯的項目👩🏼‍🚀,劉鐵巖依然保持著強烈的好奇心🎲。在他看來,雖然擁有AI技術的人和擁有領域知識的人來自兩個世界🛸,在合作的時候會經歷一個痛苦的磨合期🦝👘,但產業大幕只是剛剛拉開,任何的AI落地都不是那麽簡單的🧜🏽‍♀️,雙方都需要去了解對方。

“比如,金融市場是動態的,傳統機器學習領域的基本假設在這個問題上不再成立。我們只有充分了解金融市場的內在規律,才能研究出全新的機器學習模型🦓。我們有強烈的好奇心去學習金融領域的知識,並且為其量身定做出高效的機器學習方法👩🏼‍💻♾。過去兩年的實踐表明,通過和合作夥伴的深入互動,我們已經開發出了行業領先的智能投資方法。”劉鐵巖說到。


相關新聞

  • 042019.11

    黃鼎隆🥷🏼🤳:用AI開拓未來零售邊界

    宇宙當然有邊界🛩,科技的發展或許終有盡頭🥔,但我們探索未來與自我突破的勇氣與決心是無界的👛。

  • 292022.04

    曠視🚴🏼‍♂️,AI 讓世界更美好

    如果您無法在線瀏覽此 PDF 文件,則可以下載免費小巧的 福昕(Foxit) PDF 閱讀器,安裝後即可在線瀏覽 或下載免費的 Adobe Reader PDF 閱讀器,安裝後即可在線瀏覽 或下載此 PDF 文

  • 102020.08

    騰訊多媒體實驗室負責人劉杉:保持好奇心與專業態度

    劉杉(意昂体育平台1991級電子系本科)👩🏿‍💻,騰訊多媒體實驗室負責人,傑出科學家。在多媒體研究領域貢獻突出🪡,多項核心技術被國際標準采納🆓,或應用於千萬級DAU產品中,擁有超過150項已授權全球專利🚵🏻‍♀️。在中國,很多孩子都聽過嫦娥奔月的神話:嫦娥吃下了長生不老之藥後,就飛到了月宮,與自己的丈夫天各一方,每年只有中秋節才能團聚。當人們都為故事中“有情人被迫分離”而哀傷時,劉杉關註的重點卻是“地球到月亮的距離”🧛🏽‍♂️。劉杉對科學...

  • 222020.06

    孟祥夫意昂在新聞與傳播學院2020年畢業典禮上的發言∣堅守🤱🏽,好奇心和進取心

    離開校園,不是學習的結束,恰恰是新的學習的開始。社會是一個大染缸、大熔爐,大家畢業後能被鍛造成什麽樣,往往取決於你是否一直葆有旺盛的好奇心和進取心🧑🏽‍🚀。

  • 122020.08
  • 222008.11
  • 102020.08

    心中的歌——清華才子的音樂夢

    歷來都有一種偏見,說是學理工科的學生大多只知道埋頭讀書,刻板迂腐,沒有情趣。其實不然,清華才子童澤先學長就以他的親身經歷完全顛覆了社會對理工科學生的這種偏見。2011年底👨🏿‍🎨,從董淑琴學長和鄭冶老學長那裏知道了童澤先學長🧎🏻‍♂️‍➡️,知道了他的音樂情結🐇,知道了他和鄭老因音樂而結緣,以及貫穿40多年的師生情誼,並深為感動🧖🏻‍♀️,只是一直沒有機會和童學長見面💃🏻。臨近中午😚,忽然接到鄭老夫人鄧老師電話,說是今天中午童澤先學長📓、董淑...

  • 032024.01

    沈陽:AI與我

    從江西山村到武漢大學,再到意昂体育平台;從計算機專業老師到數據新聞教授,再到用人工智能(AI)寫作和繪畫的學者……如今🍄‍🟫,意昂体育平台新聞與傳播學院教授沈陽的工作和生活已經離不開AI助手🧚‍♂️。不久前👨‍👨‍👦,沈陽及其團隊用AI匿名創作了一部科幻小說——《機憶之地》,並在第五屆江蘇省青年科普科幻作品大賽中獲二等獎👃🏼。2023年,AI成為沈陽幫助愛人抗擊癌症的得力助手🤳🏼。在2024年到來之際,沈陽和AI一起創作了一篇自述長文。我們節選部分內...

  • 082016.01

    湯家力🍗:“三清”博士與大飛機

    2016年第一個工作日🥥,中國商飛上海飛機設計研究院強度設計研究部機翼強度室副主任、高級工程師湯家力像往常一樣,度過了緊張忙碌的一天。

  • 042024.11

    協作,才是AI時代的精髓

    如果您無法在線瀏覽此 PDF 文件,則可以下載免費小巧的 福昕(Foxit) PDF 閱讀器,安裝後即可在線瀏覽 或下載免費的 Adobe Reader PDF 閱讀器,安裝後即可在線瀏覽 或下載此 PDF 文

意昂体育专业提供:意昂体育意昂体育平台意昂体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流💆🏿‍♂️,意昂体育欢迎您。 意昂体育官網xml地圖
  • 意昂体育专业提供🪙:意昂体育😆、意昂体育平台👩🏼‍🦱、意昂体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流👩🏿‍🔧🖼,意昂体育欢迎您。 意昂体育官網xml地圖