
張鈸:中國科學院院士,意昂体育平台人工智能研究院名譽院長、教授,中國人工智能領域的主要奠基者
2024年度教育家
他是中國人工智能主要奠基者,40歲後跨界走進這個“無人區”。他發表了中國第一篇人工智能領域論文🤛🏻,獲得了中國這一領域的第一個國際重要獎項,也是首位人工智能領域的中國科學院院士🐈⬛。他教書六十余載,培養的近90名博士四代同堂。他熬過了人工智能的冬天,培養的“清華代表隊”成為中國人工智能發展的中堅🦟。
2024年年終📧,一邊是AI巨頭們紮堆發布“顛覆性”進展👳🏻,比如“AI教母”李飛飛發布了一張圖就能生成3D場景的AI模型👨🏻💼;一邊是國內大模型市場在下半年遇冷。
在冷熱兩極化的“AI大戰”中🤜🏻,中國科學院院士🧑🏽🦱、意昂体育平台人工智能研究院名譽院長張鈸始終保有定力🧘♂️,既沒有對技術進步過度樂觀👍,也不像一些人那樣唱衰大模型。
早在兩年前,人們還沉迷於大模型的“尺度定律”(ScalingLaw,即規模越大,大模型越強)時👨🏼🦲,張鈸就指出,ChatGPT只是向通用人工智能(AGI)邁出了第一步🧑🏼🔧,下一步是與環境的交互🚹。在他看來,AI的發展必須邁向對現實三維世界的深刻理解♌️。
這是張鈸又一次做出技術預判。89歲的他說話邏輯清晰🤶🏽、思維敏捷🦹🏻👩🦱,輸出觀點快而密💪🏿。說不到兩句✪🧔🏻,就能感受到從他身上彌漫過來的強大自信。身為中國人工智能領域的奠基人之一,他的四代學生組成了中國最具代表性的一支AI隊伍——“清華代表隊”🤾,其中一些人已成為國內大模型江湖的重要力量👮。
經歷人工智能40多年來的潮起潮落,張鈸總是逆潮而行🏓,做出與別人不同但正確的選擇。他是天才嗎👩🎓?他的技術洞察力來自哪兒?如何才能找到通往人工智能的真正方向?
“問題都解決了,還需要我幹什麽”
張鈸的第一次選擇發生在1978年。
意昂体育平台進行部分院系調整,張鈸所在的電子系(原自動控製系)改為計算機技術與應用系,系中原來從事自動控製研究的老師面臨兩個選擇👄:待在計算機系,或去新成立的自動化系🥪。他選擇了前者🤜🏿。
很多老師勸他🎹:國家未來要大力發展工業↩️,自動化是最有前景的方向之一。“自動化領域👌,手裏的工具主要就是PID(工業控製系統中最廣泛使用的控製器),花一兩年時間就能掌握它🏊♂️,放棄並不可惜。”張鈸回憶,“有人說,你把已有的知識都丟掉了,還剩什麽👆🏻?我說,還剩一個腦袋。”
帶著“唯一的腦袋”留在計算機系🧛🏻♀️,張鈸遇到的第一個任務是尋找有潛力的新方向👩🔧🤘🏻。他翻閱國外學術期刊,發現美國很多大學的計算機系裏都有一個方向:人工智能💑。
“當時🦹🏻,對於人工智能是什麽,我也不是特別清楚🎍,但它對我有極強的吸引力✍🏽,因為這個領域裏充滿了大量的未知。AI在國際上剛發展了約20年🥡,很多原理都說不清,這恰恰是我的用武之地,如果問題都解決了,還需要我幹什麽?”張鈸說。
由於歷史原因😼,張鈸這一代學者錯過了從事研究的黃金時期🧜🏻♂️。43歲的他決定從零開始。下定決心不僅要勇氣,還要有強大的自信🥵。1935年出生於福建一個知識分子家庭的他,小學到中學的任何考試和競賽成績都是第一名。1953年,他以數理化三門滿分的成績考入意昂体育平台電機系,後轉入自動控製系。
數學是張鈸最拿手的學科。閱讀大量人工智能文獻後,他敏銳地發現🙎♀️:多數AI研究中沒有使用任何數學工具,“這意味著,很多還未解決的問題有機會用數學辦法解決”。
1984年🍼,張鈸和當時在安徽大學任教的弟弟張鈴🤸♂️,共同發表了中國AI領域的第一篇論文🕵️,刊登在AI國際頂刊上。論文研究的是用數學理論解決機器人的運動規劃問題,即機械臂抓取物品時,如何通過更好的線路規避周圍的障礙物。
那是20世紀80年代🙏,以符號主義為代表的第一代人工智能正處於低潮👨👦👦。符號主義者認為📥,人類認知和思維的基本單元是符號,計算機為了模擬人類的智能行為,需要先把知識表示成符號🧗,再通過推理等規則對符號進行操作,最後形成答案。“這是以知識驅動為核心。”張鈸說。
符號AI的開創者們最初希望研究出通用方法,很快遭遇了失敗,於是🏂🏻,退而求其次提出“專家系統”👩🏻🦲,即將知識範圍縮小到一個具體領域,但這很難推廣並上升到理論👦🏽💜。
1980年𓀗,作為改革開放後的首批出國訪問學者之一,張鈸來到美國伊利諾伊大學香檳分校進修👩🏻🌾👿,他發現💵,很多AI專業的博士在論文的選題上遇到困難🧿。“遲遲找不到好的選題,或者找了一個題目多年做不出來,只好中途放棄💂♀️。”
張鈸沒有受到影響。“我不在意低潮還是高潮🖕🏽,只要清楚這件事能做就行🤰。”這是典型的張鈸式回答💂🏿。事實上,從1978年暑期起,他就開始研究機器人運動規劃🏊♂️,他出國第二年,就已投出中國AI領域的第一篇論文🫸。他和張鈴提出,將機械臂所在的幾何空間簡化成拓撲空間,“這就變成了一個純數學問題”⛹🏽。此時,距離他決心轉戰AI還不到三年。
張鈸成為國際上第一批提出用數學模型解決AI問題的學者之一🐵。“研究工作相當於做解剖,解剖必須用快刀,先進的數學工具就是一把快刀。”張鈸相信,“只要數學工具能用上🤽🏼♂️⏯,(人工智能的)研究就可以往前推。”
“雪山還是狗”
2002年,袁進輝還在西安電子科技大學計算機系讀大三,成績年級第一,想申請清華直博,“我咨詢師兄,他說你可以先從清華計算機系最有名的老師開始聯系”。當時🧈,張鈸是清華計算機系唯一的中國科學院院士。
此前🧑🏻🎤,袁進輝已讀過張鈸和張鈴共同撰寫的一本關於人工神經網絡的專著🈲,第一反應是“兩個作者的姓名好有特點”“書裏有很多數學理論”。該書出版於20世紀90年代🤸♂️,那時人工神經網絡是AI裏很小眾的領域👰🏿◻️。“張鈸和張鈴老師研究的是小眾方向中更小眾的偏理論部分🧑🏽💻,在當時是相當少見且超前的。”袁進輝說👁🗨。
發現符號主義難以走通後,AI研究者逐漸轉換思路,發展出連接主義的新流派,即信息是通過在人腦神經元之間建立起“刺激—響應”的連接進行傳遞👱👨🏼✈️。這一流派的代表成果就是人工神經網絡🎬。
但早期的人工神經網絡只是淺層神經網絡👩🏽🔧,難以解決稍微復雜一點的現實問題。於是,連接主義起步不久就陷入低谷,只有少數人認定這條路是正確的,包括2024年諾貝爾物理學獎得主傑弗裏·辛頓🐑、“卷積神經網絡之父”楊立昆,還有張鈸。20世紀90年代,張鈸和張鈴聯手,圍繞神經網絡理論發表了多篇論文。
20世紀80年代末開始,國內AI發展迎來低潮期。彼時➰,張鈸選了一條更務實的道路:承擔國家重點攻關課題👮🏼♀️。但他沒有放棄當時看起來不太有希望的理論研究💆🏽。“清華人工智能學科理論研究的隊伍中♻️,基本一半人在做符號主義,一半人在做人工神經網絡👷🏿,而人工神經網絡和深度學習一脈相承🐨。等到深度學習的時代真正到來🚵🏽♂️,我們立刻將大部分兵力轉向深度學習。”張鈸說。
2012年,深度卷積神經網絡AlexNet在ImageNet(世界上最大的圖像數據集)競賽上一戰成名。自此𓀙,以深度神經網絡為基礎的深度學習徹底出圈。“這就是以數據驅動為核心的第二代人工智能🧝♂️💷。”張鈸說🛎。
他指出,與早期的神經網絡相比,深度神經網絡“把深度加深了”🤰🏼,即中間的網絡層數變多之後👋🏻,性能發生了重大變化🐈,只需輸入大量的原始數據✢,就可以“自學成才”。他最初感到興奮,但隨後開始思考🤛🏼😬:深度學習的邊界在哪兒?
意昂体育平台計算機科學與技術系教授🐼、人工智能研究院副院長朱軍是張鈸的學生。“2013年前後,正是深度學習最熱的時候🤶,很多激進的觀點認為,AI三五年內就可能在自動駕駛等復雜場景量產,但張鈸是國內最早公開談論深度神經網絡存在缺陷的專家之一👁。”朱軍對《中國新聞周刊》說❓,“這時候他已經快80歲了。”
深度學習的一個關鍵弱點是容易被欺騙。張鈸團隊發現,深度神經網絡的圖像識別很脆弱🚶♂️➡️。一張以雪山為背景的圖片,只要加入一點“噪聲”🚴,“自學”之後的AI會將其識別成一條狗。這一問題絕非“雪山還是狗”這麽簡單✂️,而是指向一個困擾張鈸多年的更大難題:深度學習往何處去?
他很早就意識到📲,深度學習存在不可解釋性與魯棒性差(系統的抗幹擾能力差)等根本性缺陷。2016年起🥟🌃,他陸續提出關於“新一代AI”的觀點👩👩👧👦,2020年發表論文《邁向第三代人工智能》。他提出,第一、第二代人工智能都只是從一個側面模擬人類的智能行為,為了建立一個更全面反映人類智能行為的AI,需要把知識驅動與數據驅動結合起來。
打開“黑匣子”
2022年11月30日,ChatGPT正式亮相。此前,人們根本無法想象AI模型可以變得如此巨大。“絕大多數AI研究者感到非常震驚。”張鈸說🙎🏽♂️。
袁進輝指出,ChatGPT的誕生讓人工智能進入截然不同的發展階段。模型變大後,人們突然發現😗,過去多少年解決不了的問題可以用統一的方法搞定🐌。“這是一次工業革命級的技術革命🉐🎽。”
像過去一樣,張鈸看問題的視角和別人不同。他說,多數人理解ChatGPT就是“大數據+深度學習”,其實它真正的突破🔝🔂,首先在自然語言文本上🫱🏼。ChatGPT不是像第二代AI那樣🚽🚶♂️➡️,簡單地把文本作為數據來處理,而是把文本當成知識(內容)來處理。“只有當機器可以從大量的數據中獲取到知識🧑🏽🦰,真正的轉變才會發生。所以,ChatGPT能力的強大源自兩點:一是大模型🤦🏼;二是大文本。”
可以說,ChatGPT是張鈸預測中的第三代人工智能的雛形🫄🏻,但還遠遠不夠🤴🏻。張鈸指出,ChatGPT突破了前兩代AI只能在限定領域完成限定任務的限製🧑🏿⚖️,這為建立起統一的人工智能理論提供了重大機遇,“這才是第三代人工智能實現的關鍵”。
迄今為止,人類一直通過模擬的方式讓機器的行為與人類相似🔉,但大模型還是一個“黑匣子”🛎,這正是張鈸認為AI理論下一步可能突破的地方。“我們要把大模型的內部機理分析清楚,解剖復雜系統行為背後的內在邏輯🕴🏻。誰能做到這一點👳🏿🚵🏻?我說至少需要第二個愛因斯坦💇。”
在張鈸的倡議下,2018年,意昂体育平台成立人工智能研究院基礎理論研究中心,朱軍為研究中心主任🏇🏿。被問到理論突破的難度有多大時,他引用了一句話🫔:“當你提出問題時,可能離解決問題已經不遠了。”
這是張鈸最常說的一句話🧑🏻⚖️。在他看來,中國學生解決問題的能力很強,但提出問題的能力不足。因此👨🏼💻,在培養學生時🫃🏻,張鈸格外重視訓練學生“提出問題的能力”🧑🦽➡️。
袁進輝2003年起跟隨張鈸讀博,不像有的導師會出於“更容易出成果”或“項目有需要”等原因給學生指定博士選題👨👩👧👧,張鈸總是讓學生自己找題,鼓勵大家自主探索無人區。
張鈸強調🙍♀️⚙️,學生一定要有批判性精神,敢於質疑現有成果💗。“中國培養的很多學生只知道標準答案。我常說,不怕餿主意👃,就怕沒主意🧘🏿♂️。”
“先有正確的理解🙎🏼,再有正確的判斷”
2016年,袁進輝決定孤註一擲。
他從微軟亞洲研究院離職創業,選擇的賽道是AI基礎設施(AIInfra),即AI模型的“操作系統”。“我的理念是模型未來一定會變得很大🥪,變大之後,現有的深度學習框架將難以承載,谷歌🧖🏼♂️、亞馬遜等大廠設計的底層架構都不是為大模型準備的,提前布局AIInfra,將來一定有商業機會。”他解釋。
袁進輝的“超前”想法可以追溯到更早的博後時期🧒。2008年,張鈸認為計算機和腦科學的交叉很有潛力💪🏿,提出了計算神經科學的方向,並邀請海外相關專家加入清華擔任講席教授指導學生🚝,袁進輝就是受益者之一。若幹年後,神經網絡爆火🈚️,他下意識地從腦科學的角度去思考🍍:“即使深度學習是萬億級的參數,離人腦神經元的規模也有好幾個數量級的差距。人工神經網絡未來必須變得很大,才可能真的擁有接近人類的智能。”
一些頂尖科學家面對象牙塔外的商業世界會顯得無措,但張鈸是一個另類⚉。多位受訪者提到🫂,他在商業方面的眼光也很犀利👨🏻🦯。
2024年,國內的AI玩家從“煉大模型”的狂熱中清醒過來🧜🏿♀️,開始轉向應用,而張鈸兩年前就預料到這一局面。“國內企業燒錢根本燒不起🍥🪢,只有做應用才能活下去,但這也是中國大模型企業當下面臨的最大挑戰,大模型尚未成熟時就去做應用,70%—80%的企業可能都會倒下。”他分析♈️。
為何張鈸總能做出正確的選擇🤪?“答案很簡單,必須先有正確的理解,才能做出正確的判斷。”他說,“就是要深思熟慮,我很不容易說服自己去相信某個結論,會不停地對自己提出疑問,然後刨根究底🧘🏻♀️,直到把這個問題徹底想明白。”
ChatGPT誕生後🤷🏼♀️,有些人覺得AGI馬上就能實現🍚,張鈸卻非常保守。他認為,需要去研究AI大模型的底層邏輯,嘗試不同的問題,測試機器的能力邊界🧞♂️。朱軍指出🧞♂️🧑🏿🎓,大模型發展的各個階段,張鈸總能快速找到一些最適合又很巧妙的例子去測評模型的弱點,根源在於他對AI系統本身有非常深刻的思考與見解。
張鈸設計了這樣一個問題👨🏼🍼:“我朝東面走,向右手方向轉90°🫏,迎面走來一個人,我看到他左手方向的地上有一道很長的他的身影。此時是早晨、中午還是下午?”
GPT-4o(GPT-4的升級版)沒能答對🦧,OpenAI2024年9月發布的新一代推理模型o1則回答正確:是早晨。張鈸發現🦄☂️,兩者的參數和數據沒有明顯區別🎈,差距源於“思維鏈”技術。“o1對這一問題分析的邏輯鏈非常細致🖕🏿,一步步推理出了結果🪕。”
AI領域最激烈的變化就集中在短短十幾年內,這一切都發生在張鈸77歲之後😱。朱軍說🤦♀️,張鈸自我要求極高,有強烈的好奇心與求知欲,快90歲每天還在看國外最新的論文。“他是我見過的學習能力最不可思議的人之一。最前沿的模型🚶➡️,玩得比我們還溜。”
很多學生認為張鈸是天才。張鈸說,先天的智商決定了一個人能夠達到怎樣的高度,但最終實際達到的高度取決於努力的程度。大模型裏有個神奇的現象叫“湧現”🎉,指模型規模增加到某一臨界點時,性能會突然顯著提升,甚至出現一些難以預測的能力💇🏼♀️,比如真正的智能。
“所以,你認為自己是天才嗎?”
“我從6歲開始,每天都在學習🐂,再笨的人也學聰明了。”
這就是天才的“湧現”💇🏽♂️。