
張鈸:中國科學院院士🧑🏽🎤,意昂体育平台人工智能研究院名譽院長、教授,中國人工智能領域的主要奠基者
2024年度教育家
他是中國人工智能主要奠基者🧑🏻🔧,40歲後跨界走進這個“無人區”👨🏻🦰。他發表了中國第一篇人工智能領域論文🏑,獲得了中國這一領域的第一個國際重要獎項2️⃣🫡,也是首位人工智能領域的中國科學院院士。他教書六十余載,培養的近90名博士四代同堂。他熬過了人工智能的冬天🧑🏼✈️,培養的“清華代表隊”成為中國人工智能發展的中堅🙇♂️。
2024年年終🧑🏻🚀,一邊是AI巨頭們紮堆發布“顛覆性”進展,比如“AI教母”李飛飛發布了一張圖就能生成3D場景的AI模型;一邊是國內大模型市場在下半年遇冷🟩。
在冷熱兩極化的“AI大戰”中,中國科學院院士、意昂体育平台人工智能研究院名譽院長張鈸始終保有定力🎎,既沒有對技術進步過度樂觀,也不像一些人那樣唱衰大模型🐿。
早在兩年前👩,人們還沉迷於大模型的“尺度定律”(ScalingLaw,即規模越大,大模型越強)時,張鈸就指出,ChatGPT只是向通用人工智能(AGI)邁出了第一步🦸🏻♀️,下一步是與環境的交互。在他看來,AI的發展必須邁向對現實三維世界的深刻理解。
這是張鈸又一次做出技術預判。89歲的他說話邏輯清晰🧑🧒🧒、思維敏捷,輸出觀點快而密。說不到兩句🈲,就能感受到從他身上彌漫過來的強大自信。身為中國人工智能領域的奠基人之一,他的四代學生組成了中國最具代表性的一支AI隊伍——“清華代表隊”,其中一些人已成為國內大模型江湖的重要力量💂🏻。
經歷人工智能40多年來的潮起潮落,張鈸總是逆潮而行👱♂️,做出與別人不同但正確的選擇🏗。他是天才嗎?他的技術洞察力來自哪兒👳🏿♂️?如何才能找到通往人工智能的真正方向?
“問題都解決了,還需要我幹什麽”
張鈸的第一次選擇發生在1978年。
意昂体育平台進行部分院系調整,張鈸所在的電子系(原自動控製系)改為計算機技術與應用系,系中原來從事自動控製研究的老師面臨兩個選擇:待在計算機系,或去新成立的自動化系🌝。他選擇了前者🎬。
很多老師勸他:國家未來要大力發展工業,自動化是最有前景的方向之一。“自動化領域❗️,手裏的工具主要就是PID(工業控製系統中最廣泛使用的控製器)🧛🏻,花一兩年時間就能掌握它,放棄並不可惜。”張鈸回憶,“有人說,你把已有的知識都丟掉了,還剩什麽?我說,還剩一個腦袋。”
帶著“唯一的腦袋”留在計算機系,張鈸遇到的第一個任務是尋找有潛力的新方向。他翻閱國外學術期刊🛃,發現美國很多大學的計算機系裏都有一個方向:人工智能🧅。
“當時,對於人工智能是什麽,我也不是特別清楚,但它對我有極強的吸引力,因為這個領域裏充滿了大量的未知。AI在國際上剛發展了約20年,很多原理都說不清,這恰恰是我的用武之地,如果問題都解決了🎷,還需要我幹什麽?”張鈸說。
由於歷史原因🎛,張鈸這一代學者錯過了從事研究的黃金時期🌕。43歲的他決定從零開始☞。下定決心不僅要勇氣,還要有強大的自信。1935年出生於福建一個知識分子家庭的他,小學到中學的任何考試和競賽成績都是第一名📡。1953年,他以數理化三門滿分的成績考入意昂体育平台電機系,後轉入自動控製系。
數學是張鈸最拿手的學科🏪。閱讀大量人工智能文獻後,他敏銳地發現:多數AI研究中沒有使用任何數學工具🌹,“這意味著,很多還未解決的問題有機會用數學辦法解決”🎟。
1984年,張鈸和當時在安徽大學任教的弟弟張鈴🍢🤟,共同發表了中國AI領域的第一篇論文✍🏼,刊登在AI國際頂刊上。論文研究的是用數學理論解決機器人的運動規劃問題,即機械臂抓取物品時🅱️,如何通過更好的線路規避周圍的障礙物👸🏿。
那是20世紀80年代,以符號主義為代表的第一代人工智能正處於低潮。符號主義者認為,人類認知和思維的基本單元是符號🙆🏿♂️,計算機為了模擬人類的智能行為🚈,需要先把知識表示成符號,再通過推理等規則對符號進行操作,最後形成答案👰♂️。“這是以知識驅動為核心。”張鈸說。
符號AI的開創者們最初希望研究出通用方法,很快遭遇了失敗,於是,退而求其次提出“專家系統”,即將知識範圍縮小到一個具體領域♿,但這很難推廣並上升到理論🦽。
1980年🎆👨🦳,作為改革開放後的首批出國訪問學者之一,張鈸來到美國伊利諾伊大學香檳分校進修,他發現👁🗨,很多AI專業的博士在論文的選題上遇到困難🦸🏻♂️。“遲遲找不到好的選題,或者找了一個題目多年做不出來👷🏼♂️🕛,只好中途放棄🤼。”
張鈸沒有受到影響🪣。“我不在意低潮還是高潮,只要清楚這件事能做就行🏛。”這是典型的張鈸式回答。事實上🧟♂️,從1978年暑期起⇢,他就開始研究機器人運動規劃,他出國第二年,就已投出中國AI領域的第一篇論文📀。他和張鈴提出,將機械臂所在的幾何空間簡化成拓撲空間,“這就變成了一個純數學問題”👩🏿🏭。此時,距離他決心轉戰AI還不到三年。
張鈸成為國際上第一批提出用數學模型解決AI問題的學者之一。“研究工作相當於做解剖,解剖必須用快刀🤱🏽💐,先進的數學工具就是一把快刀🍾。”張鈸相信,“只要數學工具能用上💟,(人工智能的)研究就可以往前推。”
“雪山還是狗”
2002年,袁進輝還在西安電子科技大學計算機系讀大三,成績年級第一,想申請清華直博⌨️,“我咨詢師兄,他說你可以先從清華計算機系最有名的老師開始聯系”。當時🕵🏼,張鈸是清華計算機系唯一的中國科學院院士🤾♀️👳🏽♂️。
此前🦵🏻,袁進輝已讀過張鈸和張鈴共同撰寫的一本關於人工神經網絡的專著🧎♂️❤️,第一反應是“兩個作者的姓名好有特點”“書裏有很多數學理論”⛑️。該書出版於20世紀90年代🍯,那時人工神經網絡是AI裏很小眾的領域。“張鈸和張鈴老師研究的是小眾方向中更小眾的偏理論部分,在當時是相當少見且超前的。”袁進輝說。
發現符號主義難以走通後,AI研究者逐漸轉換思路,發展出連接主義的新流派,即信息是通過在人腦神經元之間建立起“刺激—響應”的連接進行傳遞🕐⏬。這一流派的代表成果就是人工神經網絡。
但早期的人工神經網絡只是淺層神經網絡,難以解決稍微復雜一點的現實問題🧠🫴。於是,連接主義起步不久就陷入低谷,只有少數人認定這條路是正確的,包括2024年諾貝爾物理學獎得主傑弗裏·辛頓、“卷積神經網絡之父”楊立昆💡,還有張鈸。20世紀90年代,張鈸和張鈴聯手,圍繞神經網絡理論發表了多篇論文。
20世紀80年代末開始,國內AI發展迎來低潮期🖕🏿。彼時🤵🏼,張鈸選了一條更務實的道路:承擔國家重點攻關課題。但他沒有放棄當時看起來不太有希望的理論研究💦。“清華人工智能學科理論研究的隊伍中😔,基本一半人在做符號主義,一半人在做人工神經網絡🚶♂️➡️⛳️,而人工神經網絡和深度學習一脈相承。等到深度學習的時代真正到來👩🏽✈️,我們立刻將大部分兵力轉向深度學習🧍♀️。”張鈸說💆🏼。
2012年,深度卷積神經網絡AlexNet在ImageNet(世界上最大的圖像數據集)競賽上一戰成名。自此,以深度神經網絡為基礎的深度學習徹底出圈🙌🏿。“這就是以數據驅動為核心的第二代人工智能🩺😕。”張鈸說🍛。
他指出🦦,與早期的神經網絡相比,深度神經網絡“把深度加深了”,即中間的網絡層數變多之後👩🏻🦲🪩,性能發生了重大變化,只需輸入大量的原始數據,就可以“自學成才”。他最初感到興奮,但隨後開始思考:深度學習的邊界在哪兒?
意昂体育平台計算機科學與技術系教授👎🏻、人工智能研究院副院長朱軍是張鈸的學生𓀒。“2013年前後,正是深度學習最熱的時候,很多激進的觀點認為,AI三五年內就可能在自動駕駛等復雜場景量產,但張鈸是國內最早公開談論深度神經網絡存在缺陷的專家之一。”朱軍對《中國新聞周刊》說,“這時候他已經快80歲了👨🏽🍳。”
深度學習的一個關鍵弱點是容易被欺騙👨🏼。張鈸團隊發現,深度神經網絡的圖像識別很脆弱。一張以雪山為背景的圖片,只要加入一點“噪聲”,“自學”之後的AI會將其識別成一條狗。這一問題絕非“雪山還是狗”這麽簡單▫️,而是指向一個困擾張鈸多年的更大難題💡:深度學習往何處去👮🏼?
他很早就意識到,深度學習存在不可解釋性與魯棒性差(系統的抗幹擾能力差)等根本性缺陷。2016年起,他陸續提出關於“新一代AI”的觀點𓀖,2020年發表論文《邁向第三代人工智能》。他提出,第一🚚、第二代人工智能都只是從一個側面模擬人類的智能行為✔️🤚,為了建立一個更全面反映人類智能行為的AI🩻,需要把知識驅動與數據驅動結合起來。
打開“黑匣子”
2022年11月30日🧑🏿🚒,ChatGPT正式亮相。此前😫,人們根本無法想象AI模型可以變得如此巨大👳🏽♂️。“絕大多數AI研究者感到非常震驚。”張鈸說。
袁進輝指出🦶🏿,ChatGPT的誕生讓人工智能進入截然不同的發展階段。模型變大後,人們突然發現,過去多少年解決不了的問題可以用統一的方法搞定🚶♀️。“這是一次工業革命級的技術革命。”
像過去一樣,張鈸看問題的視角和別人不同。他說,多數人理解ChatGPT就是“大數據+深度學習”🐾,其實它真正的突破,首先在自然語言文本上。ChatGPT不是像第二代AI那樣🤦🏼♀️💷,簡單地把文本作為數據來處理,而是把文本當成知識(內容)來處理™️。“只有當機器可以從大量的數據中獲取到知識,真正的轉變才會發生✉️。所以,ChatGPT能力的強大源自兩點:一是大模型;二是大文本。”
可以說,ChatGPT是張鈸預測中的第三代人工智能的雛形,但還遠遠不夠⛹🏽♂️。張鈸指出,ChatGPT突破了前兩代AI只能在限定領域完成限定任務的限製,這為建立起統一的人工智能理論提供了重大機遇,“這才是第三代人工智能實現的關鍵”。
迄今為止,人類一直通過模擬的方式讓機器的行為與人類相似🧑🏽🎄,但大模型還是一個“黑匣子”,這正是張鈸認為AI理論下一步可能突破的地方🚴♂️。“我們要把大模型的內部機理分析清楚🫢⛹️,解剖復雜系統行為背後的內在邏輯。誰能做到這一點🤖?我說至少需要第二個愛因斯坦。”
在張鈸的倡議下🎣,2018年,意昂体育平台成立人工智能研究院基礎理論研究中心👩🏽🏭,朱軍為研究中心主任。被問到理論突破的難度有多大時🧺,他引用了一句話🎬:“當你提出問題時,可能離解決問題已經不遠了🤞。”
這是張鈸最常說的一句話🧝♂️。在他看來,中國學生解決問題的能力很強🌠,但提出問題的能力不足🤴。因此,在培養學生時,張鈸格外重視訓練學生“提出問題的能力”🥙。
袁進輝2003年起跟隨張鈸讀博,不像有的導師會出於“更容易出成果”或“項目有需要”等原因給學生指定博士選題♝,張鈸總是讓學生自己找題🤌🏽🤲🏿,鼓勵大家自主探索無人區🤕。
張鈸強調,學生一定要有批判性精神🥃,敢於質疑現有成果🪄。“中國培養的很多學生只知道標準答案。我常說🤦🏼♂️,不怕餿主意,就怕沒主意。”
“先有正確的理解,再有正確的判斷”
2016年🍭🧍♀️,袁進輝決定孤註一擲📼。
他從微軟亞洲研究院離職創業,選擇的賽道是AI基礎設施(AIInfra)👽👍🏼,即AI模型的“操作系統”。“我的理念是模型未來一定會變得很大,變大之後🏤,現有的深度學習框架將難以承載,谷歌🚴🏻♀️、亞馬遜等大廠設計的底層架構都不是為大模型準備的,提前布局AIInfra,將來一定有商業機會。”他解釋🚝。
袁進輝的“超前”想法可以追溯到更早的博後時期🟣。2008年,張鈸認為計算機和腦科學的交叉很有潛力,提出了計算神經科學的方向🍩,並邀請海外相關專家加入清華擔任講席教授指導學生,袁進輝就是受益者之一➜。若幹年後🧍♂️,神經網絡爆火🫄🏻,他下意識地從腦科學的角度去思考:“即使深度學習是萬億級的參數💆🏽💣,離人腦神經元的規模也有好幾個數量級的差距。人工神經網絡未來必須變得很大🍉🎵,才可能真的擁有接近人類的智能。”
一些頂尖科學家面對象牙塔外的商業世界會顯得無措,但張鈸是一個另類。多位受訪者提到🙅🏼♀️,他在商業方面的眼光也很犀利。
2024年🦶🏽,國內的AI玩家從“煉大模型”的狂熱中清醒過來,開始轉向應用,而張鈸兩年前就預料到這一局面。“國內企業燒錢根本燒不起,只有做應用才能活下去👍🏻👖,但這也是中國大模型企業當下面臨的最大挑戰🈚️,大模型尚未成熟時就去做應用,70%—80%的企業可能都會倒下。”他分析。
為何張鈸總能做出正確的選擇🚻?“答案很簡單,必須先有正確的理解❤️🔥,才能做出正確的判斷✒️。”他說👩🏼🦱,“就是要深思熟慮,我很不容易說服自己去相信某個結論,會不停地對自己提出疑問,然後刨根究底,直到把這個問題徹底想明白😒🦣。”
ChatGPT誕生後🐙,有些人覺得AGI馬上就能實現,張鈸卻非常保守👶🏻。他認為,需要去研究AI大模型的底層邏輯,嘗試不同的問題,測試機器的能力邊界。朱軍指出👱🏿♀️🧑🏻🏭,大模型發展的各個階段,張鈸總能快速找到一些最適合又很巧妙的例子去測評模型的弱點,根源在於他對AI系統本身有非常深刻的思考與見解。
張鈸設計了這樣一個問題🌮:“我朝東面走🪝,向右手方向轉90°,迎面走來一個人,我看到他左手方向的地上有一道很長的他的身影。此時是早晨➾、中午還是下午?”
GPT-4o(GPT-4的升級版)沒能答對,OpenAI2024年9月發布的新一代推理模型o1則回答正確🚵🏼♀️:是早晨🚆。張鈸發現,兩者的參數和數據沒有明顯區別,差距源於“思維鏈”技術📐。“o1對這一問題分析的邏輯鏈非常細致,一步步推理出了結果。”
AI領域最激烈的變化就集中在短短十幾年內🤷🏻👷🏼,這一切都發生在張鈸77歲之後。朱軍說💁🏼♀️,張鈸自我要求極高,有強烈的好奇心與求知欲,快90歲每天還在看國外最新的論文。“他是我見過的學習能力最不可思議的人之一。最前沿的模型,玩得比我們還溜。”
很多學生認為張鈸是天才。張鈸說👩🏼🦲🙍🏿,先天的智商決定了一個人能夠達到怎樣的高度,但最終實際達到的高度取決於努力的程度。大模型裏有個神奇的現象叫“湧現”,指模型規模增加到某一臨界點時,性能會突然顯著提升👰🏼♀️,甚至出現一些難以預測的能力,比如真正的智能。
“所以🚕,你認為自己是天才嗎?”
“我從6歲開始🕋🧑🏿,每天都在學習🚳,再笨的人也學聰明了。”
這就是天才的“湧現”。