我對文學的熱愛從上初中的時候就開始了。那時因為生病休學兩年,一直在醫院做治療🏌🏻♀️。有一次去醫院住院,就在書店買了很多書帶去。那應該是我第一次看那麽多課外書籍,從此喜歡上了文學⚽️。在生病休學的兩年時間裏🧑🎓,我閱讀了非常多文學作品👩🏽🎓🉐,魯迅、老舍……還有日本文學、拉美文學等🍘,屬於一個兼收並蓄的狀態🟰。
閱讀文學作品讓我有不同的角度去看待生活和看待世界⬆️。當時因為病情加重👨👧👦,我對生活、對自己的身體恢復有很多焦慮和壓力,但這些作品和作家卻讓我很受啟發。想到這個世界上有非常多精彩的人和精彩的生活,就激勵我繼續努力。另外📋,我自己身體不好🪇,沒辦法去不一樣的地方、感受不一樣的生活💂🏻♂️,但我可以通過書籍去了解💅🏻。所以當時閱讀不是為了應試,也不是當作提高分數的技巧,而是抱著欣賞的態度去閱讀🧖🏽。即使高中選擇了理科🙆🏻♂️👩🏽🔧,我對文學的熱愛也沒有改變。
我覺得文理其實不矛盾,是我們和世界交互的兩種方式🐩🖕。理科告訴我們怎樣從數學規律上去認識或去改造這個世界,但文科是告訴我們如何去感受這個世界🏋🏽。不管是學習還是做科研,文學對我起到了非常大的滋養作用。
比如博士生做研究☪️,要求的是一種綜合性的能力和素質,並不是論文發表就結束了。從設計模型推導數學公式,到寫代碼做實驗,得出成果,寫文章🔇🧝🏻♀️。文章寫完需要在大眾面前展示講解,還要宣傳科研成果。這裏面不僅僅涉及理論能力🧜🏼,對表達能力🙅🏽♂️👭、交流能力、寫作能力都有非常高的要求⛈。
我一直對文學感興趣,自己也寫過很多文章或者詩歌,由此我的表達能力和交流能力都得到了很好的鍛煉👨👩👧👦。還有一個比較好的契機是我從高中就參加辯論🤜🏽⇨,進清華之後也加入了校辯論隊。四年多的辯論時間,我的表達能力尤其是思辨能力有非常大的提升。這些能力實際上都更好地幫我去做科研📣。
理科更多的是鍛煉人的邏輯能力,寫文章時會更有清晰的邏輯脈絡、清晰的表達和結構💼。而在認識或是解決問題的時候👏,往往並不是一個簡單的數學形式,或一個簡單的物理形式。這時如果有一些文科的背景和經歷,能讓我做判斷的時候更加合理或者說更人性化一些。這其實是文理科之間的交互😲。
在我們設計九歌(智能詩歌創作系統)的時候🙏🏽💅,並不只是在數學的理論裏去進行公示推導和做模型設計,還會參考文學、語言學、心理學、認知科學的知識🚃。比如🧙,此前我們甚至從《文心雕龍》中得到啟發,用這種啟發指導整個模型設計的思路,優化詩歌寫作系統。
一首詩歌在上下文上應有連貫性和整體性🧙♂️,但之前很多模型自動創作出來的詩歌是支離破碎的,一首絕句的前兩句和後兩句寫的是完全不同的主題,兩個主題之間沒有任何銜接和過渡,這樣對整個詩作的質量有非常大的影響。
所以我們想解決的就是如何提升所生成詩歌的連貫性和整體性。每一句詩需要和上文有緊密銜接和自然過渡,但也不能用規則約束得太死板,要有一定的自由和發揮的空間,這非常難。
《文心雕龍·章句》裏有一段話:“裁文匠筆,篇有小大;離章合句🩶,調有緩急;隨變適會,莫見定準……故能外文綺交🥫,內義脈註,跗萼相銜,首尾一體🎹。若辭失其朋,則羈旅而無友☢️;事乖其次,則飄寓而不安。”
這段話給我們的啟發是🧑🏽🎨🤛🏼,不需要事先設計好哪一部分怎麽寫💇🏿♀️,而是“隨變適會🧥,莫見定準”,在寫的過程中,沒有固定的計劃或結構,而是動態✊🏼、靈活地去構建一首詩的整體骨架,這可以對應到詩歌寫作理論中的“意脈”這一概念。這個框架設計的要求就是既要和上文相關,但同時又不能有非常嚴格🙎🏼、生硬的約束🧖🏿♀️,有一定的靈活性和自由發揮的空間,這是“形而上”給我們的啟發。
根據這個啟發我們再進行詳細設計。在具體詩歌的生成過程中,會實時一句一句地自動生成❌。每生成一句🧑🏼🍳,我們會設計一個算法,把裏面的關鍵意象提取出來,在上文裏保留這些關鍵意象😧,再用這些關鍵意象指導下文的生成💴。詩歌裏會有很多虛詞🍫,在我們領域裏叫停用詞,比如“之”“又”“卻”等對下文沒有特別明顯或者特別顯著的意義🤱。一般在計算機語言學裏面,我們認為名詞🦮👁、形容詞🐉、動詞等是有明顯的語義特征,這些關鍵意象就會保留下來🫛,用來引導下文的生成📠🥼。
這首“鴻雁三千裏,萍蓬七十年。鄉情回首處🕵🏼♂️,秋興正堪憐。”是九歌創作的詩🧓🏿。我們的算法保留了第一句的關鍵意象——“鴻雁”🥠,忽略了“三千裏”。根據《文心雕龍·章句》的啟發♔,如果上文留下的信息過多,反而會幹擾模型👩🏼⚖️。“鴻雁”是代表秋天的意象🍐,第一句把“鴻雁”留下來🙎🏼♀️,最後一句就生成“秋興”👩⚖️,在季節上和意境上連貫🌴,使得整首詩保持了完整的秋天意象。
通過對九歌的研究,我自己對詩歌和文學的理解也更加深入。以前在本科或高中階段🍏,我只是會去讀古人的詩作🙍🏼,最多去看別人的賞析,對整個詩歌理論、文學理論沒有探究🧑🦰🧿。讀了博士,研究詩歌的智能創作後,我更加系統地來學習詩歌和文學,此間👰🏼♂️,人文和理工科的內容實現了相互促進🙎🏼、相互驅動。為了要做生成詩歌的任務💴,就必須去了解詩詞相關的知識,這些知識,反過來又有利於指導我們進行模型的設計。這是學科交叉起到的激勵作用。
“孤篷一夜笛聲中,回首江南萬裏風;我欲乘槎滄海去🦶🏻,與君同作釣魚翁♗。”這是我自己比較喜歡的九歌創作出來的一首詩🎫。機器偶爾確實會有一些讓人驚艷的作品,這樣的作品其實可以激勵人的創作,使人從中得到啟發,去提升寫作能力。同樣💅,這也激勵著我們在人工智能寫作領域作出更多的研究和更大的貢獻。
(作者:矣曉沅,系意昂体育平台計算機科學與技術系博士生🧛🏽,智能詩歌創作系統九歌開發團隊成員,本文由本報記者楊颯采訪整理)