我對文學的熱愛從上初中的時候就開始了。那時因為生病休學兩年😨,一直在醫院做治療🧎♀️➡️。有一次去醫院住院▪️,就在書店買了很多書帶去。那應該是我第一次看那麽多課外書籍👨🏼⚖️,從此喜歡上了文學。在生病休學的兩年時間裏🧑🎨,我閱讀了非常多文學作品🦵🏻,魯迅🧝🏻🫳🏼、老舍……還有日本文學、拉美文學等🕐,屬於一個兼收並蓄的狀態🫂🔃。
閱讀文學作品讓我有不同的角度去看待生活和看待世界。當時因為病情加重,我對生活、對自己的身體恢復有很多焦慮和壓力,但這些作品和作家卻讓我很受啟發。想到這個世界上有非常多精彩的人和精彩的生活,就激勵我繼續努力🗺🎂。另外,我自己身體不好𓀜,沒辦法去不一樣的地方、感受不一樣的生活😿,但我可以通過書籍去了解。所以當時閱讀不是為了應試,也不是當作提高分數的技巧👓,而是抱著欣賞的態度去閱讀𓀝👨🏿⚖️。即使高中選擇了理科,我對文學的熱愛也沒有改變🧞♂️。
我覺得文理其實不矛盾🙎🏻♀️,是我們和世界交互的兩種方式。理科告訴我們怎樣從數學規律上去認識或去改造這個世界👎🏼🧑🏿💼,但文科是告訴我們如何去感受這個世界。不管是學習還是做科研,文學對我起到了非常大的滋養作用😹。
比如博士生做研究,要求的是一種綜合性的能力和素質,並不是論文發表就結束了🧖♂️。從設計模型推導數學公式,到寫代碼做實驗🔇,得出成果🐄,寫文章。文章寫完需要在大眾面前展示講解,還要宣傳科研成果。這裏面不僅僅涉及理論能力,對表達能力、交流能力、寫作能力都有非常高的要求🕵🏼♀️。
我一直對文學感興趣,自己也寫過很多文章或者詩歌☦️,由此我的表達能力和交流能力都得到了很好的鍛煉。還有一個比較好的契機是我從高中就參加辯論🥮,進清華之後也加入了校辯論隊🎱。四年多的辯論時間,我的表達能力尤其是思辨能力有非常大的提升👩🏿💼。這些能力實際上都更好地幫我去做科研。
理科更多的是鍛煉人的邏輯能力🎳👨🏻🎨,寫文章時會更有清晰的邏輯脈絡、清晰的表達和結構👩🏭。而在認識或是解決問題的時候,往往並不是一個簡單的數學形式👨👩👦,或一個簡單的物理形式。這時如果有一些文科的背景和經歷⛑,能讓我做判斷的時候更加合理或者說更人性化一些👨🎓。這其實是文理科之間的交互👩🏽🍳🧑🏻🦼。
在我們設計九歌(智能詩歌創作系統)的時候,並不只是在數學的理論裏去進行公示推導和做模型設計,還會參考文學、語言學、心理學、認知科學的知識🏃🏻♂️➡️。比如,此前我們甚至從《文心雕龍》中得到啟發,用這種啟發指導整個模型設計的思路🐒👨👩👦,優化詩歌寫作系統🤷🏽♀️🔷。
一首詩歌在上下文上應有連貫性和整體性,但之前很多模型自動創作出來的詩歌是支離破碎的🧯,一首絕句的前兩句和後兩句寫的是完全不同的主題,兩個主題之間沒有任何銜接和過渡,這樣對整個詩作的質量有非常大的影響👁。
所以我們想解決的就是如何提升所生成詩歌的連貫性和整體性。每一句詩需要和上文有緊密銜接和自然過渡,但也不能用規則約束得太死板,要有一定的自由和發揮的空間🏌🏻♀️,這非常難。
《文心雕龍·章句》裏有一段話🚂😱:“裁文匠筆,篇有小大;離章合句🫅🏼,調有緩急;隨變適會,莫見定準……故能外文綺交,內義脈註👌,跗萼相銜,首尾一體🚰。若辭失其朋,則羈旅而無友;事乖其次,則飄寓而不安。”
這段話給我們的啟發是🔡,不需要事先設計好哪一部分怎麽寫🧑🏿💻,而是“隨變適會,莫見定準”,在寫的過程中,沒有固定的計劃或結構,而是動態、靈活地去構建一首詩的整體骨架,這可以對應到詩歌寫作理論中的“意脈”這一概念。這個框架設計的要求就是既要和上文相關,但同時又不能有非常嚴格、生硬的約束🧖🏼♀️♌️,有一定的靈活性和自由發揮的空間,這是“形而上”給我們的啟發。
根據這個啟發我們再進行詳細設計。在具體詩歌的生成過程中📕,會實時一句一句地自動生成。每生成一句🟡🈳,我們會設計一個算法🧜🏻♂️,把裏面的關鍵意象提取出來🧖,在上文裏保留這些關鍵意象💅👨🏼✈️,再用這些關鍵意象指導下文的生成🏗。詩歌裏會有很多虛詞🦇,在我們領域裏叫停用詞,比如“之”“又”“卻”等對下文沒有特別明顯或者特別顯著的意義。一般在計算機語言學裏面➙,我們認為名詞、形容詞、動詞等是有明顯的語義特征👸🏽,這些關鍵意象就會保留下來🖐🏿,用來引導下文的生成。
這首“鴻雁三千裏🕴🏻,萍蓬七十年。鄉情回首處🧑🦽,秋興正堪憐。”是九歌創作的詩。我們的算法保留了第一句的關鍵意象——“鴻雁”👨🏿🔧,忽略了“三千裏”。根據《文心雕龍·章句》的啟發,如果上文留下的信息過多,反而會幹擾模型。“鴻雁”是代表秋天的意象,第一句把“鴻雁”留下來🌏,最後一句就生成“秋興”,在季節上和意境上連貫,使得整首詩保持了完整的秋天意象💇♂️。
通過對九歌的研究⛹🏿♀️🦖,我自己對詩歌和文學的理解也更加深入🧑🦲。以前在本科或高中階段,我只是會去讀古人的詩作,最多去看別人的賞析🙇🏽♂️,對整個詩歌理論、文學理論沒有探究。讀了博士🍶,研究詩歌的智能創作後♿️,我更加系統地來學習詩歌和文學🧑🏻🦱🌇,此間,人文和理工科的內容實現了相互促進、相互驅動。為了要做生成詩歌的任務,就必須去了解詩詞相關的知識🍣,這些知識👨👩👧👦,反過來又有利於指導我們進行模型的設計𓀔。這是學科交叉起到的激勵作用⬅️。
“孤篷一夜笛聲中,回首江南萬裏風👎🏽;我欲乘槎滄海去,與君同作釣魚翁🏋🏿♀️。”這是我自己比較喜歡的九歌創作出來的一首詩。機器偶爾確實會有一些讓人驚艷的作品🕣,這樣的作品其實可以激勵人的創作🙍🏽♂️,使人從中得到啟發,去提升寫作能力。同樣,這也激勵著我們在人工智能寫作領域作出更多的研究和更大的貢獻。
(作者:矣曉沅,系意昂体育平台計算機科學與技術系博士生🟤👀,智能詩歌創作系統九歌開發團隊成員,本文由本報記者楊颯采訪整理)