里約奧運會上,智能寫作機器人Xiaomingbot曾一度吸引大眾目光。穿梭在各種運動賽場上,這位初出茅廬的AI小記者與許多身經(jīng)百戰(zhàn)的人類記者相比,絲毫不遜色。半個月賽程里,Xiaomingbot橫跨多個運動項目,成功報道了多場比賽,生產(chǎn)了上百篇流暢明晰的新聞稿件,不少人不禁感嘆,機器人寫作竟然已經(jīng)如此智能化了。
而這一切都要歸功于Xiaomingbot的幕后設(shè)計者——北京大學王選計算機研究所研究員、博士生導(dǎo)師、智源學者萬小軍。2023年7月7日,萬小軍憑借在自然語言生成方向取得的重要突破,榮獲2022年度王選杰出青年學者獎。多年來,萬小軍在自然語言生成方向持續(xù)攻堅克難,設(shè)計研發(fā)了多個智能寫作機器人,并在新聞傳媒行業(yè)驗證了其先進性與有效性,獲得了學界和業(yè)界的廣泛關(guān)注和一致好評。

王選杰出青年學者獎頒獎典禮現(xiàn)場,右一為萬小軍
萬小軍深情感謝了王選先生和陳堃銶老師的慷慨設(shè)獎,以及他們對后輩的鼓勵和提攜。他表示,作為后輩學人,自己未來還將繼續(xù)在自然語言處理領(lǐng)域深入探索,讓智能機器人擁有更加強大的功能,在更多的場景實現(xiàn)應(yīng)用。

萬小軍和王選先生雕像合影
無法“計算”的機緣巧合
與計算機打了20多年的交道,萬小軍人生中的“第一臺”計算機,是與大學室友集資購買并自行組裝的。
那是20世紀90年代,互聯(lián)網(wǎng)剛剛進入中國不久,尚未普及。計算機也還不是人們的日常必需品,上萬元一臺的價格,對當時大多數(shù)家庭來說,都過于高昂。萬小軍和他的室友們,“可能是出于一種男孩子天然的興趣”,六個人攢了好久的錢,湊在一塊兒,去中關(guān)村買了電腦配件,一起摸索著將電腦組裝起來。
在北大念本科時,萬小軍住在43樓,“屋子很小,床挨著床,中間有張小桌子,也沒有空調(diào)”。擁擠的生活空間里,這臺電腦給六個人帶來了不少樂趣:學編程、學軟件、學設(shè)計,甚至打游戲……
為了方便使用,幾個人在最初便約法三章,排了個時間表,但關(guān)于電腦的紛爭,仍會難以避免地發(fā)生:“沒少‘大打出手’!有的室友喜歡打游戲,沉迷《仙劍奇?zhèn)b傳》,常常通宵玩,另外還有位室友就會坐旁邊看著,可吵了。”回憶起這段青蔥歲月時,雖然說著埋怨的話,萬小軍的嘴角還是忍不住上揚。
跟室友鬧歸鬧,萬小軍用這臺電腦長了不少本事。他自學了編程技術(shù),還在某個“留守”學校的暑假,一個人獨占電腦,學會了photoshop。到大學畢業(yè)時,萬小軍已經(jīng)可以給中關(guān)村里的一家醫(yī)藥信息公司兼職寫程序,每個月有兩三千元的收入。
提起本科四年的學習生活,萬小軍用了“舒適”兩個字來形容。在他的記憶里,那時還沒有“卷”的概念.“我們宿舍六個人GPA都不高,我在我們班30個人里排第十,已經(jīng)是宿舍里最好的了。”萬小軍笑著調(diào)侃那時的自己,“啥也不懂,也不知道有哪些選擇。”
采訪過程中,面對記者一個接一個的“為什么”,萬小軍也的確不太能明確說出人生中許多重要決定背后的原因。
成長于湖北農(nóng)村的萬小軍,小時候最大的夢想是當兵。“我們一個村子的名字里都有‘軍’,軍人多威風多光榮啊,一身戎裝,保家衛(wèi)國。”
高考填志愿時,正是生物學最火爆的年份,萬小軍頗受鼓舞,興沖沖地把生物填作了第一志愿。奈何高考作文寫跑了題,他被調(diào)劑去了信息管理專業(yè),成了李彥宏的學弟。
出于興趣,萬小軍在北大讀本科期間輔修了計算機。學著學著,他又覺得“計算機比信息管理有意思多了”,索性在讀研時換了專業(yè),開始了與自然語言處理相關(guān)的研究和探索,一直到今天。
在萬小軍看來,計算機最擅長的事是“規(guī)整”。而他的成長經(jīng)歷與計算機研究之路,似乎與這兩個字不大相關(guān),反倒充滿了許多無法被“計算”的機緣巧合。
萬小軍對此倒很看得開,“人生很多事,不能太較真,得隨遇而安”。

萬小軍在工作中
二十余年磨一“劍”
萬小軍對待他的研究,顯然要“較真”多了。多年來持續(xù)在自然語言處理這一領(lǐng)域深耕,萬小軍的研究內(nèi)容主要包括針對人類語言的語義理解和自動生成兩部分。
“讀研的時候,我就開始從事文本信息處理相關(guān)的研究工作,當時的研究主要涉及文本檢索、分類、聚類等技術(shù),讀博時開始對自動文摘技術(shù)比較感興趣。”萬小軍告訴記者,剛讀博士時,他有機會去到微軟亞洲研究院非全職實習,這對他此后的科研經(jīng)歷產(chǎn)生了重要影響。
直到今天,萬小軍時不時仍會懷念那些時光,安靜、簡單卻充實。沒有太多瑣事來叨擾,他如饑似渴地徜徉在他感興趣的領(lǐng)域,如海綿般汲取養(yǎng)分。微軟研究院的研究水平在當時相較高校領(lǐng)先很多,萬小軍可以接觸到最前沿的研究和成果。
“我讀了很多論文。那時候?qū)W校實驗室沒有打印機,研究院里有,還可以免費打印論文,我每次都打印厚厚一大摞帶回宿舍,最后壘在一起得有一米多高。”萬小軍邊說邊向記者比劃起論文的厚度。正是這一篇篇論文,幫助萬小軍打下了堅實的理論基礎(chǔ),也是在那時,他敏銳地發(fā)現(xiàn)自動文摘在新聞領(lǐng)域所具備的巨大應(yīng)用價值。
工作后,萬小軍的研究逐漸拓展到一些其他自然語言生成技術(shù),例如基于數(shù)據(jù)的文本生成、文本復(fù)述、文本簡化等。目前,他側(cè)重于解決語言大模型生成內(nèi)容的幻覺和安全性問題。何為幻覺和安全性問題?他向記者解釋道:“ChatGPT這些大模型生成的文本內(nèi)容通常有不少的錯誤信息,即存在幻覺和虛構(gòu)事實。同時,大模型會生成有害或不符合人類價值觀的文本內(nèi)容(例如告訴使用者如何用刀進行自我傷害),這嚴重阻礙了語言大模型的應(yīng)用,因此我們需要想辦法進行幻覺/有害內(nèi)容的檢測與治理。”此外,萬小軍目前還對自然語言生成評價技術(shù)和跨模態(tài)生成技術(shù)比較感興趣,正在和他的學生們一起進行相關(guān)技術(shù)的探索。
功夫不負有心人,20多年磨一“劍”,萬小軍所研制的智能寫作機器人為人工智能領(lǐng)域的技術(shù)進步和新聞傳媒行業(yè)的技術(shù)變革作出了重要貢獻,并且已經(jīng)在市場上被證明具有廣泛的應(yīng)用價值。
2016年8月,萬小軍帶領(lǐng)團隊與今日頭條實驗室聯(lián)合推出新一代AI寫稿機器人——奧運AI小記者Xiaomingbot。在里約奧運會上,Xiaomingbot共撰寫了457篇關(guān)于羽毛球、乒乓球、網(wǎng)球的消息簡訊和賽事報道,每天產(chǎn)出30篇以上。2017年1月,萬小軍團隊又與南方都市報合作研發(fā)寫稿機器人“小南”。小南的寫作能力更強,掌握領(lǐng)域更廣泛,可撰寫的文體更復(fù)雜,包括了消費、路況、天氣、賽事、財經(jīng)、春運和AI簡報等內(nèi)容。

萬小軍在學術(shù)論壇上作分享
對智能寫作機器人的未來發(fā)展,萬小軍展露出足夠的樂觀:“自從語言大模型(例如ChatGPT)推出之后,機器寫作能力已經(jīng)超過了普通人的寫作能力,可以寫出不同風格的文章。此外,ChatGPT具有強大的學術(shù)寫作能力,能夠幫忙對學術(shù)論文進行潤色和修改,從而提高學術(shù)論文的寫作質(zhì)量。”
不過,在萬小軍看來,無論智能寫作機器人的能力進化到何種程度,它都無法完全取代人腦。“人類仍具有諸多優(yōu)勢,例如聯(lián)想、創(chuàng)新等等,人類可以創(chuàng)作出極富感染力和原創(chuàng)性的文學作品,發(fā)表極具洞察力和預(yù)見性的深邃觀點,在這些方面大模型仍難以企及。”因此,萬小軍認為,人類應(yīng)該學會駕馭機器,與機器分工協(xié)作,幫助自身更好地工作。
談及下一步研究規(guī)劃,萬小軍表示,自己還會在AI機器人記者領(lǐng)域繼續(xù)探索,希望可以盡早讓AI機器人實現(xiàn)自動狀態(tài)下的視頻圖像拍攝與采訪、并基于這些素材自動生成深度新聞報道,這樣可以讓機器人記者在一些高風險場景下(例如戰(zhàn)場)替代人類記者。此外,他還對機器辯論有著濃厚的興趣。機器辯論指的是讓機器掌握思辨能力,能夠與人類辯論并戰(zhàn)勝人類辯論高手。
風物長宜放眼量
在碩士畢業(yè)時,萬小軍報考了王選先生的博士,當時王選先生的身體狀況已經(jīng)不足以支撐他帶學生,萬小軍便也沒有機會聆教于其身側(cè),他一直頗感遺憾。此次獲獎,萬小軍不禁感慨萬千:“王選先生大膽創(chuàng)新的勇氣、百折不撓的精神和淡泊名利的境界,多年來始終指引著我,鞭策我在科研道路上戒驕戒躁、持之以恒、不懈奮進。”
過去的科研經(jīng)歷里,萬小軍沒少遇到溝溝坎坎。有些是科研自身的困難,“比如,如何發(fā)掘足夠新穎的學術(shù)思路,如何高效掌握爆炸式增長的新技術(shù)新知識”。那科研遇到瓶頸怎么辦呢?萬小軍笑著對記者說:“可以給自己打打氣,我就是會不停地給自己打氣,告訴自己能夠應(yīng)對這些挑戰(zhàn)。”
還有些是科研之外的挑戰(zhàn),考核晉升的壓力、實驗室的管理問題、經(jīng)費獲取的困難……樁樁件件,萬小軍和每一位科研工作者一樣感同身受。因此,他充分理解現(xiàn)下許多青年研究者面臨的壓力,但他依舊覺得,年齡焦慮沒有太大必要,相反,這對科研工作者來說還會造成巨大的消耗。風物長宜放眼量,萬小軍表示,人生的每一個階段都充滿可能性,并不需要急于一時。

萬小軍在辦公室
交談中,萬小軍與記者提起了王選先生的人生經(jīng)歷,令他感觸最深的一點是王選直到38歲才開始接觸“漢字信息處理系統(tǒng)工程”(“748工程”)。“此前他一直是個默默無聞的小角色,沒有什么資源,也捱過很長一段艱難歲月。這在年齡焦慮極為普遍的當下,幾乎是不敢想象的。畢竟在世俗層面上,當時一定會有人覺得,王選先生年近不惑卻依舊一事無成。”
“王選先生,還有張益唐教授,他們都是這樣。我覺得,有時候可以不用太在意一些世俗的評定,規(guī)定自己一定要在多少歲達成什么目標。”在萬小軍看來,年輕的時候,迷茫和焦慮都是常態(tài)。最重要的,是保持一顆平常心,多去問問自己內(nèi)心的聲音,把自己想做的事情堅持下去。
“堅定理想,但也不要鉆進死胡同里去。‘卡脖子’了,那就放一放,抬起頭看看別的領(lǐng)域,做點別的事情,說不定‘柳暗花明又一村’。做科研也需要發(fā)散思維,思維放開了,很多時候點子也就來了。”言及至此,萬小軍再一次提到了“隨遇而安”,“承認自己的不完美,這一點很重要。我們每個人都存在不足,我自己的不足可能比別人更多,而且有些不足終其一生都難以改變,那么在這樣的條件下我自己的目標是什么,自己要想清楚并且努力達到。”
該較真時較真,該隨緣時隨緣,這兩種迥異的態(tài)度,就這樣在萬小軍的身上達成了一種奇妙的平衡。空閑時間,萬小軍將自己的生活安排得有聲有色,“我會陪陪孩子,其實和學生的相處也能帶給我很多快樂”。他也真誠地祝福每一位科研工作者,都能找到科研的樂趣,快樂科研,快樂生活。
王選杰出青年學者獎介紹:
北京大學王選青年學者獎勵基金由王選夫人陳堃銶教授于2008年12月代表北京大學王選計算機研究所(原北京大學計算機科學技術(shù)研究所)捐贈基金設(shè)立。之后,王選所碩士研究生劉振飛校友連續(xù)多年捐資注入本基金,是北大最早的針對青年學者所設(shè)的獎勵基金。該基金下設(shè)“北京大學王選青年學者獎”,多年來獎勵了北大一批在教學崗位和科研工作中作出重要貢獻并具有巨大發(fā)展?jié)摿Φ那嗄杲處煛?/span>
王選院士作為推動中國漢字和印刷技術(shù)邁入計算機時代的開拓者,是新時代知識分子的杰出代表和自主創(chuàng)新精神的楷模,他的崇高品格與精神風范值得永遠銘記。為更好地紀念王選院士,發(fā)揚他堅持創(chuàng)新的科學精神和扶植新秀的高尚情懷,推動中國科技創(chuàng)新事業(yè)發(fā)展,擴大王選青年學者獎勵基金的影響力,2020年,北京大學王選青年學者獎勵基金決定增設(shè)全國性科技獎項“王選杰出青年學者獎”。該獎項實行推薦制,不受理個人(或單位)的申請或自薦,每年組織評選一次。候選者應(yīng)滿足以下條件:熱愛祖國,有良好的社會公德和高尚的職業(yè)道德;在科研工作中作出重要貢獻并具有巨大發(fā)展?jié)摿Γ蛘咂淇蒲谐晒玫街匾獞?yīng)用或有重要應(yīng)用前景;年齡在45歲以下的中國公民。每年由北京大學、中國計算機學會和中國工業(yè)與應(yīng)用數(shù)學學會聯(lián)合評選出在計算機和應(yīng)用數(shù)學領(lǐng)域中自主創(chuàng)新和應(yīng)用成果極為突出的杰出青年學者各一名,每人一次性獎勵人民幣50萬元。
為開展好王選杰出青年學者獎的相關(guān)工作,確保該獎項的公正性、獨立性和權(quán)威性,特設(shè)立王選杰出青年學者獎管理委員會、學術(shù)委員會、提名委員會及秘書處,學術(shù)委員會和提名委員會由數(shù)學、計算機理論與應(yīng)用領(lǐng)域的著名專家擔任,負責獎項的提名和評審工作,對候選人進行評議、表決后上報管理委員會審定。如當年度無合適人選,名額可空缺。