首頁>書畫·現場>訊息訊息
以大數據“全景式”呈現唐詩宋詞
“問汝平生功業,黃州惠州儋州。”蘇軾曾給自己做了這么個總結。但是蘇軾一生到底有多顛沛?光看文字可能不太好想象。但是打開《唐宋文學編年地圖》,輸入“蘇軾”,一張中國地圖上被密密麻麻地標記了位置。這張地圖,就是一張直觀生動的“蘇軾顛沛流離圖”。
2017年3月,中南民族大學文學與新聞傳播學院教授王兆鵬牽頭打造的《唐宋文學編年地圖》上線。在這張地圖上,既可以查出唐宋時期某位詩人一生的足跡與作品,也能查出一個地方曾接納過的所有詩人。該產品突破了唐詩宋詞文字閱讀的“套路化”模式,變成了直觀生動的地圖展示,一上線即收獲廣泛關注。最初上線的前兩天,點擊量超過220萬。《唐宋文學編年地圖》為何會產生這么大的影響?新版本又有哪些變化?記者就此進行了采訪。
讀詩方式的創新
“我當年寫博士論文的時候,就考慮能不能用統計學的方法解讀唐詩宋詞,進行定量分析。那個時候沒有計算機,就是靠人工錄入。”王兆鵬用大數據解讀唐詩宋詞,并非一時突發奇想,而是貫穿在他一直以來的學術脈絡中。
在《唐宋文學編年地圖》之前,王兆鵬及其團隊曾有一部著作引發了不小的輿論爭議——《唐詩排行榜》。該書運用統計學的方法得出了一份唐詩前100名的排行榜,其中排在榜首的是崔顥的《黃鶴樓》。
“當時很多人不理解,覺得‘文無第一’,詩怎么可以排行呢?其實仔細閱讀這本書就知道,這本書主要是還原文學評價的歷史情境,哪首詩被歷代文人最多地提起、引用、編入選本,這些都是有據可查的。排行榜是用數據得出的‘結論’。它不是對一首詩的價值評判,而是對一首詩影響力的評估?!?/p>
而這本書也進一步啟發了王兆鵬:詩,不一定只是紙面誦讀,還可以運用大數據,走進歷史場景之中,還原當時的文學圖景,進行一場讀詩方式的創新?!懊娛且豢每脴?,而還原歷史,則是重現那片森林。”
之后,王兆鵬帶領學生們與搜韻公司合作,參與的人數超過100人,歷時5年,開發出了《唐宋文學編年地圖》,一上線就反響不錯。“直到今天我們還在不斷維護,在后臺添加數據。唐宋文學的數據量太大,必須不斷更新?!?/p>
經過一年的運營與總結,王兆鵬又計劃著對文學地圖進行一次更新,讓唐詩宋詞不僅能讀,能看,更能“走進”。
“全景式”呈現唐詩宋詞
雖然《唐宋文學編年地圖》反響不錯,但也收到了一些意見,如頁面卡頓、界面單調等等。除了改進這些用戶體驗上的問題,王兆鵬還有更多考量。
“就像一句‘江流天地外,山色有無中’,我們今天讀起來覺得是好詩,但是如果能走到那個地方去,就會發現風景確實和詩人描寫的是一樣的。這時就會發現不只是詩人寫得好,而且風景就是如此,如果知道這些,對解讀一首詩必然大有幫助。”
王兆鵬希望改進后的地圖,可以“全景式”呈現唐詩宋詞?!氨热缭诘貓D上點開一首詩,除了文字信息,還能彈出場景畫面,重現詩人寫作時看到的自然景觀。像李白的‘兩岸青山相對出’,詩人為什么這么寫,一看圖片就明白了?!?/p>
為了實現這一目標,王兆鵬及其團隊,與市場上的數據公司合作,不斷改進。王兆鵬在采訪時除了詩詞名句,還不時冒出編程的專業術語,對各類技術名詞信手拈來?!拔沂茄芯抗诺湮膶W的,但一點也不排斥技術。當今的技術手段能夠極大地豐富我們對傳統文學的解讀方式,古典文學的學者應該多了解新的信息技術?,F在的技術進步太快了,沒有做不到,只有想不到。理解了技術的邏輯,會給我們的研究視野帶來極大的拓展?!?/p>
預計2019年年中,新版本的《唐宋文學編年地圖》將會上線。“原本《唐宋文學編年地圖》主要是想面向學術界,新版本將更多面向大眾,優化一般網民的使用體驗。這將是一個尊重市場規律的產品,增強體驗感。古典文學不只是一種讀物,也能變成有科技感和現代感的產品?!蓖跽座i這樣介紹。
數據庫自主權要掌握在自己手中
如今,王兆鵬考慮最多的還有一事——數據安全?!霸鯓臃乐箘e人入侵我們的數據庫、扒走我們的整理成果,我們花了大量精力來做這件事。整理一個數據庫的勞動量非常大,但被別人‘黑’走卻是分分鐘的事。”
王兆鵬使用了諸多技術辦法,來給數據加密,“安全”,是王兆鵬在其團隊里經常提起的詞。
也正是在提升數據庫安全性的過程中,王兆鵬發現了將數據庫掌握在自己手里的意義?!艾F在包括中國文獻在內的諸多數據庫,其所有權都在國外?,F在的學術研究,誰掌握了數據庫,很大程度誰就擁有學術自主權,別人就可以來定義你的文獻價值和學術走向。我在整理數據的時候,深感我們在數據庫方面的薄弱,甚至是中國古典文學,有不少數據庫都在國外?!?/p>
王兆鵬希望,借著梳理文學地圖的契機,能夠打造一個翔實、全面、具備學術價值的數據庫?!耙驗槲矣枚糠治龅霓k法研究古典文學很多年,其實也暗自憋著一股勁兒,想做出一個優質的、屬于中國人的數據庫,爭得一份學術自主權?!?/p>
《光明日報》( 2019年01月21日 08版)
編輯:楊嵐
關鍵詞:王兆鵬 數據