??《全唐詩》近五萬首作品,出現(xiàn)最多的字是人、最多的季節(jié)是春天、最多的顏色是綠色系、最多的情感是悲。
??當(dāng)文科生們因?yàn)椤拔臒o第一”而爭論不休時(shí),大數(shù)據(jù)早就默默給出了答案:唐詩第一名是崔顥的《黃鶴樓》。
??人工智能席卷萬物的時(shí)代,詩歌屬于詩人,還是屬于ChatGPT?
五萬首唐詩,一言可蔽之
一個(gè)人一生能讀過多少首詩?答案是恐怕連一本詩集都讀不完。
比如《全唐詩》,這本詩集收錄了2200余位詩人的詩作約48900多首,就算是古代文學(xué)的博士,也不會(huì)有多少人能全部讀完。
沒有關(guān)系,現(xiàn)在已經(jīng)進(jìn)入科技時(shí)代,大數(shù)據(jù)洞察一切,一分鐘了解五萬首詩不是夢!
《全唐詩》的所有詩句里,出現(xiàn)最多的不是風(fēng)花雪月、江河湖海,也不是農(nóng)家田舍、大漠孤煙,出現(xiàn)最多的字,是“人”——文學(xué)是人學(xué),高爾基誠不我欺!
字頻統(tǒng)計(jì),《全唐詩》出現(xiàn)最多的字top10分別是:人、山、風(fēng)、日、天、云、春、花、年、月。
“人生得意須盡歡”“路上行人欲斷魂”“人面不知何處去”“人間四月芳菲盡”……人,是唐詩的靈魂!
唐詩中出現(xiàn)最多的季節(jié),不出意外是春天。春回大地萬物生發(fā),來一首;花花草草爭奇斗艷,來一首;遇見春游的美人,更要來一首!
《全唐詩》中,關(guān)于春天的詩作共計(jì)19800多首,超過了其他三個(gè)季節(jié)的總和。僅次于春的是秋季,約有13900多首;關(guān)于冬季的詩作最少,才1200多首。看來詩人們也比較怕冷、冬天不愿出門。
春天是個(gè)萬能的季節(jié),既能表達(dá)萬物復(fù)蘇的喜悅,也能寄托傷春惜春的惆悵,總有一種情緒適合詩人的表達(dá)。張若虛《春江花月夜》、杜甫《春望》、《白居易《錢塘湖春行》、孟浩然《春曉》……在中國人均背誦十首以春為題材的唐詩應(yīng)該易如反掌。
在唐詩色譜上,出現(xiàn)最多的顏色是綠色,以及以綠色為主的間色包括碧、翠、蒼、青等。
“綠樹村邊合,青山郭外斜”“客路青山外,行舟綠水前”“碧玉妝成一樹高,萬條垂下綠絲絳”“映階碧草自春色,隔葉黃鸝空好音”……唐詩所打造的的綠色世界清新、淡雅、自然,自有“天人合一”的和諧美好。
唐詩的世界是個(gè)五彩繽紛的絢麗世界,除綠色外,紅色系(紅、丹、朱、赤、絳等)、黑色系(暗、玄、烏、冥、墨等)、白色系(白、素、皎、皓等)以及其他各式各樣的“國色”均不遑多讓,甚至比現(xiàn)代人的生活還要多姿多彩。
詩言志、歌詠言。詩人們寫詩是為了表達(dá)自身情感,那么唐詩最主要的情感是什么呢?
沒猜錯(cuò),是悲(愁、慟、哀、傷、嗟)!
大家可能想到會(huì)是悲——畢竟詩人們的情感都比較細(xì)膩,會(huì)比常人更容易不開心——但沒想到會(huì)這么悲,表達(dá)悲傷情緒的詩作,接近80%,壓倒性超過思、憂、喜、懼、怒、樂等其他情緒。
代表大唐氣象的唐詩,并非以積極昂揚(yáng)的情緒為主,“悲”“思”“憂”的情緒占據(jù)絕對(duì)的主流。縱然也有“白日放歌須縱酒,青春作伴好還鄉(xiāng)”的狂喜,但“喜”“樂”的情緒加到一起都不到1%。
研學(xué)唐詩,說簡單非常簡單,在大數(shù)據(jù)的幫助下,五萬唐詩完全可以一言以蔽之:一個(gè)穿綠衣服的人在春天很悲傷!
統(tǒng)計(jì)學(xué)說《黃鶴樓》是唐詩第一名
現(xiàn)代科學(xué)帶給我們的便利不僅是“一句話讀完全唐詩”。它還終結(jié)了千百年來文人們爭論不休的靈魂終極之問——唐詩之中,誰排第一?
大家都知道,在唐代,詩人和詩作都達(dá)到前所未有的量級(jí)。東漢到隋末近六百年,詩歌總共才五千余首,而到唐代,詩歌第一次超過萬首并直接跨越到五萬多首;之前的詩人一共有六百余位,而有唐一代即增加到三千余位。
那么問題就來了,這么多詩人,誰最有才華?這么多詩作,哪一首可居榜首?
這貌似永遠(yuǎn)沒有答案。因?yàn)椤拔臒o第一”,無法斷定李白和杜甫誰水平更高、《詠柳》和《春曉》哪首更勝一籌。
文科生們不能,但大數(shù)據(jù)能。早在十多年前,時(shí)在武漢大學(xué)任教的王兆鵬寫了一篇《唐詩影響力綜合指數(shù)排序》的論文,通過這種可量化的計(jì)算,得出了一份唐詩前100名的排行榜。論文用統(tǒng)計(jì)學(xué)的方法,對(duì)計(jì)算機(jī)收集來的大數(shù)據(jù)做了多個(gè)維度的分析,包括:
古代選本的數(shù)量,即有多少本古籍收錄了這本詩。
現(xiàn)代選本的數(shù)據(jù),即現(xiàn)代的詩詞鑒賞類書籍有多少本收錄了它。
歷代評(píng)點(diǎn)量,一首經(jīng)典詩作肯定賞析的人就多,這也應(yīng)該能看出詩本身的知名度。
論文篇數(shù),有些詩雖然很有知名度,但本身并沒有多少學(xué)術(shù)價(jià)值,論文數(shù)量能判斷出專業(yè)人士對(duì)這首詩的認(rèn)可度。
以及全錄和摘錄的數(shù)量、文學(xué)史提到它的次數(shù)、網(wǎng)絡(luò)上的歡迎程度。
根據(jù)這個(gè)數(shù)據(jù)分析,唐詩前八名分別是《黃鶴樓》(崔顥)、《送元二使安西》(王維)、《涼州詞》(王之渙)、《登鸛雀樓》(王之渙)、《登岳陽樓》(杜甫)、《登柳州城樓》(柳宗元)、《臨洞庭湖贈(zèng)張丞相》(孟浩然)、《題破山寺后禪院》(常建)。
雖然有不少人對(duì)結(jié)論并不認(rèn)可,但就統(tǒng)計(jì)方法來說,似乎也很有道理。不過大家很快就發(fā)現(xiàn)了一個(gè)不太合理之處:像李白這么牛的詩人,他的詩沒有一首進(jìn)前5,甚至前30里也只有兩首。
李白平生存詩千首,號(hào)稱“謫仙人”,水平先不說,他的名氣比起前5的崔顥、王之渙、王維肯定是要更高。問題出在哪里?
首先,前5名的詩作中有3首是登樓詩,古人對(duì)登樓詩非常推崇的,鑒賞和品讀的人多,影響力自然更大。
其次,在這個(gè)賦分體系里,短詩顯然更占優(yōu)勢,排名靠前的基本都是絕句或律詩;而李白最擅長的是古體雜詩,比如《將進(jìn)酒》、《蜀道難》等,這些長詩被全文選錄的可能性較少。
ChapGPT能代替李白杜甫嗎?
藝術(shù)審美很難有標(biāo)準(zhǔn),單一個(gè)“李白與杜甫誰更厲害”的話題,就能讓人爭論一輩子。但計(jì)算機(jī)似乎是一切爭議的終結(jié)者,萬事不決問大數(shù)據(jù),量化數(shù)據(jù)為很多難以公斷的學(xué)術(shù)判斷提供了思路和科學(xué)支撐。
比如崔顥《黃鶴樓》為唐詩排行榜NO1,多少有點(diǎn)令人驚訝。但具體到各項(xiàng)指標(biāo)中,會(huì)發(fā)現(xiàn)這首詩在數(shù)十種古代選本中入選率最高,被歷代詩論家品評(píng)的頻次也最高,當(dāng)代文學(xué)史更是無一漏收。這些憑據(jù)遠(yuǎn)比詩論家們主觀化與個(gè)性化的主張更有說服力。
計(jì)算機(jī)能做的,比人們想象與預(yù)料的更多。它已經(jīng)不停留在評(píng)判,而是進(jìn)階到了創(chuàng)作!
很多人曾經(jīng)認(rèn)為,在人工智能的強(qiáng)大力量下,詩歌藝術(shù)將是人類最后的陣地。但幾年前,微軟小冰僅僅經(jīng)過100小時(shí)的訓(xùn)練,就擁有了基本的寫詩作詞能力,甚至推出了人類史上首部人工智能詩集《陽光失了玻璃窗》。
更何況ChatGPT已經(jīng)誕生了!不久前有網(wǎng)友展示了ChatGPT挑戰(zhàn)“唐詩三百首”的視頻,在視頻中,ChatGPT完美完成寫詩任務(wù),仿照古人寫出優(yōu)美的詞句,這讓許多網(wǎng)友驚嘆和感慨,稱ChatGPT寫詩作詞能力,已經(jīng)超越了99%的人類。
被超越的人中包括比爾·蓋茨:今年1月,蓋茨就曾表示,自己在與ChatGPT一起創(chuàng)作莎士比亞風(fēng)格的詩歌的時(shí)候,完全處于下風(fēng)。
俗話說“熟讀唐詩三百首、不會(huì)寫詩也會(huì)謅”,連一般人都做得到熟能生巧,更何況擁有無可匹敵知識(shí)儲(chǔ)備和語料庫的AI,眼瞅著這最后的陣地也行將不保!
但可以感到欣慰的是,就像馬斯克說的,AI技術(shù)有可能最終取代人類,但不是近期內(nèi)的事情,目前的AI技術(shù)還遠(yuǎn)遠(yuǎn)不能達(dá)到與人類相同的智能水平,即使是目前最先進(jìn)的AI系統(tǒng),也只能在特定領(lǐng)域內(nèi)進(jìn)行高效的數(shù)據(jù)處理和模式識(shí)別。
ChatGPT可以將一首詩寫得很像李白,但他不能創(chuàng)造一個(gè)李白。而在李白之前并沒有李白,是李白創(chuàng)造了自己。
大數(shù)據(jù)可以更透徹地研究詩歌,但至少在一個(gè)相當(dāng)長的時(shí)間里,意象還不能變成數(shù)據(jù)、文采也化作不了代碼。就像五萬首唐詩,屬于每一首具體的作品,不屬于那個(gè)在春天里悲傷的穿綠衣服的人。
聯(lián)系客服