基于词频计量统计的林黛玉性格分析
作者:***
来源:《现代语文》2019年第02期
描述性格的词
        摘 要:本文从计量语言学的角度,通过对林黛玉诗词词频和动词词频的统计分析,来解读和阐释林黛玉的性格特征,力图呈现出一个立体化和多样化的黛玉形象。结果表明:林黛玉的诗词中与“花”相关的词很多,并且多使用情感消极的词汇,这也印证了林黛玉多愁善感、敏感自卑的性格。考察林黛玉动作动词时,发现在林黛玉的性格中还具有男子化的一面,这和普通的贵族少女迥然不同,也是以往研究所忽略之处。
        关键词:《红楼梦》;计量语言学;林黛玉;性格
        一、引言
        1935年,美国语言学家G.K.Zipf关于语言统计的著作The Psycho-Biology of Language:An Introduction to Dynamic Philology出版[1],标志了一个新的语言学分支学科和一种新的语言研究方法的诞生。G.K.Zipf认为,利用统计方法可以定量研究语言中的各种现象,这样语言学便可以成为一门精确科学。此后计量语言学越来越多地被应用到文学作品的统计分析上。早在1976年和1987年,美国斯坦福大学教授Efron和她的学生就对莎士比亚的著作进行了统计分析的研究[2][3]。对《红楼梦》的计量研究始于瑞典汉学家高本汉(B.Karlgren),1952年,他用统计学方法分析了32个语法与口语词汇的用字习惯,认为全部120回均为曹雪芹所著[4]。1980年,华裔学者陈炳藻在美国威斯康星大学召开的“首届国际《红楼梦》研讨会”上,发表了《从词汇上的统计论〈红楼梦〉的作者的问题》一文,他通过统计学方法考察《红楼梦》前后用字(词)的相关程度,认为后40回也出自曹雪芹之手[5]。由此引发了使用计量统计分析方法来判定《红楼梦》作者的热潮。目前学术界围绕《红楼梦》所做的计量研究主要集中在词汇特征上,基于词频统计和向量分析,考察《红楼梦》在用字用词方面的特点,而对人物性格的计量研究分析却十分少见。
        就林黛玉这一人物形象而言,学术界的研究主要集中在以下方面:1.对人物形象性格特征的剖析。如:岑泽丽[6]和董亚萍[7]均从人物语言入手分析林黛玉的性格特点;张利玲则重新审视了林黛玉立体化的性格[8]。2.对人物形象文化价值的探讨。如:徐乐吟、陆德海针对林黛玉的《五美吟》,分析了林黛玉的内心世界和对生命与生存价值的思考[9];吕启祥深刻地展示了林黛玉这个形象所包含的文化底蕴和价值观念[10];李希凡认为林黛玉具有敏感的诗人气质和动人心魄的艺术力量[11];李云婷则从“伤春”入手,探析黛玉伤春情怀的表现和独特的文化内蕴[12]。3.对人物悲剧命运的解读。如:张新艳从人物诗词入手,认为林黛玉的诗词带有强烈的悲悯彩[13];秦桂敏认为林黛玉是一个悲剧人物并对其悲剧命运进行探究[14];王琨指出林黛玉的悲剧命运与其个人性格是分不开的[15];周薇从美学的角度,论述了林黛玉身上的艺术魅力和时代赋予的悲剧性格[16]。4.对相关意象的深入阐释。如:吴林采取文本细读的方法,探讨林黛玉与绛珠草意象、竹意象、桃花意象等相关意象的关系[17];杨真真通过梳理桃花的文学意象及其对林黛玉形象的观照,论述了桃文化的渊源及其对中国古典文学的影响[18]。上述研究基本上都是在文本细读的基础上进行的理论阐释,不免带有作者的主观倾向。同时可以看出,从文本计量这一客观角度对人物性格进行解析的研究是相对匮乏的。有鉴于此,本文从计量语言学的角度出发,采用定量统计与定性分析相结合的方法,通过对林黛玉诗词词频和动词词频的统计分析,来解读和阐释林黛玉的性格特征。
        二、诗词词频统计分析
        古人云“情动于中而形于言”,以诗言志便是“情动于中”的表现。诗意叙事一直贯穿于《红楼梦》始终,同时也体现在对人物形象的塑造上。林黛玉是一个诗人,她的生命与诗词紧紧联系在一起,诗词也充分展现了她的性格和情感。
        (一)诗词词频的统计分析
        经统计,整部《红楼梦》中,林黛玉的完整诗词作品多达23首。我们采用哈尔滨工业大学社会计算与信息检索研究中心研发的语言技术平台(LTP)工具对其进行预处理,主要包括自动分词和词性标注,同时进行人工校正,得到黛玉诗词中的词频分布数据。利用NiucoData词云统计工具绘出词云图,如图1所示:
        我们知道,词频统计技术默认出现频率越高的词权重越大。一般而言,词语出现的次数越多,被賦予的权值也越大,就会占据词云图的中心位置。从图1可以看出,出现次数最多的词是“桃花”,说明“桃花”在林黛玉的诗词中具有最重要的意义。如第23回中描写黛玉葬花,葬的便是桃花,她不忍心落花随水渠流到腌臜之所,遂以花冢葬之。此处的桃花意象,
隐喻着黛玉一生中最美好的青春时光;但美丽的东西终究不能长久,桃花凋谢、随风逐走则暗示着她人生前景的黯淡苍凉,预示了其最终的悲惨结局。杨真真就认为桃花是林黛玉命运的象征,与黛玉的形象有很强的观照性[18]。最典型的便是《桃花行》,黛玉连用七个桃花,句句自怜,联联自谶,体现出对命途多舛的无奈、对人生悲凉的感伤。这也是林黛玉无法掌控自己命运的真实写照。值得注意的是,桃花意象不仅在林黛玉的诗词中频繁出现,在其他女子的诗作中也屡次提及。可以说,它也是大观园众女子命运的象征,与文本揭示青春的毁灭、美的毁灭的创作主旨十分契合。
        同时可以看出,围绕“桃花”中心出现的词,有“葬花”“寂寞”“憔悴”“烦忧”等,再往外围扩展,有“泪眼”“萧条”“伤神”“悲歌”“沉吟”等。这些词语无不透露出悲怆凄楚之感,对体现人物性格、烘托人物情感起到了重要作用。
        我们还注意到,林黛玉诗词词频中涉及到“花”的词语和搭配有很多,大致可归为以下三类:
        一是花之种类,如“桃花”“稻花”“梅花”等,尤其是“桃花”,使用频次高达7次。在一定程度上说,文本将花的自然属性与社会属性融合无间,成为人格化的具象,寄托着诗人的理想
、情趣和追求。梅花傲霜斗雪,是黛玉清高孤傲性格的象征;稻花清芬淡雅,是黛玉诗意人生的写照;桃花飘零沦落,是黛玉悲剧命运的预兆。
        二是花之形态,这主要表现在黛玉诗词聚焦于“落花”和“秋花”的抒写。“秋花”即秋天之花,出现在第45回秋窗风雨夕,写林黛玉卧病潇湘馆,在秋夕之时,目睹秋花惨淡秋草枯黄,再加上秋风秋雨袭来,不禁联想到个人身世,悲凉之感油然而生。诗人用一系列萧瑟冷清的秋景,传达出一种对未来命运的隐约预感。“落花”意象主要出现在第27回《葬花词》中,如“花谢花飞花满天”“忍踏落花来复去”“试看春残花渐落”“花落人亡两不知”等。此处的“落花”描写,以花喻人,象征着“红消香断”、青春易老的人生况味,预示着“花落人亡”的悲剧结局。可以说,无论是落花还是秋花,都是将花的命运与人的命运扭结在一起来写,形象地传达出黛玉对生命的无限焦虑。
        三是花之品性,这主要集中于“花魂”“花媚”两个词语。花媚体现了花之娇美和姿态,同时也象征着包括黛玉在内的大观园众女儿的青春之美、女性之美。花魂一词出自第76回黛玉和湘云的联诗,湘云出“寒塘渡鹤影”,黛玉对“冷月葬花魂”。花魂体现了花之气节和品性,象征着黛玉的品质高洁、孤高自许,即“质本洁来还洁去”,而“冷月葬花魂”则预示着黛玉这一花之精魂、诗之精魂的香消玉殒。
        (二)诗词词性的统计分析
        1.词性总体统计
        词性标注是自然语言处理中的一个重要环节。我们知道,词性用来描述一个词在上下文中的作用,而词性标注就是识别这些词的词性,以确定其在上下文中的作用。我们对林黛玉诗词中用词的词性进行了统计,如圖2所示。从中可以看出,名词(n)、动词(v)的数量最多,分别占了32%、31%;其次是形容词(a)、副词(d),分别占了8%、7%;再次是代词(r)、介词(p);拟声词(o)数量最少。这显然与古典诗词的文体规范与语体风格有关。众所周知,词性可以反映作者的写作习惯和语体风格,下面分别对黛玉诗词中的形容词、代词、副词、时间词进行具体考察和分析。