当前位置:主页 > 数据研究 >
个股查询:
 

研究人员用数据统计的方法来做文学研究

本文来源于网络整理 2017-11-24 13:47

研究人员用数据统计的方法来做文学研究

  ■本报记者 张文静

  大数据与文学,一个是理性工具,一个是感性思维,看起来似乎不沾边。但如今,二者的联系却日渐紧密起来,也由此引发了不少争议。

  谁是最爱往外跑的诗人?

  唐宋时期最爱往外跑的诗人是谁?答案可能是苏轼。

  打开“唐宋文学编年地图”,点击苏轼的名字,地图上立刻显示出密密麻麻的足迹,西到雅安,东到蓬莱、青浦,北到定州,南到海南南部的陵水。从青年时代开始,苏轼的脚步就一直没停过,在他58岁那年甚至一口气走了31个地方,堪称中国古代一股“行走的力量”。

  “苏轼一生的轨迹信息高达近万条,遍布全国各地,是我们录入信息最多的一位唐宋诗人。”“唐宋文学编年地图”的建立者、中南民族大学教授王兆鹏告诉《中国科学报》记者。

  “唐宋文学编年地图”在今年3月上线,是王兆鹏主持的国家社科基金重大项目“唐宋文学编年系地信息平台”的一个研究成果。这个电子地图的形成花费了五年的时间,100多人的团队参与其中,负责数据的整理编写,融合了地理信息系统、测绘、计算机、文学等多个领域的内容。

  目前,这份地图已录入了100多位唐宋诗人的行迹信息,范围北至蒙古乌兰巴托,南至越南清化。点击任何一位诗人的名字,地图上就会出现他一生的行走路线图,再点击任一地点,这位诗人在此创作的诗歌作品就会展示出来。如以地点或年份为关键词进行检索,则会看到某地在某个时间段共有多少位诗人来过、留下了哪些作品。于是从地图上,我们可以看到,李白出生于西域碎叶城(今吉尔吉斯斯坦托克马克市),王维出生于晋中,12岁的孟浩然在襄阳居乡读书,45岁的宋之问则从郑州来到洛阳又到西安,写下了多首诗作。“这张地图的最大亮点就是打通了时空维度。”王兆鹏说。

  地图上线后,火爆程度让王兆鹏大吃一惊,他没想到这样一份文学地图引起了大众这么多关注。“本来项目是年底结题,我们还没着急,没想到一下子火了,上线第一天的点击量超过了100万,两天就到了220万。大家一直在问,为什么没有某某诗人,所以我们现在必须要加班加点,尽快将所有诗人的信息传上去。”王兆鹏说。

  用大量数据来展现唐宋诗人的故事,不仅有文学专业的教授在做。今年3月,一篇名为《计算机告诉你,唐朝诗人的关系到底是什么样的?》的文章刷爆朋友圈,很快达到了10万+的阅读量。这篇文章来自一位普通的程序员“前进四先生”之手,发布于他的个人微信公众号“前进日志”中。

  在对四万多首唐诗进行了数据整理后,“前进四先生”发现在唐朝,两位关系最好的诗人不是李白和杜甫,也不是白居易和元稹,而是陆龟蒙和皮日休。这两位诗人互相提到对方的次数都在百次以上,中国文学史上的第一本唱和诗集《松陵集》也是他俩的作品。从排名前30的引用关系来看,白居易绝对是唐朝诗人朋友圈中的明星。

  大数据与小阅读

  用数据统计的方法来做文学研究,王兆鹏早在1992年就开始了。“当时我是系里主管研究生工作的副主任,偶然一次机会在杂志上看到一篇定量分析研究生学位教育的文章,我就想古代文学史的研究能不能也用定量分析的方法来做。后来我写了一篇文章《宋代词人历史地位的分析》,就是用量化数据来描述词人的地位,比如什么叫地位很高、比较高或一般。从那时起,我就开始了这个领域的研究。”王兆鹏介绍说。

  在国外,也有展现中国历代人物生平资料的数据库,比如由哈佛大学、北京大学、台湾“中研院”合作开发的CBDB数据库,通过字号、亲属关系、生卒年份等数据,展现人物的社会关系网。

  对于大数据手段与文学研究的关系,在华东师范大学教授金雯看来,使用电脑算法来分析文本,不是让电脑复制人脑的功能,或者更大规模地完成人脑擅长的任务。人脑和电脑在阅读文本的时候所用的方法和关注的重点不一样,读出来的东西也可能截然不同。不过人脑和电脑在阅读阐释文字的时候也往往可以互为体用、互补短长,文学大数据分析和学者个人的“小阅读”之间存在着许多交融和合作的可能。正因为如此,借助电脑进行文本分析是近年来不断升温的“数字人文”的一个重要分支。

  几年前,王兆鹏利用数据分析进行过另一项研究——唐诗宋词排行榜,曾招来过不少争议。


  • 友情链接