历史统计学,是用统计学的法则,拿数目字来整理史料、推论史迹。这个名称是我和我的几位朋友们杜撰的。严格的说,应该名为“史学上之统计的研究法”,因贪省便,姑用今名。但我们确信他是研究历史的[1]一种好方法,而且在中国史学界,尤为相宜。我们正在那里陆续试验,成绩很是不坏,所以我愿意把我们所拟的方法介绍诸君,盼望多得些同志共同做去。

我们为什么想用这种方法研究历史呢?我们以为欲知历史真相,决不能单看台面上几个大人物、几桩大事件便算完结,最要的是看出全个社会的活动变化。全个社会的活动变化,要集积起来比较一番,才能看见。往往有很小的事,平常人绝不注意的,一旦把他同类的全搜集起来,分别部类一研究,便可以发见出极新奇的现象,而且发明出极有价值的原则。比方我们看见一两只蝴蝶算得什么呢?一旦到动物学者的手里,成千成万的蝴蝶标本聚拢起来,综合一番,分析一番,便成绝大学问。我们做史学的人,对于史料之搜集整理,也是如此。

统计学的作用,是要“观其大较”,换句话说,是专要看各种事物的平均状况,拉匀了算总账。近来这种技术应用到各方面,种种统计表出来。我们想研究哪件事,只要拿他的专门统计表一看,真相立刻了然。所以《统计年鉴》等类之出版物,真算得绝好的现代社会史。假如古代也有这种东西传下来,我们便根据着他,看出许多历史上“大较”的真相。然后究其所以然之故,岂非快事!这种现成的饭固然没得给我们,但我们用自己的努力,也许有许多方面能弥补这种缺憾来!

用统计方法治史,也许是中国人最初发明。《史记》的“表”,是摹仿那“旁行斜上”的《周谱》。《周谱》这部书今虽失传,想也该是西纪前三四百年人做的。后来历代正史多有表,给我们留下种种好资料和好方法。可惜范围还太窄了,许多我们想知道“大较”的事件,都没有用表的形式排列出来。到清初有位顾栋高先生,著成一部五十卷的《春秋大事表》,把全部《左传》拆碎了,从各方面分析研究,很有统计学的精神。我从小读这部书,实在爱他不过,常常想我几时能有工夫,定要把全部二十四史,照他样子,按着我自己所要研究的目的,分类做一部通表,才算快事哩!我这个心愿怀抱了二十多年,但我很惭愧到今日还没有动手。

我想我们中国的史学家做这件事,便宜极了。因为我们纸片上的史料,是再[2]丰富不过的。一切别史、杂史、文集、笔记之类且不必说,就以一部二十四史而论,真算得文献宝藏。就学校里头学历史的学生看,固然恨他“浩如烟海”,就我们专门做史学的人看,真不能不感谢我们先辈给我们留下这大份遗产。我们只要肯在里头爬梳,什么宝贝都可以发见出来。

以上把这种学问的理论大略说明了,以下要说我们着手的试验及其成绩。

我多年想做一张表,将二十四史里头的人物分类,学者、文学家、政治家、军人、大盗等等,每人看他本传第一句“某某地方人也”,因此研究某个时代多产某种人,某个地方多产某种人。我这计划曾经好几次和我的朋友丁文江先生谈起,他很赞成。后来他说先且不必分类,只要把正史上有传的人的籍贯列下来再说。他自己便干起来了。现在还没有完全成功,只是把几个统一的朝代——汉、唐、宋、明做成了,编出一张很有趣的《历史之人物地理分配表》。

他那张表的体例,是将《汉书》、《后汉书》、《新唐书》、《宋史》、《明史》中有传的人都列出,调查他们的籍贯,分配现今各省,再拿所有列传总数,按照各省人数,列出百分比例。例如两汉通共六百六十五篇传,河南人二百零九,占百分之三十一零四三。山东人一百十八,占百分之十七零七五。湖南人只有两个,占百分之三厘。福建人只有一个,占百分之一厘五。广东、云南、贵州一个也没有。全表以是为推。我们在这表中可以看出几个原则:

(一)帝都所在地人物往往特多。例如后汉之河南,占百分之三十七而强。唐之陕西,占百分之二十一而强。北宋之河南,占百分之二十三而强。南宋之浙江,占百分之二十二而强。都是居全比例之第一位。但其中有两个例外:前汉的陕西,仅占百分之十,居第四位,不惟远在山东、河南之下,而且还在江苏之下。明的直隶,仅占百分之七,居第五位。

(二)南北升降之迹甚显著。如山东、陕西、直隶、山西,汉、唐时平均比例皆在百分之十以上,多者至二三十以上。宋、明后,皆落至十分以下,平均不过五六分。内中惟河南勉强保持平度,然亦有落下的趋势。反之如江苏、安徽、江西、浙江,汉、唐时甚微微,以次渐升,至明时皆涨百分之[3]十以上。此种现象,恐由于宋南渡后,南方之人为的开发,与蒙古侵入后,北方之意外的蹂躏。但人民自身猛进与退萎之精神,亦不容轻轻看过。

(三)原则上升降皆以渐,然亦有突进者。例如四川在前汉不及百分之二,后汉忽升至百分之六,其后即上下于此圈内。浙江向来不过百分之二三之间,北宋忽升至百分之八,南宋又升至百分之二十二。江西向来不到百分之一,北宋忽升至百分之五以上,南宋忽升至百分之十三以上。福建情形与江西亦大略相等。我们想这种情形,系由文化之新开辟。从前这些地方,离中央文化圈很远,一经接触之后,再加以若干年之酝酿醇化,便产出一种新化学作用。美国近年之勃兴,就是这种道理。以此推之,还有许多新地方也该如此。这表现仅编到明朝为止,若继续编下去,当又有新资料可以证明这个公例。例如湖南始终没有到过百分之二,倘将《清史》编出来,恐怕要骤涨到百分之十以上。广东向来差不多都是零度,倘将民国十年史编出来,恐怕也要涨百分之十以上。

(四)此外尤有一最显著之现象,则人物分配,日趋平均。前汉山东占百分之三十而弱,河南占百分之二十而弱。后汉河南占百分之三十七而强,山东占百分之十二而强。仅此两省,占汉史人物之半数。其余长江流域各省,没有能到百分之五的。湖南、福建、两广、云贵,都是零度。唐、宋人各省都渐渐有人,均匀许多了。到明时越发均遍,没有一省没有人。除广西、云、贵三省不满一分外,其余各省最高的不过百分之十三四,最低的省分亦有百分之一二,十八省中之九省,皆来往于百分之三与百分之七。平均数目之间,可见我们文化普及的程度一天比一天进步。倘若将《清史》续编下去,只怕各省不平等的现象还要格外减少哩。

诸君想想,像这样粗枝大叶的一张表,我们已经可以从这里头发见四个原则来,而且还能逐个求出他所以然之故,这是何等有趣的事!凡做学问,终要在客观正确的事实上才下判断,这是人人共知的。史学对象的事实,你说单靠几位大英雄的战记、几位大学者的著述吗?这固然可以表现社会的特殊力,却不能表示社会的一般力。我们搜集史料,断不能以此为满足。许多事实,并不必从个人有意的动作看出来,即如这张表所根据的材料,不过每篇的一句——“某处人也”,这样干燥无味的句子,从前读史的人,谁又肯信这里头还有研究价值?殊不知拆开了一句一句,诚丝毫无意味,聚拢起来,一综合,一分析,无限意味都发生出来了。这表所编仅限于两汉、唐、宋、明五代,而且是不管人物如何,有一篇传算一篇,倘若把二十四史全数编出,再将人物分类,恐怕继续发明的原则,还要多哩。青年诸君啊,须知学问的殖民地丰富得很,到处可以容你做哥仑布,只看你有无志气、有无耐性罢了。

我又请说我们别方面的试验。我近来因为研究佛教史,有一回发生起趣味,要调查我们先辈留学印度的事实。我费不少的劳力,考据出二百来个人,内中有姓名可考者一百零五,无姓名可考者八十二。我做了一篇文叫做《千五百年前之留学生》,曾经登在《改造杂志》。我在那篇文章里面,做了种种统计:

(一)年代别

西历第三纪后半 二人

第四纪 五人

第五纪 六十一人

第六纪 十四人

第七纪 五十六人

第八纪前半  十一人

(二)籍贯别(内籍贯可考者仅六十五人)

甘肃十人[4]河南八人 山西七人 两广七人 四川四人 湖北五人 直隶四人 陕西四人 山东四人 新疆四人 辽东四人 湖南三人

(三)行迹别

1 已到印度学成后安返中国者四十二人

2 已到西域而曾否到印度无可考者十六人

3 未到印度而中途折回者十四人(?)

4 已到印度随即折回者二人

5 未到印度而死于道路者三十一人

6 留学期中病死者六人

7 学成归国死于道路者五人

8 归国后第二次再留学者六人

9 留而不归者七人

10 归留生死无考者八十人(?)

(四)留学期间别(可考者)

四十年以上一人

三十年以上一人

二十年以上一人

十五年以上八人

十年以上五人

五年以上三十九人

(五)经途别(可考者但有往返异途者)

海道六十八人

西域葱岭路七十七人

于阗罽宾路二人

西藏尼波罗路七人

云南缅甸路二十许人

我根据这些数目字,知道事实上“如此如此”,我便逐件推寻他“为什么如此如此”,于是得了许多条假说或定说。对于那位事情的真相,大概都明了了。我高兴到了不得,好像学期试验得了一回最优等。诸君若要知道详细,请把那篇文章一看。

我研究佛教史,从各方面应用这种统计法,觉得成绩很不坏。我也曾从各家金石目录中,把几千种关于佛教的石刻,如造像经幢之类,调查出土的地方,调查所刻文字的内容,如所造像为释迦像、为弥勒像、为阿弥陀佛像,所刻经为《心经》、为《金刚经》、为《陀罗尼经咒》等等。我因此对于各时代各地方信仰态度之变迁,得着一部分很明了的印象。我又曾将正续《高僧传》及各家经录中凡关于佛教著述的目录,搜寻出一千来种,用他们所解释的经论分类一看下去,便可以知道某时代某宗派兴衰状况何如。这些都是我现时正在进行的工作。我做这种麻烦的工作,很劳苦,但是我很快乐,因为我常常在我的工作中发见意外的光明。我确信我的工作,做一分定有一分成绩,做十分定有十分成绩。

我想这种方法,可以应用到史学的全部分。我的脑筋欢喜乱动,一会发生一个问题。我对于我所发的问题,都有兴味。只可惜我不能把每日二十四点钟,扩充为四十八点钟,所以不能逐件逐件去过我的瘾。现在请把思做而未能做的题目,随便说几个请教诸君。

(一)我们试做一篇《历代战乱统计表》,把战乱所起的年月、所经过的年月、所起的地方、所波及的地方、为何事起、起于某种性质的人,为敌国相攻,抑人民造反,为自相残杀,抑对外防卫……诸如此类,预定十几个题目,依格填去,也不必泛滥许多书籍,只要把正续《资治通鉴》编完,我信得过可以成一张很好的表。根据这表,研究他为甚么如此,一定可以发明许多道理来。

(二)我们试做一篇《异族同化人物表》。先把各史有传的人姓氏谱系来历稍为蹊跷的一一如长孙、宇文之类,都去研究一下。考定某姓出于某族,并不是很困难的事。一面将各史传中明记某人本属某族,一一如金日本籍匈奴,王思礼本籍高丽类,一一列出,其族别则分为匈奴、鲜卑、氐、羌、蛮韶、高丽、女真、蒙古、满洲等等,看某种族人数何如、某时代人数何如、某地人数何如。此表若成,则于各外族同化程度及我们现在的中华民族所含成分如何,大概可以了解。

(三)我们试做一篇《地方统治离合表》。其各地在本族主权者统治之下不计,其北魏、元、清三代虽属外族,而势力统一全国或半国者亦不计。自余各地约以现制各道为区域。每一区域,先记其未隶中国版图之年代,既隶之后,或本地异族据而自立,或外来异族侵据,皆记之,也不必记详细事迹,但记分立侵据之年代及年数。有恁么一张表,我们各地方进化退化之迹,自然有许多发明。

(四)我们试做一篇《历代著述统计表》。把各史的艺文志和各人的本传,凡有著述者,将其书名、部数、卷数列出,再将书的性质分类,将著书人的年代籍贯分类,求出某时代某地方人,关于某类学问的著述有几多部、几多卷,只把数目字列出,便可知道某时代某种学问发达或衰落,某地方文化程度或高或低[5],或进化,或退化。

(五)我们试做一篇《历代水旱统计表》。我们历代史官,对于这类灾异极为注意。试把各史的本纪和五行志做底本,参以各省府县志,以年代地方为别,做一张表,看隔多少年发一回,何时代多、何时代少,这样一来,上而气候、地质的变化,下而政治的修明或颓废,都可以推测得几分。诸君试思天下最无用的东西,还有过于五行志么?到了我们这些刁钻古怪的史学家手里头,也许有废物利用的日子哩。

像这种大大小小的统计题目,常常在我脑子里头转的,不下几十个,我也无暇细述,姑且举这五个不伦不类的讲讲。诸君举一反三,或者想出来的题目比我还多还好哩!总之凡做学问,不外两层工夫:第一层要知道“如此如此”。第二层要推求“为甚么如此如此”。论智识之增殖,自然以第二层为最可宝贵。但是若把第一层看轻了,怕有很大的危险。倘若他并不是如此,你模模糊糊认定他如此,便瞎猜他为什么如此,这工夫不是枉用的么?枉用还不要紧,最糟是瞎猜的结论,自误误人。所以我们总要先设法知道他“的确如此如此”,知道了过后,我自己能跟着推求他“为什么如此”固然最好,即不能,把事实拢出来,让别人推求也是有益的事。问设什么法子才能知道“的确如此如此”呢?我简单回答一句:“有路便钻。”统计法,便是里头一条路。

我并非说这是研究史学的唯一好方法,但我敢说最少亦是好方法中之一种。因为史家最大任务,是要研究人类社会的“共相”和“共业”。而这种“观其大较”的工作,实为“求共”之绝妙法门,所以我们很欢喜他。加以我们现存的史料实在丰富,越发奖励我们工作的兴味。但是这种工作是很麻烦很劳苦的,而且往往失败,我自己就曾经失败过好几回。

我并不劝各位同学向这条路上走,但哪一位对于这种工作有兴味,不妨找一两个题目一试,须知从麻烦劳苦中得一点成功,便是人生最快乐的事。或者还可以说人生目的就在此地!

注解:

[1] “的”字据文意补。

[2] “再”字据文意补。

[3] “之”字据文意补。

[4] 人,原作“八”,今据下文改,然仍与所列总人数不符。

[5] 低,原作“底”。