「四万万同胞」是怎么来的?
这是读《简单统计学》的第 5-3 篇文章。
有人说民国时期的「四万万」人口是根据食盐销量推算出来的,这可是大错特错了。
我国早在公元前 2100 多年的夏禹时代就有过人口统计:
禹平水土,定九州,计民数。《史记·夏本纪》
西周的时候就有了专门统计人口的官吏和户籍制度:
司民,掌登万民之数,自生齿以上,皆书于版。《周礼·秋官》
五家为邻,五邻为里《周礼·地官》
也有很多思想家提出过人口统计的思想:
分春日书比,立夏日月程,秋日大稽,与民数得亡。《管子·乘马》
以秋岁末之时,阅其民,案家人比地,定什伍口数,别男女大小。《管子·度地》
四境之内,丈夫女子皆有名于上。《商君书·境内》
举民众口数,生者著,死者削。《商君书·去强》
不过古时候地广人稀,战乱频繁,人口普查是个辛苦的工作,错漏在所难免。
而且百姓商贾为了逃避兵役、偷税漏税,往往谎报、瞒报人口数据。
为了准确统计人口,古代的政府想了很多办法。
比如,汉朝时实行「案比」,就是「案户比民」,要求本人在指定的时间到户口登记处核验。
仲秋之月,县道皆案户比民。《后汉书·礼仪志》
《二十四孝》之一《行佣供母》的主角,每年都按时参加「案比」。
江革字次翁,齐国临淄人也。少失父,独与母居……每至岁时,县当案比,革以母老,不欲摇动,自在辕中挽车,不用牛马,由是乡里称之曰「江巨孝」。《后汉书·江革传》
简单的说,就是:江革母亲年事已高,但是每年也要去县衙核对户籍。江革担心牛马拉车会有颠簸,坐着不舒服,所以他甘当牛马,自己拉车。于是,乡里人称他为「江巨孝」。
比如按人口分配「升学」名额。
隋唐开始科举制度后,就按人口分配科举名额。升学当官和人口挂钩,想当地多出举人、进士,有更多的人能当官,就别瞒报人口。
凡贡人,上州岁贡三人,中州二人,下州一人。若有茂才异等,亦不抑以常数。《唐六典·三府督护州县官吏》
因为科举名额要不要按人口分配的事,北宋的时候,欧阳修和司马光,对,就是那个砸缸的司马光,还发生过激烈的争执。
司马、欧阳二公之论不同, 司马公之意主于均额, 以息奔竞之风, 欧阳公之意主于核实, 以免缪滥之弊。要之, 朝廷既以文艺取人, 则欧公之说为是 。《文献通考·选举考》
比如清朝雍正时期推行「摊丁入亩」,从收人头税,改为收土地税。结果到道光的时候,统计的人口从2600万增长为4.1亿。
115年人口增长 15 倍,这可不是靠生孩子能完成的,而是之前瞒报漏报的人口太多了。
雍正十二年,二千六百四十一万七千九百三十二口……道光二十九年,四万一千二百九十八万六千六百四十九口。《清史稿·卷一百二十》
你看,不用到民国,道光的时候就知道有 4 亿人口了。
那用「盐」计算人口是怎么回事呢?
虽然古代政府想了很多办法来统计人口,但数据难免不准,所以有很多人根据相关性建立了人口估算模型。
比如粮食消耗,土地数量,相对来说更准确的,是「食盐-人口」模型。

这是一个有高度相关性,也有因果逻辑的计算模型。
早在春秋时期,我们就知道食盐的销量和人口数量高度相关,而且消耗量比较稳定,属于刚需。
十口之家,十人食盐,百口之家,百人食盐。《管子·地数》
终月,大男食盐五升少半,大女食盐三升少半;吾子食盐二升少半。《管子·海王》
夫食盐多寡,虽人无定额,然大抵每人每年以食盐十斤,作为平均数。《中国盐政实录》
唐代史学家杜佑,就曾根据每户平均人数和食盐消耗量,估算全国的总户数。
计诸道簿帐所收可有二百五十余万户……食盐知见在之数者,采晋隋旧典制置可得五百万矣。《通典·食货》
食盐销量和人口数量高度相关,也有一定的因果逻辑,那么政府可以应用「食盐-销量」模型,来计算人口啊。
错。
自古官方有记录的人口数据,都是人口统计的结果,而不是根据食盐销量估算的。民国也是如此。
1912年,中华民国成立的那一年就进行过人口普查,但是具体的执行情况已经没有记录了,只知道一个数字,419,640,279。
1928年,南京国民政府着手调查户口,但是因为管理混乱、效率低下,最终只有13个省完成了「作业」,剩下的省市,要么「作业」没做完,要么连做也没做。

最后没办法,民国政府内政部不得不估算剩下省市的户口数量。当然不是用食盐销量估算的,而是根据人口密度。
简单的说,先计算各省面积,再估算各省人口密度(用的平均数),最后计算得出人口数据。

最终内政部估算出 1928 年全国人口总数为 474,787,386 人 。
这是民国政府第一次正式发布的全国人口总数 , 也是 20 世纪经常说的「四万万」的重要来源。
所以「四万万同胞」是统计计算得来的,而不是用「食盐销量」推算的。
为什么不用「食盐-人口」模型估算人口呢?因为太不准确了。
「食盐-人口」模型看似只有两个变量,十分简单,但是这两个变量,都很难拿到准确的数值。
比如食盐销量,受价格、走私的影响。
甚至有的朝代根据统计人口限制食盐产量,导致供不应求。
官员瞒报漏报也会影响统计数据的准确性。
熙宁中,蜀盐私贩者众,禁不能止。《宋史·卷一百八十三》
令两京官吏人等及各处官民户口食盐。《明会典》
盐法之弊,多因商人匿引不缴,有司纵商不究。《孝宗实录·卷一百七十一》
比如食盐的人均消耗数量,都是统计人员的经验数据,没有定数。
丁男日给米二升、盐二勺五撮,妻、妾、老男、小则减之。《大唐六典·卷十九》
本司岁办额盐四十八万引,行盐之地,两浙、江东凡一千九百六万余口。每日食盐四钱一分八厘,总而计之,为四十四万九千余引。《元史·卷九十七》
承运库大使周端等言,广东地广民稀,盐课无商中纳,军民多食私盐,宜令所司核实人口,大口岁食盐十二斤,小口半之。《明太宗实录·卷二十八》
而且,食盐不是只能吃的,腌菜腌肉,养马喂牛,也要用盐。
盐,一人日支半合,一月一升五合,一年一斗八升。
马盐,一马日支盐三合,一月九升,六个月五斗四升。
《神机制敌太白阴经·人粮马料篇》
一共两个变量,两个都不准确,那最终结果肯定也不准确啊。历朝历代的政府都知道这个问题,官方也就不会用这个模型来计算人口。
「食盐-人口」模型看起来很丰满,应用起来也真的很骨感。
所以,分析模型是有适用条件的,不能因为有相关性、有因果逻辑,就盲目套用。
但是,如果能够拿到准确的销量、用量的数值,「食盐-人口」模型算得上是一个不错的分析模型。
而且相关性模型确实有成功进行商业应用的案例,下次我们就讲这个案例。