导航菜单
首页 > 历史学论文 > 历史论文 » 正文

以数据为证要注意三个误区

邵兵 代丽静




关键词 证据意识,数据史料,大数据,小样本

中图分类号 G63文献标识码 B文章编号 0457-6241(2020)05-0042-06

目前,中学教学和大规模的考试越来越重视证据意识的培养和考查,教与考都普遍使用文献史料。数据史料是文献史料的一种,近年高考和各地中考经常用之考查学生理解历史问题的能力。笔者发现,运用数据史料存在一些明显的误区,会影响试题的效度和信度;在教学中使用则不利于培养学生辨析史实及史论之间逻辑关系的能力。本文试举例说明三个误区的具体表现,就教方家。

误区一:将数量等同于质量

数量和质量是人们认识历史事物、历史现象必不可少的两个维度。通常情况下,质量必须要以一定的数量为基础,质量的提升源自数量的积累。在一般的教学和命题中,往往只关注二者的联系,而忽视二者的区别,将数量直接等同于质量。这是以数据为证据需要注意的问题。

案例1:讲授部编初中教材《中国历史》八年级上册第18课“从九一八事变到西安事变”,有位教师在课堂上呈现了下列一组数据:

设置问题:面对日本的侵略行为,蒋介石政府采取了什么政策?结果如何?在解读数据后,教师引导学生得出结论:东北军的军事实力明显优于日军,蒋介石政府是在军事实力占优势的情况下,实施不抵抗政策,进而导致东北大片国土在四个多月内沦丧的惨痛后果。

分析:毫无疑问,“九一八事变”后,蒋介石政府奉行不抵抗政策,要为东北地区大片国土沦丧承担主要责任。但是,我们不能仅以这些数据判断东北军的实力。假定上述数据准确,授课教师单独用以解读事变前的力量对比,也会走入将数量直接等同于质量的误区,从而得出东北军实力占优的结论。

军事实力是一个国家硬实力的重要组成部分,属于支配性实力。对于一支军队来说,军事实力显然属于质量范畴,其构成要素具有丰富性、复杂性和动态性等特征,绝非某一个或几个要素的数量能简单反映的。影响军队实力的要素,除了军队规模、武器数量、指挥力量,还包括兵员素质、训练水平、后勤保障、装备水平、作战经验、兵源体系等方面。事实表明,抗日战争期间中国军队整体实力非但不占优,还明显处于劣势。主要表现在以下几个方面:

第一,兵员文化素质情况。戴旭在《国力悬殊?战力何在?抗战前中日军备对比》一文中指出,截至1936年底,中国具备高中学历并参加了完整军事训练的预备兵人数仅17490人(注:约占现役常备军人数的1%),候补军官中达到大专及以上学历的仅880人。很多基层军官连花名册都认不全,平日很少研究战术,战时全凭血气之勇。①全国情况如此,东北军的情况也好不到哪儿去。

第二,后勤保障情况。古人云:兵马未动,粮草先行。后勤保障对军队战斗力十分重要。抗日战争时期,因为经费紧张,军事工业水平落后,国民政府腐败等原因,中国军队平时大多打空枪训练射击。中央军的物质条件最好,练習射击时单兵配发的子弹也只有15发,作战时单兵配发20发子弹。与之相比,日军规定,新兵训练射击时,单兵每月配发步枪子弹不得低于150发,机枪子弹不得低于300发。据统计,1/3的日军士兵使用步枪可以达到优秀射手的水平。②后勤保障水平直接影响训练水平,中国军队单兵训练水平明显落后于日军。

第三,作战经验情况。“九一八事变”发生时,驻扎在长春的东北军约为5840人,分别驻在城内、南岭、宽城子三个区域。驻扎于此的日本关东军约为900人。③早在1931年7月,驻宽城子的东北军就在营区开挖了工事;驻南岭的东北军则放言只需两个小时就可让日本驻长春军队溃灭。这表明驻扎在长春的东北军对日军早有戒备。然而,当日军于9月19日凌晨分别向宽城子和南岭发起攻击时,东北军奋勇抵抗,却“终因麻痹轻敌,防御设施形同虚设,对日军的突袭始料未及,以致丧失了有利战机。其所进行的无序抵抗,显得异常混乱,死伤、被俘、逃亡更是无法统计”。④另有研究表明,单就作战经验一项对比,徐州会战时期中国军队二至三个军,才能应对日军的一个师团。⑤

仅以这三个方面例证,即可知单纯依据中日双方的兵力、武器装备等数据,不能得出中国军队实力占优的结论。如果单凭数量多就认为中国军队实力占优,那就无法解释全面抗战以来正面战场一系列重大战役的结果。具体数据见表2:

在这个因果逻辑中,如果把中国军队的兵力规模、武器数量、政治立场等三个要素视为自变量,那么战事结果则为因变量。比较“九一八事变”和上述重大战役,我们发现自变量中兵力规模(和武器数量)优势没有变,战事结果这个因变量也没有变。至于国民政府的抗战立场应该说没有变,政治腐败对豫湘桂战役的影响明显,在之前的战役中战略失误较多,但主要还是实力不如人。

误区二:将相关性等同于因果性

洞察历史事物、历史现象之间的因果关系,是探索历史发展规律的必然要求,也是中学历史教学的重点目标之一。因为“有三件很重要的事只有在清楚原因的情况下才能做到,或者做到最好,这三件事是:预测、解释和干预”。⑥在揭示历史事物、历史现象之间的因果关系时,数据往往具有不可替代的证据力,因而备受重视。但是,在使用数据过程中,常常出现将因果关系与相关性等同视之的情况。

说到相关性,人们常常用“雄鸡一唱天下白”这句诗来打比方。诗中提到的两个现象,即鸡鸣和天亮两个变量之间存在关联,但是它们之间不存在因果关系。就是说,鸡鸣并不是造成天亮的条件,或者天亮并非鸡鸣造成的后果。以此来说明相关性和因果性的区别,很容易被理解。但是,现实情况却比这个例子要复杂得多。通常我们观察到的因果关系中的变量都具有相关性,但是,反之则不能说具有相关性的变量之间一定存在因果关系。将相关性等同于因果性,是将数据转化为证据过程中需要避开的误区之二。

案例2:1923—1929年间,美国制造业工人工资增长了8%,工人每小时的效益却增加了32%。这组数字资料可用来说明美国

A.最低工资标准已失去作用

B.工业生产持续快速发展

C.加紧占领殖民地取得海外市场

D.经济危机出现的主要原因

答案:D

分析:该题通过材料呈现了美国历史上的两个数据:制造业工人工资的增速和他们创造效益的增速。比较这两个数据可以发现一个现象:制造业工人工资的增速远低于他们创造效益的增速。结合选项内容,可知命题者的结论是:上述现象是美国经济危机出现的主要原因。这是一个确定的因果关系表述,两个数据在此充当了论据。该结论对应的教科书内容是:“生产力不断提高,企业利润大幅增加,但工人的工资却增长缓慢,购买力严重不足,导致出现生产过剩。”①

进一步分析,我们会发现该题的逻辑中包含了三对因果关系。其一,因为存在制造业工人工资增速低于他们创造效益增速的现象,所以可以得出企业利润大幅增加、工人工资增长缓慢的结论;其二,因为工人的工资增长缓慢,所以(社会)购买力严重不足;其三,因为生产力提高和购买力不足,所以出现生产过剩,即经济危机发生的直接原因。不难发现,在这个逻辑链条中,材料呈现的两个数据与经济危机发生的直接原因(不是题目所述的主要原因)之间并不存在确定的因果关系,而只是相关性关联。本文试从两方面来说明这个观点。

第一,经济危机发生的主要原因。众所周知,按照马克思主义观点,资本主义经济危机发生的主要原因是生产社会化与生产资料资本主义私有制之间存在不可调和的矛盾。历史发展进程显示,“生产力必然朝向社会化的方向发展,而资本主义生产关系却以生产资料的资本主义私人占有制度为核心”。这就会导致“生产力朝向社会化方向越是发展,越是要求生产资料共同所有、全面所有;而资本主义生产方式越是发展,越是强化资本主义所有制,即越是导致生产资料愈发集中于少数人手中”。②

马克思主义的这一科学论断早已被经济社会实践所证明。这一论断中的自变量是生产社会化与生产资料私有制之间的矛盾,因变量则是资本主义经济危机。危机的程度随着矛盾激化程度的变化而变化,当矛盾激化到一定程度时,经济危机随之爆发,二者之间是确定的因果关系。抓住了主要矛盾和矛盾的主要方面,我们才可能走在探索历史规律的正确道路上,做出合乎历史真实的解释、预测。

只有清晰地认识到资本主义经济危机发生的主要原因,我们才能符合逻辑地解释二战结束以来资本主义世界的变与不变。二战结束后,为了缓和社会矛盾,以美国为代表的西方主要国家纷纷建立和完善社会保障制度体系,这一进程至20世纪六七十年代基本完成。其效果表现为提升国民生活质量,其抓手主要有两个:一是增加国民收入,如美国两次修订《社会保障法》,扩大受益群体,提高最低工资水平;二是减少国民开支,如资助贫困学生,提供医疗保障、住房、养老等公共服务。简而言之,就是政府通过立法、提供公共服务等手段,实现让国民开源节流、增加收入的效果,也就是壮大中产阶级群体,打造橄榄型社会的思路。此為资本主义世界的新变化。

二战结束至20世纪末,资本主义世界还存在一个不变的特征,就是周期性发生经济危机。具体发生时间为:1957—1958年,1973—1975年,1980—1982年。这些经济危机的发生诱因、外在特征、持续时间和危害程度等存在差异,但是其本质没有变化。

综合二战后资本主义世界的变与不变,我们可以看到,主要资本主义国家增加国民收入的措施,并没有改变经济危机周期性发生的情况。这表明,该题材料中的数据不能用来说明经济危机发生的主要原因。

第二,材料中的数据与经济危机发生的相关性。马克思经济学关于资本主义经济危机发生的具体机理存在四种理论假说,其中“资本有机构成提高危机理论”和“消费不足危机理论”都指向同一种状况,即工人的收入与资本收入增长,形成一体两面的逻辑结构关系。①这种状况里隐含了一个前提,就是企业创造的财富是一个定量,在财富分配过程中,工人的收入与资本收入此消彼长,二者的关系具有零和博弈特征。

如此说来,是不是说明材料中的数据与经济危机发生存在因果关系呢?答案依然是否定的。因为材料中的数据反映的是工人工资和工人每小时创造效益的增长率,而非增加值,更非工资总数和效益总数。这三种数据在上述逻辑关系中的证据力不可同日而语,甚至是有无证据力的差别。我们可以通过一道河北省中考试题(2009年第18题)来说明:

由下图得出的结论,不正确的是

A.日本经济增长速度最快

B.联邦德国在西欧四国中经济增长速度最快

C.各国经济增长速度不均衡

D.美国失去了世界经济霸主的地位

答案:D

该题显然是围绕统计对象设置了干扰。材料提供的数据反映的是各国经济发展速度,却不能反映各国的经济总量。而美国能否保有世界经济霸主地位,取决于经济总量,所以无法依据材料提供的数据得出相关结论。同理,工人工资和工人每小时创造效益的增长率,可以确定与工人收入和企业效益相关,却不具备证明二者具体状况的效力。

误区三:用小样本数据解读

大范围现象特征

利用数据解读历史现象,归纳历史发展规律,需要经过收集数据和筛选、整理数据两个程序。数据的广泛性、完整性和准确性等特征直接关乎解读结论的效度和信度。在这方面,大数定律是我们可以使用的权威理论工具。它是概率论历史上第一个极限定理,它依据大量的观察,使得个别的、偶然的差异性相互抵消,显示出总体的必然的规律性,揭示了大量随机变量的平均趋势,为研究随机现象的规律性提供了科学的依据。②由大数定律可知,如果不断地增加样本数量,那么与客观存在的结果之间的差异也会减小,而最终这个差异将会趋向于零。③但是,在教学和命题实践中,存在只用小样本数据就做结论判断的情况。用小样本数据解读大范围现象特征,是将数据转化为证据过程中需要避开的误区之三。

案例3:表Ⅰ川沙县部分名人简历表

表Ⅰ是19世纪末20世纪初毗邻上海的川沙县部分名人的简历,说明当时国内

A.科举取士转向选拔实务人才

B.传统社会结构受到冲击

C.儒家的义利观念被抛弃

D.新式工业在经济中居于主导

答案:B

分析:该题旨在以川沙县三位名人的简历为据,说明19世纪末20世纪初国内社会士农工商分立的结构已受到冲击的特征。若单从获取正确答案的需求,或单从考查知识目标和识记能力的角度考虑,只需依据题干中19世纪末20世纪初这个时间要素,结合基本常识并运用排除法即可,无须关注材料呈现的现象内容。具体而言,排除A的理由有二:一是在清朝科举制度体系中,国学生、监生、生员等均属身份,而非功名,是否可以列入被“取”之“士”的序列有待商榷;二是材料未说明这些名人取得上述身份与他们的事迹之间的时间关系,无从判断他们取得身份与所做事迹之间的关系,进而无从反映当时取士的标准。排除C的理由是,“义利观念”未作为一个概念在教材中出现过,考生只有根据选项提示,用它的上位概念“儒家观念”来替代,而常识是儒家观念在19世纪末20世纪初未被抛弃过。排除D的理由无须赘言了。

作为大型教育考试(2019年全国高考)的试题(全国Ⅰ卷28题),其命制原则要求试题材料提供的信息应该能够满足考生完成应答的需要。①那么,抛开根据已知结论解读材料的思路,我们来看一看情境材料能否为结论提供充分证据。材料中虽然没有出现数字,但是依然包含了数据信息,即人物数量为三人,地域数量为一个。那么用一个县里三个人的情况,能否说明一个广土众民国家的社会结构特征呢?

清嘉庆十五年(1810年)置川沙厅时,编有户口99964人。民国三十六年(1947年)户口调查为135147人。②川沙邻靠上海市区,1840年至1949年的百余年中,人口流动频繁。据此可以判断,19世纪末20世纪初川沙县人口规模应该不低于10万人,也就是说材料提供的3人之数只在川沙县人口总数的10万之中,占极小比例。据此断言川沙县社会结构发生变化,已属依据小样本数据得出统计推断,又怎能据此断言全国情况?

案例4:1915—1918年,《新青年》中“革命”“科学”“平等“民主”等词出现频次大体相当:1919—1922年,“民主”出现次数不到“科学”的1/10,不及“革命”的1/20。这种变化可说明

A.新文化运动主流思想发生转变

B.国民革命运动受到民众普遍拥护

C.资本主义政体模式被知识界否定

D.中国社会主要矛盾发生改变

答案:A

分析:该题旨在通过材料呈现一个现象:1919—1922年,《新青年》中“革命”一词的出现频次远高于“民主”一词,而在此之前两个词的出现频次大体相当。据此推断新文化运动主流思想已发生转变。其考查的知识内容是,“五四”运动的兴起,极大地促进了马克思主义在中国的传播,新文化运动主要内容也随之改变。若单从获取正确答案的需求,或单从考查知识目标和识记能力的角度考虑,只需关注材料提供的现象发生时间即可,无须关注现象内容。具体分析思路参看案例3。

该题是2019年高考文综全国Ⅰ卷29题。我们同样要看情境材料能否为结论提供充分证据。情境材料中包含的数据有:杂志1本,次数比值3个,词汇3个。其中变化内容是通过次数比值反映的,即由约为1/1/1,变为小于1/10和小于1/20。杂志数量和词汇数量均未变化。首先,我们知道比值和比率都是用来表示部分与部分、部分与整体数量关系的。在这个情境里,3个比值能够说明的是3个词出现频次的关系,而不是它们出现频次的确切数量,更不能反映是否还有其他出现频次更高的词汇,以及这些词是什么。所以,对于1本杂志的用词量来说,3个也属小样本数据。其次,我们知道《新青年》是新文化运动的主阵地,我们也应该知道《新青年》不是新文化运动的唯一杂志,或者为数不多的几本杂志之一。据统计,1919年至1920年,全国发行的报刊有400余种。③可见,1/400又是一个小样本数据。第三,即使1919—1922年“革命”一词出现的频次远高于“民主”这一现象与新文化运动主流思想发生转变这一判断,在史实角度存在一致性,但是,按照大规模教育考试试题命制的基本逻辑,试题材料提供的数据依然无法说明上述判断。

历史教学的任务不仅是帮助学生认识历史发展规律,更要培养学生形成收集证据,验证规律的能力。初中历史课标要求,“了解以历史材料为依据来解释历史的重要性;初步形成重證据的历史意识和处理历史信息的能力”;①普通高中历史教学的目标则进一步明确,“通过对史料的搜集、整理和辨析,辩证、客观地理解历史事物,不仅要将其描述出来,还要揭示其表象背后的深层因果关系。通过对历史的解释,不断接近历史真实”。②因为即使规律是正确的,也会因为采用了错误的验证方法、使用了不真实的论据而受到人们的怀疑。③方法是建立在认识基础之上的。希望笔者的粗浅认识能够起到抛砖引玉的作用,引起更多同行对正确使用数据证据的关注,避开误区,行稳致远。

打赏本站 赞一个 ( )

如果本文对你有所帮助请打赏本站

  • 打赏方法如下:
  • 支付宝打赏
    支付宝扫描打赏
    微信打赏
    微信扫描打赏
留言与评论(共有 0 条评论)
   
验证码:
二维码