焦点期刊
投稿咨询

著作编辑 著作编辑

咨询邮箱:1117599@qq.com

写作指导

论文二手数据使用的问题与局限

时间:2023-07-22 22:00 所属分类:写作指导 点击次数:

  现有统计资料/文献分析法是指利用官方或准官方的统计资料/文献来进行研究的一种方式。一般是指以频数、百分比等统计形式出现的聚集资料/文献。

  尽管现有统计资料/文献分析在不断增长与流行,使用前和使用中仍存在着局限性。并非因为原始资料是由政府机关或其他来源所搜集的,现有统计资料/文献就不会有任何问题。针对以上问题,学者劳伦斯·纽曼在《社会研究方法——定性和定量的取向》这本著作中提到了现有统计资料/文献使用前面临的三个问题,以及使用中的两个局限性。

  一、现有统计资料/文献使用前面临的三个问题

  一个问题是研究者所使用的现有统计资料/文献也许并不适合他的研究问题。开始前,研究者需要考虑资料的单位(例如,个人的类型、组织)、资料搜集的时间和地点、所使用的抽样方法,以及资料涉及的其他议题。例如,一个研究者想检验在美国的拉丁人和英国人之间的种族/人种紧张,利用的统计资料只包括有西北太平洋和新英格兰州的资料,这就要重新考虑一下研究问题或者是所使用的资料。

  第二个问题是研究者不了解实际题目。由于资料获得是相对容易的,对于研究主题知之甚少的研究者会做出错误的假设或者对结果做出错误的解释。在使用任何数据之前,研究者需要明晰相关主题。例如,一个想利用高中毕业率数据的研究者如果不理解德国的中学教育系统及其独特的学术和职业轨迹,他(她)在解释结果的时候可能就会出错。

  第三个问题是研究者也许会详尽地引用统计数字,给人一种科学精确的印象。这可能导致误置精确性谬误,这种谬误通过不加求证过分详尽地引用统计数字,给人一种资料精确的错误印象。例如,现有的统计资料报告澳大利亚人口为19169083,其实更好的报告应该是1900万多一些。某人或许通过对2000个全国综合社会调查资料的统计分析,计算出离婚率为15.65495%,但对离婚率更好的报告应是15.7%。

  二、现有统计资料/文献使用中的两个局限性

  (一)分析单位与变量属性

  现有统计资料常有的问题是,找出适当的分析单位。许多统计数字是聚集的,不是个人的。例如,政府文献表格中的资料是以州为单位的统计资料(例如,失业率、犯罪率),但是研究问题的分析单位是个人(例如,“失业的人更可能犯侵犯财产罪吗?”)。这类情况下,可能会犯层次谬误。这对现有统计资料分析来说,不是个问题,因为研究者可以从档案中取得每位被访者的原始资料。

  一个相关的问题是,关于现成文献或调查题目中变量属性的类别问题。如果搜集到的原始资料具有许多极为精细的类别,那这就不是个问题。但是如果搜集的原始资料是较为宽泛的类别,或是不符合研究者的需要,那么问题就来了。举例来说,如果研究者感兴趣的是亚洲传统的人,而文献中族群传统的类别是“白人”、“黑人”或“其他”时,研究者就面临问题了。亚洲人与其他族群都被包括在“其他”项之内。

  还有的时候,资料是照精细类别搜集的,但是出版时只提供精简的类别。所以需要花更多的力气,寻找该机构是否搜集了更精细的信息,或是哪里可以得到更精细的信息。

  (二)缺失资料

  令使用现有统计资料与文献的研究者头疼不已的一项问题是缺失资料。有的情况是,资料确实搜集到了,但是遗失了。更常见的是,根本没有办法搜集到。搜集官方资料的决策是政府执行机构制定的。而一项日后要把资料公诸大众的调查中,要问哪些问题的决策权,则掌握在一群研究者的手里。这两种情形下,那些决定要搜集某些资料的人,可能不会搜集其他研究者需要的资料,以便于自己提出某个新问题。政府机构会因为政治、预算或其他的理由,而开始或停止资料的搜集。例如,20世纪80年代初期,美国联邦政府为了缩减成本,而停止搜集社会研究者视为极其珍贵的资料。当研究者从事的研究涵盖的时期很长时,缺失资料尤其成问题。举例来说,对美国停工数与罢工数感兴趣的研究者,能够取得19世纪90年代迄今的资料,但是1911年之后的五年内联邦政府并没有搜集这笔资料。

  三、结语

  现有统计资料/文献可作为一种补充的资料来源,也可以作为主要的资料来源。在使用现有资料/文献进行统计分析前,需要考虑所使用的资料/文献是否适合自己的研究问题,是否了解实际题目,是否需要详尽地引用统计数字等问题。在使用现有资料/文献进行统计分析时,需要明确分析单位与变量属性,注意对现有统计资料/文献的审核。