时间:2025-11-05 22:06 所属分类:写作指导 点击次数:
概率抽样的一个最重要的方面就是它代表总体。一个完美的代表性样本能精确代表总体。根据概率抽样搜集的数据推断总体,也主要是基于统计概率。样本的规模越大,推断总体出现错误的可能性越小。那么如何确定适当的样本规模?部分作者对此存在疑问。针对这一问题,学者马克·桑德斯、菲利普·刘易斯、阿德里安·桑希尔在《经管研究方法——为学生量身定制》一书中,给出了详细解释。
一、样本规模选择的决定因素
概率抽样是研究结论的精确性、与搜集、检查及分析数据所花时间和财力的一种权衡。在这种权衡中的样本规模选择取决于:
1、我们需要对自己的数据有信心——即所搜集数据的特征将代表总体特征的置信水平;
2、我们所能容忍的误差幅度——即我们需要根据样本作出估计的精确性;
3、我们将要进行的分析的类型——尤其是我们希望将数据细分为很多类别,因为许多统计方法对每个类别的个体数据有最低限制,并在较小的程度上取决于抽取样本的总体的规模。
鉴于这些互相竞争的影响,毫不奇怪的是最终的样本规模几乎总是一个判断和计算的问题。对很多研究问题和目标而言,我们需要为确定个别类别的规模进行特殊的统计分析。特别是,几乎所有统计学教材的调查都会强调,为了确保不产生虚假的结果,用以分析的数据必须是正态分布的。统计学家已经证明了样本的绝对规模越大,它的分布将会越接近正态分布,并因此而稳定。这种关系被称为“中心极限定理”,即使选取样本的总体不服从正态分布这种关系也会出现。
统计学家还指出30个或更多的样本规模通常会导致均值的样本分布非常接近正态分布。鉴于此,Stutely提出的统计分析的最小数目为30的建议,为整体样本中每一类别的最小数据提供了有用的经验法则。当分类的总体数量少于30,且我们希望在这个层面上进行分析时,我们通常应搜集该类别的所有个体数据。或者,我们可以使用诸如Ex-Sample之类的专家系统。该软件可以计算不同的统计分析需要的最小样本规模,即在既定的资源(如,时间、财力和回复率等)情况下的最大可能的样本规模。此外,该软件提供一份证明所计算样本规模合理的报告。
二、不同总体规模的样本规模
如果我们正在对样本进行统计分析,我们将很可能从所选择样本的分析中得出有关总体的结论。以描述样本的数据为基础得出关于总体结论的过程叫做统计推断,并且,这个过程允许我们计算由于样本规模导致所获结论偶然发生的概率大小。概率通常通过统计分析软件自动计算出来。但需要记住的是,倘若结果是无偏差的,则规模大的样本比规模小的样本更能代表总体,尤其是,样本计算的平均值(平均数)会更接近于总体的平均值。这就是著名的“大数定律”。
研究人员通常采用95%的置信水平,这就意味着如果我们选择了100个样本,这些样本中至少有95个能代表总体的特征。显著性水平以在某个范围或误差形式的百分比形式说明我们的总体估计的精度。假定数据能从样本的所有个体中搜集,对于大多数的商业管理研究而言,研究者可以接受在真实值上加减3%到5%来评定总体的特征。这就意味着如果某一分类中涵盖了45%的样本,则我们估计同分类的总体将在45%的基础上加或减误差幅度——对3%的误差幅度而言在42%和48%之间。
样本的绝对规模越小,并在较小的程度上,总体抽样的相关比例越小,误差幅度就越大。在此,绝对样本规模对误差幅度的影响随着样本规模的增大而减小。deAaus认为由于这个原因,很多市场研究公司将他们的样本规模限制在大约2000个左右。不幸的是,对于许多样本,一个100%的回复率是不可能的。因此,为确保有足够的回复达到我们所要求的误差幅度,我们的样本规模需要更大。
三、结论
在所有的概率样本中,重要的一点是样本规模足够大使我们对自己的数据有必要的信心。因此,误差幅度必须在可接受的范围之内,并且我们必须确保我们能够在所要求的详细程度上进行分析。因此我们需要评估可能得回复率——即样本中个体的回复比例或数据搜集比例——从而相应的增加样本规模。
上一篇:学位论文评审的几个要点及写作要求
下一篇:没有了