理论与应用…中点对于一般的随机抽样识;而等距抽样的系统抽样(s标准差的计算却有自己的特点未见得人所尽知,,于具有较高估计效率的中点等距抽样或对称等距抽样其标准差的计算则存在一些复杂因素迄今还研,。究得不多值得认真探讨、一等距抽样的标准差况。先一般地说明一下等距抽样的标准差的基本情若将抽样单位按无关标志排列成抽样框而进行,,,,等距抽样则与纯随机抽样相比只能使具体的抽取单位较方便并不能提高抽样估计的效率因此计算标准差时仍可采用纯随机抽祥的公式,,。—或对称等距扣J、标准差的具体计算方法探讨口文/周铭,其标准差的计算已是常yste厂一,matiesampling),其至处丸月~勺丁顷二五一/此,R一r、_产v厅”b(式一),。其中此瓦]即等距抽样的样本均数的标准差(下标“sy”代表。systematie)讨为群间方差,,。为便于计算与观察我们举简单而典型的数据,:为例设总体包含20个数据它们在抽样框内的排列具有绝对的线性规律如下序号数据:121920:1113151719。21一47490则可知总体均数了为3现采用等距抽样而令样本2。/4容量n为4,于是抽选段容量k二,~5。上述抽样:但只要条件框划分成4个抽选段后每段各包含345个数据如下l具备应将抽样单位按有关标志排列成抽样框。,所谓有关标志通常指它与被观察标志间存在线性或近]序号数据序号数据:5冈蔺:国l序号:1ll2l3144155l1133似线性的关系,此时等距抽样的标准差将低于纯随,。58179199数据四:313333585377399:机抽样并且线性关系越密切则标准差越小因此应按照等距抽样本身的规律来计算标准差,67100序号数据:166l771199200:2l233252729:41433447499虽然从理论上可以对等距抽样的标准差设计不止一种公式但可用于实践的则是如下的思路将等距抽样视为特定的整群抽样。对上述线性抽样框的等距抽样若错误地仍采用纯随机抽样求标准差的公式结果将是二一:_,:,:由于将抽样框等分为,,/。2,N一n、容量为有KK的n个抽选段而进行等距抽样时其样本,处x,」一勺万丙二五。、产/137一勺万_~,2。一4、_二。。、丽二丁2一“`“的构成只取决于第一抽选段的中选序号因此只能种可能的样本构成而实际的样本则为其中之,“它必定严重偏大现将等距抽样视为特定的整群抽样而采用式一则应视为总体包含531333537一于是我们可将之视为将总体等分为K群(总体r群各群的数据分别为42434547,的群数R即为K)而只抽其一群(样本的群数)作为样本的整群抽样1式可推得,即为第一群第二群第三群第四群:11一3251721252527”。据整群抽样的标准差公:::—11—理论与应用…{第五群_`,:1929i5,49,为了求S若需要扩大抽选段,,现将每99个抽选段个样本数它们相应的群均数了为26L.x,」~丫一件`一人l丫=283这才是正确的答案,前已指出抽样框的线性关系越密切则等距抽样的标准差越小但是即使如上述资料具有绝对的标准差也不会缩小为线性关系(p~,1),差的值是中抽数据对其段均数的系统性偏误(或都偏大或都偏小)的反映本资料的S若来代替,在式一的实际应用上由于屹不可得需要以样艺(又一劝r一l其中又为样本各群的均数:,在的困难在于样本只有1个群根本不存在S若为了解决这一问题需要扩大选段即将相邻的m个抽选段予以合并使其包含来的总体等分为体等分为,可将此视为文叉式等距抽样)“kmk群抽其,算S孟了以S亡代替减后据整群抽样公式可推知等距抽样的均数标准差的实际应用公式将成为_S.Jx=UL闷」Ly一。人/s若1(一会)V/2Rr、孟,—(一)/艺二二压i28203,23,43于是合并为,,1个即,m=9此时每段将包含。,=人丫了不二O俪据即以上资料的每一横行数据分为“从整群抽样的角度“来看这种扩大抽选段的作法就是将原来的总体等8。—,,,,群每群36个数据样本为其中的一群改变一72)”,,,”7群(成总体等分为2R每群,4个数据而样9,本为其中的9群(r=m=9)此时样本的,群数据是分别由各段相同位置的中抽数据组成即资料中每一纵行的数据。。。此时标准,9据此计算出样本总均数又为876,从而可求得艺(又r,一劝’,一1=1299于是_。一X’乃I一v!一一=八/斗气1l—nl,1、V一下厂K-夕=人/1l29931、气1V一-下匕)=0355—,夏为整个样本的均数,。现附带说明一下m值为自行选定0。本例若令,m一4,插m则标准差的计算结果为_r354并无明显出入。若本例错误地采用纯随机抽样的公式则一,个中抽单位(实际上也这样一来就是将原”“”,,x5I~`~。、yJ.=人Vl/s,_n、二n、`(1一笼干)=N了人V上)/二毛子(1一主头36288、`产/145936、群抽其m,,1群为样本改变成总从而就可计,=0595群构成样本可见这一计算结果将严重偏大不恰当地降低了抽样估计的精确度(二)_r、产一人1/s若1(/m一守k,V竺、占_、、_、在抽样实践中为了充分发挥具有线性规律的,,,产)(式二)、找一产抽样框的优越性通常会采用中点等距抽样或对称下面举实际例子来计算。设车间采用新设备连8等距抽样的方式这将使得其标准差进一步大大降低。6个班次并分别在各班的续生产3,:小时中随机抽取其同一小时的产品进行检验后得其一级品率的从理论上说对于具有绝对线性规律的抽样框,,,数据(%)如下8485采用中点(或对称)等距抽样后样本均数将与总体083787584286290418731992。284087192886187493496086387369548570941952527均数完全相等从而标准差将降为,,。就前面那个典,88型数据的例子来看采用中点等距抽样的样本是由15、191209352、35、45这40个数据组成其均数为3,,,恰与总9914体均数相等数也仍为30所计算的2容易看出采用对称等距抽样的样本均。6个班次全部产品的一级根据以上样本资料对此3品率进行估计试求其标准差,,。因而此时标准差应为。。而不再是前面38以上数据是一个按时序排列成抽样框的等距抽样的样本样本容量n实际资料当然不会出现绝对线性规律但采用=36,抽选段容量k一8,而总体中点或对称等距抽样无疑将使标准差显著降低,,。这容量N~nk~288。。容易看出样本数据呈现明显的,一点从逻辑上也很容易理解因为对于线性抽样框来说在第一个抽选段随机抽取样本单位而其他各段等距递推的作法会产生系统性偏误即第一段中抽数据偏大(或偏小)于其段均数时其他各段也会,,逐渐增大趋势,。这表明时序与一级品率间存在着线性关系求标准差时不能采用纯随机抽样的公式而应采用式二一12一理论与应用!{如此。中点或对称等距抽样则可避免这种偏误因此,。,_若仍按式二来计算标准差是不恰当的需要研究出一个更合理的公式。既然问题是由线性规律所引起理应联系回归分析来进行研究所谓具有线性规律的抽样框也就是数据在抽样框中的顺序位置与数据本身的大小之间存在着线、性相关,、数据本身是目标变量(或称因变量从变,量)通常以Y表示;数据的序位为解释变量(或称自变量主变量)以为兮==aXA+Bx,,而据样本资料可拟合回归直线方程夕按二式所求的S氏〕将是偏大的。+bx作为对上述未知模型的估计对线性抽样框采用中点(或对称)等距抽样方式后理论上已排除了中抽数据对段均数的偏误于是标准差的大小应只取决于线性关系的紧密程度即关系越紧密标准差越小而当关系紧密至lp}~标准差将降为。。,,,,,根据上述分析就可考虑将中点(或对称)等距抽样的标准差计算方法按回归估计对待将样本的观察数据表示为的序位号码表示为“。—b一一}x_一一}=^V/S三lLl—n,。_n一二二l丫)可见其形式简明与纯随机抽样的公式对比只是以S若代替了52,而已,理论上可有公~S(1一线性关系紧密时S于将远小于,,称)等距抽样时其标准差将远小于纯随机抽样已知随着时间推移一级品将逐渐提高,,—,(式三)PZ),即在52,因而采用中点(或对。。现在回到前面所举的产品一级品率的例子。若就应采用中,点等距抽样的方式设原资料是在每个班次抽取其。,表示它们之间的线性回归模型。正中一小时产品进行检验的中点等距样本则原来,现改按式三计算x,以作比较。以原数据为y;而其相应序号为可求出回归:直线方程的系数a、b与回归方差公如下1时,艺习xy一一n石2又x,n=0347a~一歹b又~83y,25艺,一a艺y一b云nxy一2~1266y;,其在抽样框中相应r,于是_x;。回归估计的样本均数夕(下标一Lxr”表示,regression)本为歹+b(又一又),其中的又为乙,」~n/s于/一266V万L土一面少~丫飞丁气土一、36、骊少辅助变量的总体均数而在此则为整个抽样框的序,号均数于是它也就是抽样框的中点序号又为辅助二0175。355可见它远小于按式二所求得的出中点等距抽样的优越性,。,能正确地反映变量的样本均数而在此则为中抽序号的均数,,,。容易。理解中抽序号的均数妥将等于又于是又就是歹最后我们再就抽样框具有绝对线性规律与毫无线性规律的两种典型情况对式三进行理论验证,。根据样本资料拟合回归直线方程而求出后即可按下式计算回归方差公,a与b:当抽样框具有绝对线性规律时数据大小与其序号~间的线性相关为完全相关即{p},名y,一a习ny一b名xy1。不难理解此时,一2实际数据yi将等同于其理论值夕由于S于算式的分i。回归估计的均数标准差S〔又]为子。名,y:一。名。y一b习xy,”是。艺(y一卯,,的变形,/~乙。1-’`〔X一灭)飞井不,,,从而S子将为下不由此可见按式三所求的标准差也将,,LyrJ=勺,了沉L二十乙一一二,:`(x一x)J以一)为。与理论分析相符合当抽样框毫无线性规律时p~。,但已经说明在中点(或对称)等距抽样中又因而上式简化为_。,又将等于数据大小与其序号间的线性相关为零相关即,(一而据公=Sl。pZ)可知女将等同于,,s,这表明按_,万Ly,J=人I二吸1一V11,/S三e_n不下1、)无关标志排列成的抽样框其估计效率等同于纯随机抽样亦与理论分析相符合,由此可见将中点(或对称)等距抽样采用回归估计原理而求均数标准差S〔又〕时其具体公式即y(责任编辑薛金龙:)