第五节 频率分布
扩展资料
统计检验的基本思想是什么?
先从一个例子谈起.
某公社种植的小麦,根据往年生产情况,平均每亩产量为μ0=350斤,标准差为σ0=75斤.今年,该公社引进新的小麦品种,试种了100亩,在田间管理大致相同的情况下,其平均亩产量为x=368斤,能否认为该品种可以推广呢?
显然,新品种的亩产量比原品种的亩产量高.就是说,新品种与原品种存在差异,但如果不引进新品种,还用原品种种植,这100亩的小麦平均亩产量不一定仍旧还是350斤,而可能会增加或减少.因此,新品种与原品种的差异,可能是由于品种不同引起,也可能是由于其它因素引起的.前者称为条件差异,后者称为随机差异,这两种差异经常纠缠在一起,要解决上述问题,关键在于正确区分这两种差异.统计检验就是帮助我们处理这类问题的一种科学方法.
首先,我们假定新品种对亩产量没有影响(称为统计假设,简称假设),就是说不
区间外的概率只有5%,极难由偶然因素造成.因为概率5%相当于二十次才能出现
是正确的,从而否定原假设.
种与原品种有显著性差异.其标准是在区间(335,364)外的概率只有5%,数值5%叫做显著性水平,通常用α表示,上述判断就是在α=5%下作出的.显著性水平变了,判断也可能随着改变,例如,取α=1%,u0.01=2.58,因而将上述区间的1.96换成2.53.这时,区间变为
否定原假设,现在算得:
因而,新品种与原品种没有显著性差异.不同的显著性水平能作出不同的判断,这并不矛盾.我们有95%的把握判断两品种有显著性差异.但无99%的把握.究竟显著性水平取多少为好呢?
不管取什么显著性水平,我们都可能犯两种错误:
1.新品种与原品种确无差异,误判为显著;
2.新品种与原品种确有差异,误判为不显著.
两种错误比较起来,第1种错误比第2种后果严重些.因为第一种错误会把不一定适合本地土壤、气候的新品种认为有效,大力推广,引起不必要的损失.至于第2种错误,可通过重复试验矫正,后果不如第1种严重.所以,我们作判断时,力争少犯第1种错误.显著性水平α越小时,犯第1种错误的可能性就越小.但第2种错误却容易发生.故显著性水平的大小,应该依照具体情况来规定.例如,在品种初级试验时,可将显著水平取得大一些,5%已经足够;有时甚至用10%的显著水平,以免将有希望的品种淘汰掉.当在评定新品种是否适合大面积推广时,则采用1%显著性水平,这样可少犯第1种错误.根据本题的例子.这新品种还需继续试验.不能立即大面积推广.但如果考虑到其它因素,比如新品种具有便于田间管理,不易倒伏,抗病力强等优点,亦可作部分推广.
最后,我们将统计检验的步骤归纳如下:
1.作出统计假设,即假定试验结果所产生的差异,是由随机差异产生的.
3.确定显著性水平,查有关的分布表,得临界值.例如本题中取显著性水平α=5%,临界值u0.05=1.96.
4.作出判断,根据计算的统计量与临界值比较,得出否定或肯定假设的结论,本题中,当|u|>uα时,否定假设.
统计检验的内容非常丰富,我们仅介绍与正态分布有关的检验方法,正态分布由两个参数μ、σ决定的,关于正态分布的检验问题,实质上就是检验这两个参数.
检验样本均值x与总体均值的差异问题,在已知总体标准差σ时,可用u检验法;在不知总体标准差σ时,检验样本间的均值差异,可用t检验法.
检验样本标准差与总体标准差的差异问题,可用X2检验法,检验两样本间的标准差的差异问题,可用F检验法,等等.