Ortalamanın Standart Hatası

Bu makaleyi okuduktan sonra, ortalamanın standardını öğreneceksiniz.

İstatistiksel çıkarım, aynı zamanda “örneğe dayanan istatistiğin popülasyon parametresinden önemli ölçüde farklı olmadığı ve eğer varsa sadece farkın şans eseri olması nedeniyle fark olduğu varsayımını test etmemize yardımcı olur.

Ortalamanın Standart Hatası (SE M veya σ M )

Ortalamanın Standart Hatası (SE M ), ortalamanın temsil edilebilirliğini veya güvenilirliğini veya önemini test etmek için oldukça önemlidir.

Nümerik Yetenek Testinde Delhi'nin 10. sınıfındaki 200 oğlanın ortalama puanının 40 olduğunu hesapladığımızı varsayalım. Bu nedenle, 40 popülasyondan alınan tek bir numunenin ortalamasıdır (Delhi'deki X sınıfında okuyan tüm çocuklar).

Nüfustan 200 erkeğin farklı rastgele örneklerini de çizebiliriz. Her bir numunenin aynı popülasyondan 200 oğlandan oluştuğunu ve her bir numunenin ortalamasını hesapladığımızda, rastgele 100 farklı numune seçtiğimizi varsayalım.

'N' her durumda 200 olmasına rağmen, farklı örnekleri oluşturmak için rastgele seçilen 200 erkek çocuk aynı değildir ve bu nedenle örneklemedeki dalgalanma nedeniyle bu 100 farklı örnekten 100 ortalama değer elde ederiz.

Bu ortalama değerler birbirinden farklılık gösterme eğiliminde olacak ve bir seri oluşturacaklardır. Bu değerler, araçların örnekleme dağılımını oluşturur. Bu örnek araçların normal dağıldığı matematiksel olarak ifade edilebilir.

100 ortalama değerler (örneğimizde) M pop etrafında normal bir dağılıma düşecektir, M pop ise ortalama örnekleme dağılımının ortalamasıdır. Bu 100 örnekleme aracının standart sapması, popülasyonun standart sapmasına eşit olan (örnek büyüklüğü) kareköküne eşit olacak olan, SE M veya Ortalamanın Standart Hatası olarak adlandırılır.

SE M, numune araçlarının M pop etrafındaki yayılmasını gösterir. Dolayısıyla, SE M, numune araçlarının değişkenliğinin bir ölçüsüdür. Örneklem araçlarının M pop'dan ayrışmasının bir ölçüsüdür. SE M ayrıca σ M olarak yazılır.

Ortalamanın standart hatası (SE M veya σ M ), formül kullanılarak hesaplanır (büyük örnekler için)

(A) Büyük Örneklerde SE M'nin Hesaplanması :

σ = popülasyonun standart sapması ve

n = numuneye dahil olan vaka sayısı

(Nüfusun nadiren SD popülasyonuna sahip olabileceğimiz için σ için örnek yolların SD değerini kullanırız).

Güven aralığı:

İki güven aralığı, yani% 95 ve% 99 genel kullanımdadır. RA Fisher, parametreyi “güven sınırları” olarak niteleyen güven aralığının sınırlarını ve aralıkta güven güvenini olarak adlandırdığı güven adını verir.

(a) Güven Aralığının% 95'i:

Normal eğri altındaki alan tablosuna bakıldığında, vakaların% 95'inin M ± 1.96 SE M arasında olduğunu tespit ediyoruz. M pop 'un M + 1.96 SE M ve M + 1.96 SE M aralığında yer alacağını söylemek için% 95 kendinden emin ya da haklıyız ve M pop'in bu aralığın dışında yatacağını söylemek% 5 hatalıyız.

Başka bir deyişle M pop, M ± 1.96 aralığında olabilir. SE M, % 95'tir (veya .95) ve M pop'in aralık dışında olma olasılığı, % 5'tir (veya .05). 1.96 değeri, .05 anlamlılık seviyesindeki kritik değerdir.

(b) Güven Aralığının% 99'u:

Normal eğri altındaki alan tablosuna bakıldığında vakaların% 99'unun M ± 2.58 SE M arasında olduğunu bulduk. M pop 'un M - 2.58 SE M ve M + 2.58 SE M aralığında yer alacağını söylemek için% 99 kendinden emin veya doğru olduğumuzu ve M pop'in bu aralığın dışında kalacağını söylemek için% 1 hatalıyız.

Başka bir deyişle, M popunun M ± 2.58 SE M aralığında olma olasılığı% 99'dur (veya .99) ve M pop'in aralık dışında olma olasılığı% 1'dir (veya .01). 2.58 değeri, .01 anlamlılık seviyesindeki kritik değerdir.

Burada anlamlılık seviyesinin hassasiyetin derecesi ile ters ilişkili olduğunu bulduk. 05 anlamlılık düzeyinde, vakaların% 95'inde doğru, 0, 01 düzeyinde ise kolaylıkların% 99'unda kesin olacağız.

Aşağıda belirtilen tablo sizden önce gelecektir:

Örnek 1:

Sayısal Yetenek sınavında Delhi sınıfı XII. Sınıftaki oğlanların ortalama ve SD değerleri sırasıyla 48 ve 6 idi. Bu ortalama, M popunu ne kadar iyi temsil ettiği veya M pop değerini tahmin ettiği anlamına gelir. (n = 225, σ = 6, Ortalama = 48]

Normal dağılım tablosuna bakıldığında (Tablo A) tüm (99.7) vakaların hepsinin ± 3σ'da olduğunu bulduk. Örneğimizde tüm örnekleme araçları M pop + 3σ m ile M pop - 3σ M arasında olacaktır . Bu nedenle, herhangi bir örnek ortalama, 3σ M üzerindeki M pop değerinden M pop değerinden daha iyi 3σ m daha az olacaktır.

Böylece σ M'nin değerini biliyorsak, örnek ortalamamıza göre M pop hakkında çıkarım yapabiliriz. Burada 4, ortalamanın bir olduğu örnek araçların dağılımının standart sapmasıdır. Normalde M pop etrafına dağıtılmış olan tüm numune araçları, M pop + 3 SE M ve M pop - 3 SE M arasında kalacaktır.

3 SE M = 3 x, 4 = 1, 2

M pop'un tam değerini bilmiyor olsak da, en azından M pop'un aralarında yattığını güvenle söyleyebiliriz.

(48 -1.2) ve (48 + 1.2) veya 46.8 → 49.2

Tablo A'da kolaylıkların% 95'inin ± 1, 96 σ arasında olduğunu bulduk. Örneğimizde M pop için% 95 güven aralığı M - 1.96 SE M ile M + 1.96 SE M arasında değişmektedir.

Şimdi, 1, 96 SE M = 1, 96 x 0, 4 = 0, 78

. . . M- 1.96 SE M = 48 - .78 = 47.22 ve M + 1.96 SE M = 48 + .78 = 48.78

. . . % 95 güven aralığı 47.22 ile 48.78 arasında değişmektedir. M pop için% 99 güven aralığı M - 2.58 SE M ile M + 2.58 SE M arasında değişmektedir.

Şimdi 2.58 SE M = 2.58 X.4 = 1.03

. . . M - 2.58 SE M = 48 -1.03 = 46.97 ve M + 2.58 SE M = 48 + 1.03 = 49.03

. . . M pop için% 99 güven aralığı 46.97 ile 49.03 arasında değişmektedir.

Örnek 2:

Testteki 400 öğrencinin ortalaması ve SD'si 42 ve 8 olarak bulundu. Nüfusun ortalama puanının% 99 ve% 95 güven aralığında olduğunu tahmin edebilir misiniz?

Çözüm:

(i) M pop için% 95 güven aralığı, M - 1.96 SE M ila M + 1.96 SE M aralığındadır.

Şimdi 1, 96 SE M = 1, 96 x 0, 4 = 0, 784

. . . M-1.96 SE M = 42-.784 = 41, 22

ve M + 1.96 SE M = 42 + .784 = 42.78 (iki ondalık basamağa kadar).

Böylece% 95 güven aralığı 41.22 ile 42.78 arasında değişmektedir. M pop'un 41.22 ile 42.78 arasında olduğu konusunda% 95 oranında doğruyuz.

(ii) M pop için% 99 güven aralığı M - 2.58 SE M ile M + 2.58 SE M arasında değişmektedir.

Şimdi 2, 58 SE M = 2, 58 x 4 = 1, 03

. . . M - 2.58 SE M = 42-1.03 = 40.97

ve M + 2.58 SE M = 42 + 1.03 = 43.03

Böylece% 99 güven aralığı 40.97 ile 43.03 arasında değişmektedir. M pop'un 40.97 ile 43.03 arasında yer aldığından% 99 eminiz.

Örnek 3:

Sayısal Yetenek testinde 169 çocuğun bulunduğu bir örneğin ortalama ve SD değerleri sırasıyla 50 ve 6'dır:

(i) Nüfus ortalaması için% 95 aralığını belirlemek ve yorumlamak.

(ii) Kabul edilebilir örnekleme hatasını .05 ve .01 anlamlılık düzeyinde belirleyin.

(iii) M pop için% 99 güven aralığı belirleyin.

Çözüm:

M = 50

(i) Mp 0p için% 95 güven aralığı M - 1.96 SE M ile M + 1.96 SE M arasında değişmektedir.

Şimdi 1.96 SE m = 1.96 x .46 = .90

Böylece M-1.96 SE M = 50-.90 = 49.10

ve M + 1.96 SE M = 50 + .90 = 50.90

. . . M pop için% 95 güven aralığı 49.10 ile 50.90 arasında değişmektedir. 50 örnek aracından, M pop değerinin 49.10 ile 50.90 arasında sabit bir değer olduğunu tahmin ediyoruz ve söyleyerek% 95 oranında kendimize güveniyoruz.

Diğer bir deyişle, örneklem ortalaması 50, M pop değerini 0, 90'dan fazla kaçırmayacak ve bu 100'deki 95 vaka için geçerli olacaktır. Alternatif olarak, sadece 100'deki 5 vaka için örneklem ortalamasının 50 olduğu gibi 0, 90'dan fazla.

(ii) .05 anlamlılık düzeyinde kritik değer = 1.96

0, 01 önem düzeyinde kritik değer = 2, 58

“Örnekleme hatası = Kritik değer x SE M

Bu nedenle .05 anlamlılık düzeyinde örnekleme hatası 1.96 SE M ve .01 anlamlılık düzeyinde 2.58 SE M'dir.

.05 düzeyinde kabul edilebilir örnekleme hatası = 1.96 SE M = 1.96 x .46 = .90

.01 seviyesinde izin verilen örnekleme hatası = 2.58 SE M = 2.58 X .46 = 1.19

(iii)% 99 güven aralığı M - 2.58 SE M ile M + 2.58 SE M arasında değişmektedir.

Şimdi 2.58 SE M = 2.58 X .46 = 1.19

Böylece M-2, 58 SE M = 50-1, 19 = 48, 81

ve M + 2.58 SE M = 50 + 1.19 = 51.19

% 99 güven aralığı 48.81 ile 51.19 arasında değişmektedir.

Örnek 4:

500 askerden oluşan bir grup için, ortalama AGCT puanı 95.00, SD ise 25'tir.

(ii) Gerçek ortalama için .99 güven aralığını belirleyin.

(ii) Gerçek ortalamanın hangi değerden daha büyük olması muhtemel değildir?

Çözüm:

(i)% 99 güven aralığı M - 2.58 SE M ile M + 2.58 SE M arasında değişmektedir.

Şimdi 2, 58 SE M = 2, 58 x 1, 12 = 2, 89

Böylece M-2.58 SE M = 95.0-2.89 = 92.11

ve M + 2.58 SE M = 95.0 + 2.89 = 97.89

. . . % 99 güven aralığı 92.11 ile 97.89 arasında değişmektedir.

95.0 örnek araçlarımızdan gerçek ortalamayı 92.11 ile 97.89 arasında sabit bir değer olarak tahmin ediyoruz ve bu nedenle% 99 güvende olduğumuzu tahmin ediyoruz.

(ii) Bizim örnek ortalamamız olan 95.0, gerçek ortalamayı 2, 89'dan fazla kaçırmaz, yani gerçek 97, 89'dan büyük değildir.

(B) Küçük numunede SE M'nin hesaplanması:

Büyük örnek olarak 30'dan büyük olan herhangi bir örneği aramak gelenekseldir. N büyük olduğunda, düzeltmeyi yapmaya değmez. Fakat N “küçük” (30'dan az) olduğunda, kullanılması tavsiye edilir (N - 1) ve N oldukça küçük olduğu zaman zorunludur, yani 10'dan az.

Öğrenci (i) teorik olarak (N - 1) SD popülasyonunun bir tahmini olduğunda daima kullanılmalıdır; ve (ii) N = 30 kesme noktası anlamında “büyük örnek istatistikleri” ve “küçük örnek istatistikleri” arasındaki ayrım keyfidir ve bir kolaylık meselesidir.

N, yaklaşık 30'dan küçük olduğunda, σ M veya SE M formülünü okumalısınız:

Örnek 5:

Aşağıdaki beş öğrenci testte puanları güvence altına aldı:

Nüfus ortalaması için% 95 güvenirlik limitlerini belirleyin.

Skorlar - 11, 13, 9, 12, 15:

Çözüm:

M = 12

Burada df = n- 1 = 5-1 = 4

Tablo D'ye referansla, df = 4 ile, .05 anlamlılık düzeyinde (yani% 95 güven seviyesi) t değeri 2.78'dir.

% 95 güven aralığı M ± 2.78 SE M'yi tanımlar.

2.78 SE M = 2.78 x 1.0 = 2.78

M - 2.78 SE M = 12 - 2.78 x 1.0 = 9.22 ve

M + 2.78 S M = 12 + 2.78 x 1.0 = 14.78

. . . % 95 güven aralığı sınırları 9, 22 ve 14, 78'dir.

Bu, P = .95'in M pop'in 9.22 ila 14.78 aralığında olduğu anlamına gelir.

Örnek 6:

Işığa reaksiyon süresi için on ölçü uygulamalı bir gözlemciden alınır. Ortalama 175.50 ms (milisaniye) ve S 5.82 ms'dir. M pop için .95 güven aralığını belirleyin; 0, 99 güven aralığı.

Çözüm:

n = 10, S = 5.82 ms, M = 175.50 ms

T'nin belirlenmesinde kullanılan df (serbestlik dereceleri) (n - 1) veya (10 - 1) = 9

(i)% 95 (veya 95) güven aralığı belirleme:

Tablo D'ye 9 df girilerek, t = 2.26 değerini .05 noktasında okuduk.

M pop için% 95 güven aralığı M - 2.26 SE M ile M + 2.26 SE M arasında değişmektedir.

Şimdi 2.26 SE M = 2.26 x 1.84 = 4.16

Böylece M - 2.26 SE M = 175.50 -4.16 = 171.34

ve M + 2.26 SE M = 175.50 + 4.16 = 179.66

. . . M pop için% 95 güven aralığı 171, 34 ile 179, 66 arasında değişmektedir. P = .95, M pop değerinin 171.34'ten az veya 179.66'dan büyük olmadığı. M pop'un bu aralıkta yattığı sonucuna varırsak, uzun bir deneyler dizisinde, zamanın% 95'inin doğru ve% 5'inin yanlış olması gerekir.

(ii)% 99 (veya .99) güven aralığının belirlenmesi:

Tablo D'ye 9 df girilerek t = 3, 25 noktasında 0, 01 puan okuduk. M pop için% 99 güven aralığı M - 3.25 SE M ile M + 3.25 SE M arasında değişmektedir.

Şimdi 3.25 SE M = 3.25 x 1.84 = 5.98

Böylece, M - 3.25 SE M = 175.50 - 5.98 = 169.52

ve M + 3.25 SE M = 175.50 + 5.98 = 181.48

. . . M pop için% 99 güven aralığı 169, 52 ile 18, 48 arasındadır.

P, .99, M pop değerinin 169.52'den az olmadığı veya 181.48'den büyük olmadığı. Eğer M pop'un bu aralıkta yattığını düşünürsek, uzun bir deney serisi boyunca, zamanın% -99'u doğru ve% 1'i yanlış olmalıyız.

Diğer İstatistiklere İlişkin Çıkarımlar:

Tüm istatistiklerin örnekleme dağılımları ve standart hataları olduğundan, Medyan, Çeyrek Sapma, Standart Sapma, Yüzdeler ve diğer istatistiklerin önemi, ortalamadaki gibi yorumlanabilir ve parametreyi tahmin edebiliriz.

(i) Medyanın Standart Hatası (veya SE Mdn -):

SD ve Q açısından, büyük numuneler için medyanın SE değerleri, aşağıdaki formüllerle hesaplanabilir:

ki burada σ = numunenin SD'si, n = numunenin büyüklüğü ve Q = numunenin Çeyrek Sapması.

Bir örnek, formüllerin kullanımını ve yorumlanmasını gösterecektir:

Örnek 7:

Yedinci Dil Skalası'nda, 801 on bir yaşında erkek çocuk aşağıdaki rekoru kırdı:

Ortanca = 21.40 ve Q = 4.90. Bu medyan, bu numunenin alındığı popülasyonun medyanını ne kadar iyi temsil ediyor?

Çözüm:

n = 801, Mdn = 21.40, Q = 4.90.

İkinci formülü uygulayarak,

N büyük olduğundan, örnekleme dağılımı normal olarak alınabilir ve Tablo D'deki son satırdan güven aralığı bulunabilir. Mdn pop için .99 güven aralığı 21.40 ± 2.58 x .32 veya 21.40 ± .83'tür.

Nüfusun medyanının 20, 57'den az, 22, 23'ten fazla olmadığından emin olabiliriz. Bu dar aralık, örnek medyanında yüksek derecede güvenilirlik gösterir.

(ii) Standart Standart Sapma Hatası (SE σ ):

SE M gibi standart sapmanın standart hatası, numune SD'nin muhtemel sapma değerini parametresinden hesaplayarak bulunur (popülasyon SD). SE σ için formül

Örnek 8:

n = 400, σ = 6

Bu SD, numunenin çizildiği nüfusun SD sesini ne kadar iyi temsil ediyor?

Çözüm:

Örnekler popülasyonlarından büyük ve rasgele çekildiklerinde, yukarıdaki formül SE M ile aynı şekilde uygulanabilir ve yorumlanabilir.

N büyük olduğundan, SD pop için 0, 99 güven aralığı ± 2, 58 σ σ limitlerinde güvenle alınabilir. Σ σ yerine sübstitüe 6 ± 2.58 x .21, yani (6 - .54) ve (6 + .54) veya 5.46 ve 6.54 arasındaki limitlere sahibiz.

Eğer SD pop’ın 5.46 ve 6.54 limitleri arasında olduğunu varsayarsak, zamanın% 99’u doğru ve% 1’i yanlış yapmalıyız.

(iii) Çeyrek Sapma Standart Hatası (veya SE Q veya σ q ):

SE Q, aşağıdaki formüllerden bulunabilir:

Örnek 9:

n = 801, Q = 4.90

Bu Q popülasyon Quartile Sapma'yı ne kadar iyi temsil ediyor?

Çözüm:

Formülü uygulayarak

Q pop için 0, 99 güven aralığı 4, 90 ± 2, 58 x 203, yani 4, 38 ile 5, 42 arasındadır. Bu aralık, Q örneğinin oldukça güvenilir bir istatistik olduğunu göstermektedir.

(iv) Standart Yüzde Hatası (veya% SE veya% σ):

Bir davranışın yüzde yüzdesini verin, soru genellikle şekle ne kadar güvenebileceğimizi ortaya çıkarır. Bir endeks, ilgilendiğimiz davranışların görülme sıklığı yüzdesidir? Bu soruyu cevaplamak için

Yüzde SE değerini aşağıdaki formüle göre hesaplamalıyız:

içinde

p = davranışın meydana gelme yüzdesi, q = (1 - p)

n = vaka sayısı.

Örnek 10:

İlkokul çocukları arasındaki hile çalışmalarında, sosyoekonomik durumu yüksek evlerden gelen 400 çocuğun% 100 veya 25'inin çeşitli sınavlarda hile yaptığı tespit edildi. Nüfus yüzdesini ne kadar iyi temsil ediyor?

Çözüm:

p =% 25 (yüzde oluşum)

q =% 75 (% 100 -% 25)

Nüfus yüzdesi için% 99 güven aralığı

% 25 ± 2.58 x 2.17.

% 25 - 2, 58 x 2, 17% =% 25 -% 5, 60 =% 19, 4

ve% 25 + 2.58 x 2.17% =% 25 + 5.60 =% 30.60

Sosyo-ekonomik durumu yüksek olan ilkokul çocuklarının en az% 19, 4 ile hile yapacağı ve% 30.60'tan büyük olmayacağı konusunda% 99 güven içinde olduğunu varsayabiliriz.

(v) Korelasyon Katsayısının Standart Hatası (SE r veya σ r ):

A-'nın SE için klasik formülü

(N büyük olduğunda r korelasyon katsayısının SE değeri)

Örnek 11:

n = 120, r = .60

Nüfus için% 99 güven aralığı sınırları nelerdir?

Çözüm:

% 99 güven aralığı

= r ± 2.58 SE r = 0, 60 ± 2, 58 SE r

= 0, 60 ± 0, 15 veya 0, 45 ila 0, 75

Önemli İstatistiksel Terimler:

(i) Seviyeler:

.05:

100 örnekten 5'inde yanlış gitme olasılığı.

.01:

100 örnekten 1'inde yanlış gitme olasılığı.

(ii) Güven:

.05 anlamlılık düzeyinde deneyci, verilerin popülasyonu temsil etmesi gerektiğine dair% 95 güvene sahiptir.

.01 anlamlılık düzeyinde deneyci, örnek istatistiklerin popülasyonu temsil etmesi gerektiğine dair% 99 güvene sahiptir.

(iii) Önem Seviyeleri:

Hipotezi test etmeden önce, boş hipotezi kabul etmek veya reddetmek istediğimiz kriterlere karar vermeliyiz. Testten önce önem seviyesini belirlemeliyiz. İki anlamlılık düzeyi genel olarak viz., .05 ve .01 seviyelerindedir.

(a) .05 anlamlılık düzeyi:

Tablo A'dan, normal dağılımdaki vakaların% 95'inin ± 1, 96 SE M limitleri dahilinde olduğunu okuduk. M ± 1.96 SE M tarafından belirtilen limitleri alırsak, güven seviyesinin .95 olduğu bir aralık belirleriz. Yargımızı bu sınırlara M pop büyüklüğü olarak alarak, zamanın% 95'inin ve% 5'inin yanlış olmasını bekliyoruz.

- 1.96 SE M ve + 1.96 SE M arasındaki alan Ho kabul alanı ve - 1.96 SE M ve + 1.96 SE M dışındaki alanların reddedilme alanı olarak bilinir. Herhangi bir örnek ortalama kabul alanında yatıyorsa Ho kabul ediyoruz. H'yi reddederken, örnek ortalamasının ± 1, 96 SE M dışında olabileceğini kabul ediyoruz.

Dolayısıyla Ho reddinde% 5 hata yapıyoruz, çünkü 100'ün% 5'inde böyle bir örnek ortalama oluşabilir. Doğru olduğu zaman Ho'yu reddetmek için% 5'e kadar risk almak istiyoruz. Bu nedenle Ho'yu reddetme kriterleri önem seviyesine getirilmiştir.

(b) .01 anlamlılık düzeyi:

Tablo A'dan, normal dağılımdaki kolaylıkların% 99'unun ± 2, 58 SE M limitleri dahilinde olduğunu okuduk. M ± 2.58 SE M tarafından belirtilen sınırları aşıyorsak, güven düzeyinin .99 olacağı bir aralık belirleriz. Kararımızı M pop büyüklüğüne göre bu sınırlara dayandırırken, zamanın% 99'unda haklıyız ve% 1'ini yanlış tutuyoruz.

- 2.58 SE M ile + 2.58 SE M arasındaki alan H 0 kabul alanı ve bunun dışındaki alan Ho reddetme alanı olacaktır. Doğru olduğu zaman Ho'yu reddetmede% 1 kadar risk almaya istekliyiz.

.01 anlamlılık düzeyi .05 seviyesinden daha ağırdır, çünkü .01 düzeyinde Ho reddetme hatası% 1 iken, .05 düzeyinde bu hata% 5'tir.

(iv) t-Dağıtım:

N, 30'dan küçük olduğunda, yani örnek küçük olduğunda, örnekleme dağılımına “ t- dağıtımı” denir.

N-küçük olmadıkça, t-dağılımı normalden çok farklı değildir. N boyutu arttıkça t dağılımı normal forma daha fazla yaklaşır.

T-dağılımının özellikleri:

1. Çan biçimli bir eğriye benziyor. Fakat dağılımı, sıfır çarpıklık ve 'Ku' ile 3'ten büyük olan değişkenlik gösterir.

2. T = 0 çizgisi hakkında simetriktir.

3. t = 0 konumunda maksimum koordinat ile tekdüzedir.

4. N küçük olduğunda, t- dağılımı normal eğrinin altındadır, ancak eğrinin kuyrukları veya uçları normal eğrinin karşılık gelen kısımlarından daha yüksektir.

5. t- dağılımının taban çizgisindeki birimler aslında σ puanlarıdır, yani

(v) Serbestlik Derecesi (df):

Küçük örneklem istatistiklerinde serbestlik derecesi kavramı oldukça önemlidir. Varyans analizinde ve diğer prosedürlerde de çok önemlidir. Serbestlik dereceleri değişme özgürlüğü anlamına gelir.

Diyelim ki ortalaması 15 olan beş puan seçelim. Şimdi dört puanın 18, 10, 20, 15 olduğunu varsayalım. Ortalama 15'e eşit olmak için, beşinci puanın 12 olması gerekir. Herhangi bir dört puanı seçme özgürlüğü.

Ancak 5. puanı seçme özgürlüğümüz yok, çünkü 5. puan ilk dört puanın ortaya koyduğu varyasyonda ve ortalamanın 15 olacağı varsayımıyla ayarlamalar yapıyor. Burada N = 5 ve bir kısıtlama getiriliyor. ortalama 15 olmalıdır. Bu nedenle, serbestlik derecesi N - 1 veya 4'tür.

5, 6, 7, 8 ve 9 puanımız 5 ise ortalama 7; puanlarımızın 7'den sapmaları - 2, - 1, 0, 1 ve 2'dir. Bu sapmaların toplamı sıfırdır. 5 sapma arasından sadece 4 (N - 1), toplam sıfıra derhal 5. sapmanın değerini sınırlaması şartı ile “serbestçe” seçilebilir.

Elbette, SD, ortalama etrafında alınan sapmaların karelerine dayanıyor. Ortalamayı hesaplamak için N df vardır, ancak ortalamanın hesaplanmasında tek df olarak 'S' (SD) için yalnızca (N - 1) kullanılabilir.

Başka bir örnekte, N = 10 olduğunda, M pop değerini tahmin etmek için kullanılabilen df, 9 veya (N - 1), yani gözlem sayısından daha az, yani 10 olarak verilmiştir. Bir df, M'nin hesaplanmasında ve buna göre kaybolmaktadır. M pop değerini 'S' ve t-dağılımı ile tahmin etmek için sadece 9 tane kaldı.

Ne zaman bir parametre tahmin etmek için bir istatistik kullanılırsa, kural şudur ki mevcut df, N eksi örneğinden zaten hesaplanmış olan parametre sayısına eşittir. M, M pop tahminidir ve hesaplanırken 1 df kaybederiz.

Bir r'nin güvenilirliğini tahmin ederken, örneğin (iki yöntemden sapmalara bağlı olarak), df (N - 2). Ki-kare testleri ve varyans analizi durumunda, df'nin belirlenmesinde ayrı prosedürler takip edilir.

(vi) Boş hipotez:

Boş hipotez, farklılıkların önemini test etmede yararlı bir araçtır. Bu hipotez, iki popülasyon aracı arasında gerçek bir fark olmadığını ve bu nedenle örnek araçlar arasında bulunan farkın, kazara ve önemsiz olduğunu iddia eder.

Boş hipotez, “bir erkek suçlu olduğu kanıtlanana kadar masumdur” hukuku ile ilgilidir. Bu bir meydan okumadır ve bir deneyin işlevi, gerçeklere bu meydan okumayı reddetme (ya da reddetme) konusunda bir şans vermektir.

Örnek olarak, “tek vardiya okullarının eğitim standartlarının çift vardiya okullarından daha iyi” olduğu iddia edildiğini varsayalım. Bu hipotez belirsiz bir şekilde ifade edilmiştir ve tam olarak test edilemez.

“Tek vardiya okullarının çift vardiya okullarından daha iyi öğretim standartları getirmediğini” iddia edersek (gerçek fark sıfırdır). Bu boş hipotez kesindir ve test edilebilir. Eğer boş hipotezimiz vergilendirilmez ise, reddedilmelidir. Farksızlık ifadesi, iki grubun test edileceğini ve eşit bulunduğunu varsayar.

Boş form, deneyimli araştırma personelinin çoğu tarafından tercih edilir. Bu ifade biçimi, hipotezin istatistiksel testinde kullanılacak matematiksel modeli daha kolay tanımlar.

Boş bir hipotez asla kanıtlanmadı veya kanıtlanmadı. Belli bir güven derecesiyle (veya belirli bir önem düzeyinde) kabul edilebilir veya reddedilebilir.

Bir hipotezi test etmeden önce aşağıdakileri göz önünde bulundurmalıyız:

1. Numunenin büyük mü yoksa küçük mü olduğu.

2. Önem derecesi nedir.

3. Testin iki kuyruklu bir test mi yoksa tek kuyruklu bir test mi olduğu.

(vii) Çıkarımlarda hatalar:

Boş hipotezi kabul ederken ya da reddederken, iki tür hata yapma ve araştırma görevlileri tarafından güvence altına alınma olasılığı vardır.

Tip I ve Tip II olarak adlandırılan hatalar aşağıda açıklanabilir:

Tip I hataları:

Bu tür hatalar, doğru bir fark olmasa da, anlamlı bir farkı işaretleyerek boş bir hipotezi reddettiğimizde ortaya çıkar. İki popülasyon aracı arasındaki farkın (M pop - M pop = 0) aslında sıfır olduğunu varsayalım. (Örneğin, kız ve erkek çocukların çoğu zihinsel test için aynı nüfusu oluşturduğu düşünülebilir). İki örnekleme aracının öneminin test edilmesi, popülasyon araçlarındaki farkın önemli olduğu gerçeğini yansıtıyorsa, Tip I hatası veriyoruz.

II. Tip hataları:

Bu tür hatalar, gerçek bir fark olmasına rağmen, anlamlı olmayan bir farkı işaretleyerek boş bir hipotezi kabul ettiğimizde ortaya çıkar. İki nüfus aracı arasında gerçek bir fark olduğunu varsayalım.

İki örneğe uygulanan anlamlılık testimiz, popülasyondaki farklılıkların anlamlı olmadığına inanmamıza yol açarsa, bir Tip II hatası yaparız.

Her iki hatanın önüne geçmek için çeşitli önlemler alınabilir. Düşük bir anlamlılık düzeyi belirlersek (P, 0, 05'ten büyüktür), Tip I hata olasılığını arttırırız; Oysa eğer yüksek bir önem seviyesi kurarsak (P = 0, 05'ten küçük), Tip I hataları daha az olacaktır. Çok yüksek bir önem seviyesi belirlediğimizde, Tip II türünden hatalı çıkarımlar yapma olasılığı artar.

(viii) İki kuyruklu ve Tek kuyruklu anlamlılık testleri:

Boş hipotezde, elde edilen araçlar (yani, M1 - M2) arasındaki farklar, artı veya eksi olabilir. Olasılıkların belirlenmesinde, örnekleme dağılımının her iki kuyruğunu alıyoruz.

(ix) Kritik Oran (CR):

Kritik oran (CR), numune araçları arasındaki farkın standart hatasını (CR = D / SE D ) bölerek bulunur. Numunelerin N'leri büyük olduğunda (30 ya da daha fazlası “büyük”), popülasyon araçları arasındaki gerçek fark etrafında CR'lerin dağılımının normal olduğu bilinmektedir, t σ D'nin daha kesin bir tahmininin yapıldığı kritik bir orandır. kullanıldı. T'nin örnekleme dağılımı, N küçük olduğunda normal değildir (30'dan az, örneğin), t bir CR'dir; ancak tüm CR'ler t değildir.

İki kuyruklu test:

1. İki kuyruklu testte normal eğrinin iki ucunu da dikkate alıyoruz.

2. Kuyruklu olmayan alternatif hipotez durumunda, iki kuyruklu bir test yaparız.

3. Örnek:

Bir meslekte bazı oğlanlara ilgi testi uygulanır. Eğitim sınıfı ve Latin sınıfındaki bazı erkeklere. İki grup arasındaki ortalama fark .05 düzeyinde anlamlı mıdır?

4. Örnek ortalaması M pop'dan her iki yönde + veya - 'den sapma gösterir.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. Önemli olması gereken değer:

0, 096 düzeyinde 1, 96

0, 08 seviyesinde 2, 58

7. Reddetme alanı normal eğrinin her iki ucunda (kuyruklarında) (yani 05-0.025 ve .025, 01 005 ve 005) ayrılır.

Tek kuyruklu test:

1. Bir tane uzun sürmeliyiz, yani normal eğrinin sol veya sağ tarafında dikkate almalıyız.

2. Yönlü alternatif hipotez durumunda, tek kuyruklu test viz., M1> M2 yaparız. Bu durumda yön çok net bir taraftır.

3.Example:

On konuya, sadece 1 ve 5 numaralı puanların puanlarının gösterildiği, sayısal bir testte 5 ardışık yol verilir. Başlangıçtan son denemeye ortalama kazanç önemli midir?

4. Örnek ortalaması, popülasyon ortalamasından bir yönde sapma gösterir.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 veya M 1 <m2

6. Önemli olması gereken değer:

0, 06 düzeyinde 1, 62

0, 33 seviyesinde 2, 33

7. Dağıtımın sağ kuyruğunda veya dağıtımın sol kuyruğunda bir reddetme alanı vardır.