Örneklem Büyüklüğü: Problem ve Matematik

Bu makaleyi okuduktan sonra problemi ve örneklem büyüklüğünün matematiğini öğreneceksiniz.

Örneklem Büyüklüğü Sorunu:

Şimdi örneklemeyle ilgili en zorlu problemlerden birini, örneğin, örneklem büyüklüğü problemini ele alacağız. “Nüfusun büyüklüğü ile ilgili olarak örneklemin yeterli büyüklüğü ne olmalıdır?” “Örneklem ne kadar büyük olmalı?” Sorusu araştırma öğrencileri tarafından sıkça sorulan sorular. Xo bu soruya kesin cevap verilebilir.

Bunun nedeni, boyut sorusunun yalnızca popülasyon için öğeleri örneklerken, her bir öğenin örnekleme dahil edilme şansına sahip olacak şekilde, yani örneklemenin olasılık tasarımını benimsediğimiz şekilde cevaplanabilmesidir.

Sadece olasılık tasarımı, temsili örnekleme planlarının oluşturulmasını mümkün kılar. Dolayısıyla, temsili örnekleme planlarının oluşturulmasını mümkün kılar.

Bu nedenle “örneklemin belirlenmiş büyüklükteki nüfusu temsil etmek için ne kadar büyük olması gerektiği” sorusu olasılık örnekleme prosedürünü öngörmektedir. Bu prosedürü geçemezse, numunenin ne kadar büyük olursa olsun temsili olması yalnızca umut ve varsayım meselesi olabilir.

Numunenin boyutuyla ilgili genel kavram yanılgı, numunenin alındığı evrenin boyutunun, bu evrenin yeterli veya temsili bir örneğini elde etmek için gereken vaka sayısını belirlemesidir.

Vurgulamanın, evrendeki vaka sayısına değil, örneklemdeki sayılarına yerleştirilmesi gerektiğine hemen dikkat etmeliyiz.

Örneklem Büyüklüğünün Matematiği:

Temel pratik soru “Belirli bir çalışma için araştırmacı tarafından öngörülen şekilde istenen hassasiyet derecesini verecek olan örneklem büyüklüğü nasıl belirlenir?” Örnekleme sorunu elbette tüm çalışmalarda aynıdır; popülasyon hakkında bir şey hakkında örneklem bilgisine dayanarak tahmin.

Araştırmacı, bu tür bir tahmin için, örneğin üzerindeki yüzdeleri, ortalamaları, standart sapmaları vb. Amaçlara ne tür bir istatistik sunacağını bilmelidir. Bu önemlidir, çünkü farklı örnek boyutlarının sağladığı, numune iadelerinde istenen hassasiyet derecelerine bağlı olarak farklı istatistik türleri yararlıdır.

Ortalamalar ve yüzdeler daha yaygın olarak istenen istatistiklerdir, bu nedenle, özellikle ortalamalar ve yüzdeler bakımından istenen hassasiyet derecelerine karşılık gelen örneklem büyüklükleri sorununu ele alacağız.

Araştırmacı tarafından çizilen örneklem, seçebileceği olası evrenin olası örneklerinden yalnızca biri olduğundan, bu örneklemde ne kadar güvendiğini, kendisinin üzerinde bulunduğu 'evrenin' temsilcisi olarak yerleştirebileceğini bilmesi gerekir. Genelleştirmek istediği bir şeyi veya referansını bilmek istiyor.

Ona tatmin edici bir hassasiyet düzeyi kazandırmak için numunenin ne kadar büyük olması gerektiğini bilmesi gerekir. Bu hesaplama matematiğe başvurmakla mümkündür çünkü rastgele örneklemede (olasılık örneklemesi tasarımı), evrendeki her bir öğenin örneklemeye dahil edilebilecek belirli bir olasılık olasılığına sahip olması, tahmin veya tahminin kesinliği, madde sayısının karekökü ile ilişkili olduğu için örnekte.

Belirli bir çalışma için numunenin gerekli büyüklüğünün hesaplanmasına devam etmeden önce, uygulamada, nüfus veya evren hakkında bazı ön bilgilerin temin edilmesi gerekir.

Araştırmacı, evrendeki belirli bir özelliğin ortalama ölçüsünün bir tahminini yapmak için numuneyi kullanmak istiyorsa, evrendeki öğelerin değerlerinin sırasıyla dağılımında standart sapma (dağılım) için bir ön tahminde bulunmalıdır. verilen özelliğe.

Evrendeki belirli bir özelliğe ilişkin değerler aralığını (yayılma) tanıyan araştırmacı, (sonlu) evrenin standart sapmasının, bu aralığı 6'ya bölerek standart sapmanın ön tahminini alabilir. Tüm pratik amaçlar için, tüm varyasyon aralığının yaklaşık 1 / 6'sı alınmalıdır.

Başka bir deyişle, bir dağılımın dağılma aralığı 6 standart sapma birimini içermek üzere alınabilir. Evrenle ilgili ön bilgi, pilot araştırmalar, geçmiş anketlerin sonuçları, istatistik büroları tarafından yayınlanan raporlardan, alandaki uzmanların hesaplanmasından vs. elde edilebilir.

Araştırmacı, numunenin boyutunu hesaplamaya devam etmeden önce, tahminlerin beklenen hassasiyet seviyesine karar vermelidir. Bu beklenti, esas olarak çalışmanın amacına dayanmaktadır.

Başka bir deyişle, araştırmacı karar vermelidir:

(a) Örneklemden elde edilecek tahminde ne kadar hatanın (gerçek değere, yani 'evrenin' değeri ile karşılaştırıldığında) tolere edilebilir (hata payı veya doğruluk sınırı olarak adlandırılır) ve

(b) Tahminin bu hata payına (denilen, güven veya olasılık seviyesi) gireceği konusunda ne kadar güvence verileceği söylenebilir.

Ancak, şu anda bunları daha ayrıntılı olarak düşünmek doğru olacaktır:

(a) Hata Marjı veya Doğruluk Sınırı:

Buradaki temel soru şudur: 'Örneklem çalışmasından elde edilecek yüzde veya ortalama, gerçek ortalamadan (nüfusun) değişkenlik göstermesi muhtemeldir ve yine de tolerans gösterilebilir?' Araştırmacı% 5 hataya dayanabilir veya% 2 sınırında doğruluk isteyebilir.

Her şey, belirli gerçekleri ne kadar doğru veya tam olarak bilmek istediğine bağlı. Araştırmacının seçime itiraz eden iki adaydan hangisinin sandalye kazanacağını önceden bilmek istediğini varsayalım. Oylama yakınlaşacaksa, araştırmacı pratikte kesin olması için daha küçük bir hatayı tolere etmeyi göze alabilir.

Örneğin, izin verilen hatayı% 2'nin altına ayarlayabilir. Öte yandan, seçim tek taraflı görünüyorsa ve belirli bir aday lehine oldukça önyargılı görünüyorsa, araştırmacı tahminde çok daha büyük bir hatayla bile sonuçları tahmin edebilir.

Örneklem anketi oyların% 60'ının aday lehine sonuçlanacağını ortaya çıkarsa, % 9'a varan bir hataya tahammül edilebilir. Bu durumda, örnek anketi% 9'luk gerçek değerden sapan en talihsiz numuneyi almış olsa bile, gerçek değer hala% 51, yani kritik nokta olan% 50'nin üzerinde% 1 olacaktır.

Bu nedenle, % 60 tahmini değer ve% 51 gerçek değer kritik noktanın üstünde olacak (yani% 50) ve tahmin güvenilir olacaktır.

(b) Olasılık veya Güven Düzeyi:

Araştırmacı, doğruluk sınırına ek olarak, çalışmasına istinaden, örnek tahminlerde ne kadar güven duymak istediğine karar vermelidir. çalışma için onu.

Bazı durumlarda, tahminlerinin (numuneye dayanarak) gerçek değerin% 51'i içinde olacağından aşırı derecede emin olmak isteyebilir, ancak bazı durumlarda, daha az derecede bir güvenceden memnun olabilir.

Sosyal bilimler araştırmalarında, iki derece olasılık veya güven derecesi çok iyi bilinmektedir ve sıklıkla kullanılmaktadır.

Bunlardan biri, 0.95 olasılık seviyesidir, yani, örnek tahmininin tolerans veya hata payını sınırlarını aşmayacağı 100'den 95 şans olacaktır ve ikinci seviye, olasılık, yani 0, 99'dur. 100 üzerinden 99 şansta numune tahmininin hedeflenen hata payını aşmayacak olması muhtemeldir.

Hatta güven düzeyi 0.999 olarak belirlenebilir, yani, örnek tahmini, 1000'den 999'luk şansta tolerans sınırlarının ötesinde gerçek değerden (evrenin) sapmayacaktır. Bazı amaçlar için, araştırmacı düşük hedef alabilir ve olasılık seviyesini 0, 67'ye ayarlayın (3 üzerinden 2).

Bir çalışma için çizilen belirli bir örneğin, hata payı içinde olan evrenin bir tahminini vermesi ihtimali, evrenden çizilebilecek örnekler arasındaki varyasyona bağlıdır. Örneklerden korunan değerler gerçek değerden önemli ölçüde sapma eğilimindeyse, izin verilen hata sınırları dahilinde verilen herhangi bir örnek değerin şansı düşüktür.

Standart hata, bir numunenin izin verilen limitler dahilinde kalma şansının ne olduğunu bize söyleyen ölçüdür. Rastgele örneklemede beklenebilecek örnekleme tahminindeki bir varyasyon ölçüsüdür. Rastgele örnekler olasılık yasalarını takip etme eğilimindedir ve örnek tahminler evrenin gerçek değeri etrafında toplanma eğilimindedir.

Bu tahminler çan şeklindeki veya normal bir eğri ile gösterilebilir. Bu eğrinin orta noktası gerçek değeri (evrenin) temsil eder ve bu gerçek değerden rasgele bir örnek-tahminin maksimum değişimi veya sapması standart hatanın yaklaşık üç katıdır.

Bu nedenle standart hata tüm rastgele örnekleme varyasyonunun yaklaşık 1 / 6'sıdır . Bununla birlikte, tüm pratik amaçlar için standart hata, varyasyon aralığının 1 / 4'ü olarak kabul edilir, çünkü aşırı değişiklikler çok nadir görülür.

Olasılık tabloları 100 örnek tahminden 95'inin +2 ve -2 standart hata limitleri dahilinde olması beklenebileceğini göstermektedir. Bunun anlamı, güven veya olasılık seviyemizi 0, 95 olarak belirlediğimizde, sorunumuz standart hatayla rastgele bir örnek çizmek olacaktır, bu da hata payımızın ½ (yarısı) kadardır.

Daha yüksek bir olasılık seviyesi için, standart hataya sahip bir örnek çizmeliyiz, yani hata payının daha küçük bir kısmı.

Örnekler büyüdükçe standart hatanın daha küçük (daha yüksek hassasiyet) olduğuna dikkat edilmelidir. Kesinliği iki katına çıkarmak için, örneklem büyüklüğü 4 ile çarpılmalıdır, yani dört kat arttırılmalıdır; Tiz edebilmek için, örneklem büyüklüğü 9 ile çarpılmalıdır; dört katına, 16 kadar, vb.

Bu sadece, örnekteki vaka sayısının karekökü olarak hassasiyetin arttığı anlamına gelir. İstatistikçiler, çeşitli standart hata sınırlarına giren örnek tahminlerin olasılığını gösteren tablolar hazırlamışlardır.

Bu sınırlar genellikle + (artı) ve - (eksi) olarak belirtilir. Bu tür tablolar, örneğin, rastgele örneklem tahminlerinin% 95'inin +1, 96 ve -1, 96 standart hataların sınırına girdiğini, tahminlerin yaklaşık% 68'inin + 1 ve -1 standart hata ve% 99'un sınırları içinde olduğunu göstermektedir. tahminler +2.57 ve -2.57 standart hataları arasında yer almaktadır.

(1) hata payını ve (2) olasılık veya güven seviyesini tam olarak göz önünde bulundurarak, araştırmacı istenen örneklem büyüklüğünün hesaplanmasına devam edebilir. Mildred Parten, tahmin edilecek istatistiğin yüzde olduğu durumlarda örneklem büyüklüğünü hesaplamak için aşağıdaki formülü vermiştir. Bu açık bir şekilde standart hata formülünün aktarılmış bir varyasyonudur.

Numune büyüklüğü = PC (100 PC) Z 2 / T 2

Yukarıdaki formülde, PC yüzdesinin ön tahmini anlamına gelir (evrenden).

Z, gerekli olasılık seviyesine karşılık gelen (normal olasılık tablosundan) bulunan standart hata birimi sayısı anlamına gelir.

T, tolere edilebilecek hata payını ifade eder (% 5 veya% 2).

Parten, belirli bir güven düzeyinde ve belirli bir marjı veya hatayı veya tolerans sınırını hedefleyen evrenin ortalama değerini tahmin etmek veya tahmin etmek için örneklem büyüklüğünü hesaplamak için aşağıdaki formülü vermiştir.

Örneklem büyüklüğü = (δ + Z / T) 2

8, evrenin standart sapmasının ön tahmini anlamına gelir.

Z, gerekli olasılık veya güven seviyesine karşılık gelen standart hata birimi sayısını ifade eder.

Somut bir örnek alalım ve örneklem büyüklüğünü çalışalım. Bir şehrin belirli bir “orta sınıf” bölgesinde yaşayan ailelerin ortalama yıllık gelirini tahmin etmek istediğimizi varsayalım.

Diyelim ki, hata marjımızı Rs.100 / - olarak belirledik, yani artı veya eksi 100 içindeki örnek tahminin gelir açısından nüfusun gerçek ortalamasına tahammül edeceğiz. Olasılık veya güven düzeyini 0, 95 olarak belirlediğimizi varsayalım.

Ayrıca, birkaç yıl önce yapılan bir ankette, nüfusun (yerelliğin) yıllık geliri açısından standart sapmanın R.500 / - olduğunu tahmin ettiğimizi varsayalım. Z'nin değeri, yani 0, 95 olasılığına karşılık gelen standart hata birimleri 1, 96'dır.

Bu değerleri yukarıda verilen formülde yerine koyarak,

Basit boyutu = (500 × 1.96 / 100) 2

= (9, 8) 2

= 95

Bunun anlamı, 95 vakanın rastgele bir örneğinin (örnek birimler olan aileler), sırasıyla belirlenmiş hata aralığında ve istenen güven ya da olasılık düzeyinde verilen 'evrenin' bir tahminini vermesi gerektiğidir. Rs. 100 / - ve 0.95.

Eğer hata payını sıkılaştırırsak ve onu Rs olarak ayarladıysak. 50 / - - numunedeki vakaların sayısı, yani, numunenin istenen ebadı, önceki hata payı (Rs. 100 / -) için gereken ebattan dört kat daha büyük (yani 380) olacaktır.

Gelir açısından başka bir yerellik daha fazla homojenlik ile karakterize edilir ve bu nedenle, gelir açısından standart sapmanın sadece 100 olduğunu varsayalım, yukarıdaki hata payı için numunenin boyutunun çok daha düşük olacağını varsayalım.

Başka bir deyişle, formülün kullanımı dersi göstermektedir, homojenlik ne kadar büyükse, istenen örnek ne kadar küçükse ve istenen doğruluk o kadar büyükse, gereken örnek büyüklüğü o kadar büyüktür.

Hata marjı ve güven düzeyi ve diğer sayısal olasılık ve örnek boyutları ifadeleri gibi terimlerin tekrar tekrar kullanılması, bir formülle hesaplanan numune büyüklüğünün istenen bir kesinliği garanti edeceği izlenimini yaratma eğiliminde olabilir.

Bununla birlikte, istatistiksel olasılık tablolarında gösterilen ilişkilerin ideal rastgele örneklemede normal beklentileri temsil ettiği unutulmamalıdır. Ancak, gerçek örneklemenin nadiren ideal olduğu kadar, tablolarda ifade edilen ilişkilerin gerçekleşmesi beklenemez.

İdeal örneklemenin genel zorluğu ve nadirliği, tam olarak beklentilere göre olan sonuçlar konusunda kuşku uyandırmalıdır.

Bununla birlikte, bu, araştırmacının, olasılık formülüne dayanarak hesaplanan tam numune boyutunu kullanmaması veya tercih etmemesi gerektiği anlamına gelmez. Aslında, tam olarak yapması gereken şey bu çünkü en iyi bahis. Bununla birlikte, eğer pratik düşünceler uygun olmadığında bu kesin boyutta ısrar etmemelidir.

İstenen numune boyutunu belirleme problemine büyük ölçüde farklı bir yaklaşım 'stabilite testidir. Bu, nispeten küçük alt örnekler için veri toplanmasından ve geri dönüşlerin dağılımına ilişkin çalışan bir kayıt tutmadan oluşur.

Bir noktadan sonra, daha fazla alt numunenin eklenmesi sonuçları önemli ölçüde değiştirmezse, araştırmacı bu ana kadar çizilen toplam numunenin yeterli ve büyüklüğünün yeterli olduğunu kabul edebilir. Ancak, bu prosedür zaman kaybı olarak kabul edilebilir, çünkü önemli bir zaman dilimine yayılmış bir dizi ayrı ankete katılan bir araştırmacının etkisidir.

Bu prosedürün, gerekenden daha fazla programın toplanmasında ekonomik olmadığı, çünkü yaklaşık kararlılık noktasına doğru sivrilmek, eğri bir süre boyunca seviyesini koruyana kadar herhangi bir kesinlikte bulunamayacağı iddia edildi.

Ancak bu, örnek olarak gerekli / asgari sayıda maddeden fazlasını toplayan saygın çalışmaların muhafazakar uygulamalarıyla karşılaştırıldığında ciddi bir sınırlama gibi görünmemektedir.

Bu tür stabilite testinin temel avantajı, ön bilgilere dayanan hesaplamalara bağlı kalmak yerine, basitçe yeterli olduğu gözlemlenen genel numune büyüklüğü birimini arttırmasıdır. Dönüşleri izlemek ve stabilize olduklarında durmak için yapılan deneysel kontrol basit ve inandırıcı görünüyor.

Bu prosedürün temel tehlikesi, toplanan art arda alt örneklemelerin evrene yayılma ihtimalinin bulunmamasından kaynaklanmaktadır. Popülasyonu temsil etmese de sonuçlar stabilize olabilir.

Aslında, alt örnekleme ne kadar az temsili olursa, aynı sonucu elde etmek ve dengeleme görünümünü arttırmak için daha fazla vakanın eklenmesi daha olasıdır. Alt örnek evrenin bir kesiti değilse, yaklaşmakta olan stabilizasyonu gözlemlemek için aşırı duyarlı bir örnek olmayacaktır.

Bu prosedürün temel şartı, büyüyen bir temsili numunenin gözlem için mevcut olması gerektiğidir. Evrendeki yayılmış ardışık alt örneklemelerin toplanmasının masrafları ve zorluğu, bunun temsil edilmesinin muhtemel olmasının ana nedenleridir.

Bununla birlikte, deneysel stabilite testi, alt örnekler uygun şekilde çekilip toplandığında çok etkili olabilir. Bu yöntem, nispeten küçük alanları veya bir kasaba veya şehir gibi bir topluluğu kapsayan görüşme anketleri için en uygun yöntemdir, çünkü o zaman, her bir alt örneği popülasyonun rastgele bir örneği yapmak o kadar zor ya da pahalı değildir.

Stabilite testine kıyasla daha rafine bir ampirik kontrol biçimi, Sıralı Analiz adı verilen nispeten yeni bir gelişmedir. Burada yer alan genel prosedür, numuneye eklemeye devam etmek ve aynı zamanda istenen anlamlılık seviyesini sağlayacak minimum numune biriktirilinceye kadar numunenin anlamlılık testine devam etmektir.