4 Yaygın Kullanılan Dağılım Ölçüleri

Bir dizi önlem içindeki değişkenliği (veya dağılım) göstermek için yaygın olarak kullanılan dört önlem vardır. Bunlar: 1. Aralık 2. Çeyrek Sapma 3. Ortalama Sapma 4. Standart Sapma.

Tedbir # 1. Aralık:

Aralık, en yüksek ve en düşük puan arasındaki aralıktır. Aralık, değişkenlerin veya gözlemlerin kendi aralarındaki değişkenlik veya dağınıklık ölçüsüdür ve gözlemlerin bir merkezi değerin etrafına yayılması hakkında bir fikir vermez.

Sembolik olarak R = Hs - Ls. R = Menzil;

Hs 'En yüksek puan' ve Ls en düşük puandır.

Aralık Hesaplaması (Gruplandırılmamış veri):

Örnek 1:

Bir testte on çocuğun puanları:

17, 23, 30, 36, 45, 51, 58, 66, 72, 77 sayılı belgeler.

Örnek 2:

Bir testte on kızın puanları:

48, 49, 51, 52, 55, 57, 50, 59, 61, 62'de tarif edilmektedir.

Örneğin, en yüksek puan 77, en düşük puan 17'dir.

Dolayısıyla, aralık bu iki puan arasındaki farktır:

. . . Aralık = 77 - 17 = 60

Benzer bir şekilde, örneğin II

Aralık = 62 - 48 = 14

Burada, erkeklerin puanlarının geniş ölçüde dağıldığını görüyoruz. Dolayısıyla, erkeklerin puanları çok değişkenlik göstermektedir Ama kızların puanları fazla değişmez (elbette daha az değişir). Dolayısıyla, erkeklerin puanlarının değişkenliği, kızların puanlarının değişkenliğinden daha fazladır.

Aralık Hesaplaması (Gruplandırılmış veri):

Örnek 3:

Aşağıdaki dağılımdaki veri aralığını bulun:

Çözüm:

Bu durumda, 70-79 en yüksek sınıfının üst gerçek sınırı, Hs = 79.5 ve 20-29 en düşük sınıfının en düşük gerçek sınırı, Ls = 19.5'tir.

Bu nedenle, Range R = Hs - Ls

= 79, 5 - 19, 5 = 60, 00

Aralık, değişkenliğin bir göstergesidir. Aralık daha büyük olduğunda grup daha değişkendir. Aralık ne kadar küçük olursa grup o kadar homojen olur. Aralık, puanların (veya önlemlerin) en yaygın “yayılması” veya “saçılması” nın ölçüsüdür. İki veya daha fazla grubun değişkenliğinin kaba bir karşılaştırmasını yapmak istediğimizde, aralığı hesaplayabiliriz.

Yukarıda karşılaştırılan aralık, ham formda veya mutlak bir dağılma ölçüsüdür ve özellikle seri iki farklı birimde olduğunda karşılaştırma amaçları için uygun değildir. Karşılaştırma amacıyla, aralık katsayısı, aralığı en büyük ve en küçük öğelerin toplamına bölerek hesaplanır.

Avantajları:

1. Menzil oldukça kolay hesaplanabilir.

2. En basit dağılım ölçüsüdür.

3. İki veya daha fazla değişkenlik grafiğinin kaba bir karşılaştırmasını yapmak istediğimizde hesaplanır.

Sınırlamalar:

1. Seri, serinin tüm gözlemlerine dayanmamaktadır. Sadece en uç durumları dikkate alır.

2. İki veya daha fazla değişkenlik grubunun sadece kaba bir karşılaştırmasını yapmamıza yardımcı olur.

3. Seri, bir serideki iki aşırı puanı dikkate alır.

Dolayısıyla, N küçük olduğunda veya frekans dağılımında büyük boşluklar olduğunda, değişkenliğin bir ölçüsü olarak aralık oldukça güvenilmezdir.

Örnek 4:

A Grubu'nun Puanları - 3, 5, 8, 11, 20, 22, 27, 33

Burada aralık = 33 - 3 = 30

B Grubu Puanları - 3, 5, 8, 11, 20, 22, 27, 93

Burada aralık = 93 - 3 = 90.

Sadece A grubu ve B grubu içindeki puan serilerini karşılaştırın. A grubunda, tek bir puan 33 (son puan) 93 olarak değiştirilirse, aralık geniş çapta değişir. Bu nedenle, tek bir yüksek skor, menzili düşükten yükseğe alabilir. Bu nedenle, aralık güvenilir bir değişkenlik ölçüsü değildir.

4. Örneklemedeki dalgalanmalardan çok etkilenir. Değeri asla sabit değildir. Normalde öğrencilerin boyu 150 cm ila 180 cm arasında değişen bir sınıfta, yüksekliği 90 cm olan bir cüce kabul edilirse, aralık 90 cm'den 180 cm'ye çıkar.

5. Menzil, seriyi ve dağılımı gerçekten sunmuyor. Asimetrik ve simetrik dağılım aynı aralığa sahip olabilir ancak aynı dağılıma sahip olmayabilir. Sınırlı doğrulukta ve dikkatli kullanılmalıdır.

Bununla birlikte, aralığın kaba bir dağılma ölçütü olduğunu ve kesin ve doğru çalışmalar için tamamen uygun olmadığını göz ardı etmemeliyiz.

Tedbir # 2. Çeyrek Sapma:

Aralık, yüzde 100 vaka içeren ölçüm skalasındaki aralık veya mesafedir. Aralığın sınırlamaları, yalnızca iki uç değere bağımlılığından kaynaklanmaktadır.

Bu iki aşırı değerden bağımsız olan bazı dağılım ölçüleri vardır. Bunlardan en yaygın olanı, belirli bir dağılımdaki vakaların yüzde 50'sini içeren aralığa dayanan dörtlü sapmadır.

Çeyrek sapma, üçüncü çeyrek ile birinci çeyrek arasındaki ölçek mesafesinin yarısı kadardır. Bir dağılımın yarı çeyrekler arası aralığıdır:

Çeyrek sapmayı almadan önce, çeyreklerin ve çeyreklerin anlamını bilmeliyiz.

Örneğin, bir test sonucu 20 puan alır ve bu puanlar azalan bir sırada düzenlenir. Puanların dağılımını dört eşit bölüme ayıralım. Her bölüm bir 'çeyrek' sunacak. Her çeyrekte% 25 (veya N'nin 1 / 4'ü) vakası olacak.

Skorlar azalan düzende sıralanırken,

İlk 5 puan ilk çeyrekte verilecek

Bir sonraki 5 puan 2. çeyrekte olacak

Bir sonraki 5 puan 3. çeyrekte olacak ve

Ve en düşük 5 puan 4. çeyrekte olacak.

Bir dizinin kompozisyonu hakkında daha iyi bir çalışma yapılması için, onu üç, dört, altı, yedi, sekiz, dokuz, on veya yüz parçaya bölmek gerekebilir.

Genellikle, bir seri dört, on veya yüz bölüme ayrılır. Bir öğe, diziyi iki parçaya, dört parçaya (çeyreklere) üç parça, on parçaya (desine) dokuz parça ve yüz parçaya doksan dokuz parçaya (yüzdelik) ayırır.

Dolayısıyla, bir seride üç çeyrek, dokuz deciles ve doksan dokuz yüzdelik var. İkinci çeyrek veya 5. dekil veya 50. yüzde bir medyandır (bkz. Şekil).

Bir serinin ilk yarısını (medyanın değerinden daha düşük değerlerle) iki eşit parçaya bölen öğenin değeri İlk Çeyrek (Q1) veya Alt Çeyrek olarak adlandırılır. Başka bir deyişle Q1, vakaların% 25'inin yattığı bir noktadır. Q 1, 25'inci yüzdeliktir.

İkinci Çeyrek (Mdn) veya Orta Çeyrek ortadır. Başka bir deyişle, puanların% 50'sinin yattığı bir noktadır. Bir ortanca yüzde 50'dir.

Serinin ikinci yarısını (ortanca değerinden daha büyük değerlerle) iki eşit parçaya bölen öğenin değeri Üçüncü Çeyrek (Q3) veya Üst Çeyrek olarak adlandırılır. Başka bir deyişle, Q3 puanların% 75'inin altında yatan bir puandır. Q3, 75. yüzdeliktir.

Not:

Bir öğrenci, çeyrek ve çeyrek arasında açıkça ayırt etmek zorundadır. Çeyrek bir aralıktır; ancak çeyreklik ölçekte bir nokta. Çeyrekler yukarıdan aşağıya doğru numaralandırılmıştır (veya en yüksek puandan en düşük puana kadar), ancak çeyrekler aşağıdan yukarıya doğru numaralandırılmıştır.

Çeyrek Sapma (Q), Üçüncü Çeyrek (Q3) ve Birinci Çeyrek (Q 1 ) arasındaki ölçek mesafesinin yarısı kadardır:

L = Q3'ün yatmakta olduğu ci'nin alt limiti,

3N / 4 = 3/4, N =% 75

F = 'L' altındaki tüm frekansların toplamı,

fq = Q3'ün yattığı ci'nin frekansı ve i = ci'nin boyu veya uzunluğu

L = Q1'in bulunduğu ci'nin alt limiti,

N / 4 = Bir Dördüncü (veya% 25) N,

F = 'L' altındaki tüm frekansların toplamı,

fq = Q1'in dayandığı ci frekansı,

ve i = ci'nin büyüklüğü veya uzunluğu

Çeyrekler arası aralık:

Üçüncü çeyrek ile birinci çeyrek arasındaki aralık, çeyrek arası aralık olarak bilinir. Sembolik olarak çeyrekler arası aralık = Q 3 - Q 1 .

Yarı Bölümler Arası Aralık:

Üçüncü çeyrek ile birinci çeyrek arasındaki mesafenin yarısı kadardır.

Böylece, SI R. = Q3 - Q 1/4

Q veya Quartile Sapma, aksi takdirde yarı çeyrekler arası aralık (veya SIR) olarak bilinir.

Böylece, Q = Q3 - Q1 / 2

Q3 ve Q1 formüllerini medyan formülüyle karşılaştıracağız, aşağıdaki gözlemler açık olacaktır:

ben. Median durumunda N / 2, Q1 için N / 4 ve Q3 için 3N / 4 kullanıyoruz.

ii. Medyan durumunda, medyanın yattığı ci frekansını belirtmek için fm kullanırız; ancak Q1 ve Q3 durumunda, Q1 veya Q3'ün üzerinde bulunduğu cI sıklığını göstermek için fq kullanın.

Q'nun Hesaplanması (Gruplandırılmamış Veriler):

Q hesaplamak için önce Q3 ve Q 1 hesaplamaları gerekir. Q1 ve Q3, medyanı hesapladığımız şekilde hesaplanır.

Tek farklar:

(i) medyan durumunda, aşağıdan% 50 vaka (N / 2) sayıyorduk, fakat

(ii) Q1 durumunda vakaların% 25'ini (veya N / 4) alttan saymalıyız ve

(iii) Q3 durumunda, vakaların% 75'ini (veya 3N / 4) alttan saymalıyız.

Örnek 5:

Aşağıdaki puanların Q'unu öğrenin 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39.

20 puan var.

N =% 25/20/4 = 5

Q1, vakaların% 25'inin altında yatan bir noktadır. Bu örnekte, Q1, 5 vakanın dayandığı bir noktadır. Sipariş edilen verilerin sadece incelenmesinden 24.5'in altında 5 vaka olduğu görülmüştür. Böylece Q 1 = 24, 5

Aynı şekilde, Q3, altındaki boşlukların% 75'inin yattığı bir noktadır.

N'nin% 75'i = 3/4 x 20 = 15

34.5, 15 dava altında

Böylece, Q3 = 34.5.

Simetrik bir dağılımda, medyan Q1 ve Q3'den ölçekte yarı yarıya uzanmaktadır. Bu nedenle, Q1 + Q veya Q3 - Q değeri medyan değerini verir. Ancak, genel olarak, dağılımlar simetrik değildir ve bu nedenle Q1 + Q veya Q3 - Q medyanın değerini vermeyecektir.

Q'nun Hesaplanması (Gruplandırılmış Veriler):

Örnek 6:

Bir testte 36 öğrenci tarafından elde edilen puanlar tabloda gösterilmiştir. Skorların çeyrek sapmasını bulun.

Sütun 1'de Aralık sınıfına girdik, sütun 2'de frekansı aldık ve sütun 3'te alttan başlayan kümülatif frekanslar yazıldı.

Burada N = 36, yani Q1 için N / 4 = 36/4 = 9 vakayı almalı ve Q3 için 3N / 4 = 3 x 36/4 = 27 vakayı almalıyız. 3. sütuna bakıldığında, cf = 9, gerçek sınırı 54.5 - 59.5 olan ci 55 - 59'a dahil edilecektir. Q1 54.5 - 59.5 aralığında yer alır.

Q1'in değeri şu şekilde hesaplanır:

Q3'ü hesaplamak için cf = 27, gerçek sınırları 64 olan ci 65 - 69'a dahil edilecektir. 5 - 69.5. Böylece, Q3 64.5 - 69.5 aralığında yer alır ve değeri şu şekilde hesaplanır:

Çeyrek Sapma Yorumlanması:

Çeyrek sapmaların değeri yorumlanırken, Q ile birlikte Ortanca, Q 1 ve Q 3 değerlerine sahip olmak daha iyidir. Q değeri daha fazlaysa, dağılım daha fazla olacaktır, ancak değer ölçeğe bağlıdır. Ölçüm İki Q değeri yalnızca kullanılan ölçek aynı olduğunda karşılaştırılmalıdır. 20 puanın puanları için ölçülen Q, 50 puanın puanları ile doğrudan Q ile karşılaştırılamaz.

Medyan ve Q biliniyorsa, vakaların% 50'sinin 'Median - Q' ve 'Median + Q' arasında olduğunu söyleyebiliriz. Bunlar vakaların% 50'sidir. Burada, vakaların sadece% 50'sinin aralığını biliyoruz. Davaların% 25'inin ve davaların% 25'inin nasıl dağıldığını bu önlemle bilmiyoruz.

Bazen aşırı durumlar veya değerler bilinmemektedir, bu durumda bizim için mevcut tek alternatif, orta, dörtlü sapmayı merkezi, eğilim ve dağılımın ölçüsü olarak hesaplamaktır. Ortanca ve dörtlükler sayesinde dağılımın simetrisi veya eğriliği hakkında çıkarımlar yapabiliriz. Bu nedenle, simetrik ve çarpık dağılımlar hakkında biraz fikir edelim.

Simetrik ve Eğik Dağılımlar:

Frekanslar merkezi eğilim ölçüsü etrafına simetrik olarak dağıtıldığında bir dağılımın simetrik olduğu söylenir. Başka bir deyişle, merkezi eğilim ölçüsünün iki tarafındaki eşit mesafedeki değerler eşit frekanslara sahipse dağılımın simetrik olduğunu söyleyebiliriz.

Örnek 7:

Verilen dağılımın simetrik olup olmadığını bulun.

Burada ortalamanın yanı sıra, ortalama eğilim ölçüsü 5'tir. 5'in iki tarafındaki değerlerin frekanslarını karşılaştırmaya başlarsak, 4 ve 6, 3 ve 7, 2 ve 8, 1 değerlerini buluruz. ve 9, 0 ve 10 aynı sayıda frekansa sahiptir. Bu yüzden dağılım mükemmel simetriktir.

Simetrik bir dağılımda, ortalama ve ortanca eşittir ve ortanca iki çeyreğe eşit bir mesafede uzanır, yani Q3 - Ortanca = Ortanca - Q1.

Eğer bir dağılım simetrik değilse, simetriden ayrılma eğriliğini ifade eder. Eğiklik, eğrinin diğerine göre bir tarafa doğru döndüğünü gösterir. Böylece eğrinin bir tarafında daha uzun bir kuyruk olacaktır.

Uzun kuyruk sağ tarafta ise çarpıklık pozitif, uzun kuyruk sol tarafta ise negatif olduğu söylenir.

Aşağıdaki şekillerde, pozitif olarak bükülmüş ve negatif olarak çarpık bir eğrinin görünümü gösterilmektedir:

Q 3 - Mdn> Mdn - Q 1 + çarpıklığını gösterir

Q 3 - Mdn <Mdn - Q 1 gösterir - çarpıklık

Q 3 - Mdn = Mdn - Q 1 sıfır çarpıklığı gösterir

Q'nun yararları:

1. Genel çeşitliliğe göre değişkenliğin daha temsili ve güvenilir bir ölçüsüdür.

2. Dağılımın ortasında iyi bir puan yoğunluğu indeksidir.

3. Çeyreklikler bir dağılımın çarpıklığını belirtmek için kullanışlıdır.

4. Medyan gibi, Q da açık uçlu dağıtımlara uygulanabilir.

5. Medyan, merkezi eğilimin bir ölçüsü olarak tercih edilirken, çeyreklik sapma, dağılımın ölçüsü olarak tercih edilir.

Q sınırlamaları:

Bununla birlikte, medyan gibi, dörtlü sapma, dağılımın tüm değerlerini göz önünde bulundurmadığından cebirsel işleme uygun değildir.

2. Sadece üçüncü ve ilk çeyreği hesaplar ve aralık hakkında bilgi verir. Q'dan, puanların merkezi değerden nasıl dağıldığına dair gerçek bir resim elde edemiyoruz. Bu 'Q' puanların oluşumu hakkında bize herhangi bir fikir vermez. İki dizinin 'Q' değeri eşit olabilir, ancak dizilim kompozisyonda oldukça farklı olabilir.

3. Kabaca dağılma fikri verir.

4. Üçüncü çeyreğin üzerindeki puanları ve ilk çeyreğin altındaki puanları dikkate almaz. Bu basitçe bize dağıtımın% 50'sini anlatıyor.

Q kullanımları:

1. Medyan, merkezi bir eğilim ölçüsü olduğunda;

2. Dağıtım her iki ucunda da tamamlanamadığında;

3. Orantısız şekilde SD'yi etkileyebilecek dağınık veya aşırı puan olduğunda;

4. Medyanın etrafındaki konsantrasyon - vakaların orta% 50'si birincil ilgi alanıdır.

Çeyrek Sapma Katsayısı:

Çeyrek Sapma mutlak bir dağılım ölçüsüdür ve göreceli yapmak için 'çeyrek sapma katsayısını' hesaplarız. Katsayı, çeyrek sapmanın çeyreklerin ortalamasına bölünmesi ile hesaplanır.

Tarafından verilir:

Çeyrek sapma katsayısı = Q 3 - Q 1 / Q 3 + Q 1

Q3 ve Q1'in sırasıyla üst ve alt çeyrekleri ifade ettiği durumlarda.

Ölçüm # 3. Ortalama Sapma (AD) veya Ortalama Sapma (MD):

Zaten tartıştığımız gibi 'Q' kabaca bize değişkenlik hakkında fikir veriyor. İki seri aralığı aynı olabilir veya iki serinin dörtlü sapması aynı olabilir, ancak iki seri birbirinden farklı olabilir. Ne aralık ne de 'Q' dizinin kompozisyonundan bahsetmiyor. Bu iki önlem bireysel puanları dikkate almamaktadır.

Ortalama sapma yöntemi veya 'ortalama sapma', bazen adlandırıldığı gibi, her iki yöntemin de ciddi bir eksikliğini gidermeye meyillidir (Range ve 'Q'). Ortalama sapma aynı zamanda ilk dağılma momenti olarak da adlandırılır ve bir serideki tüm öğelere dayanır.

Ortalama sapma, tüm sapmaların pozitif olduğu düşünülen bir miktar merkezi eğilim ölçüsünden (ortalama, ortanca veya mod) hesaplanan bir serinin sapmalarının aritmetik ortalamasıdır. Başka bir deyişle, tüm değerlerin aritmetik ortalamanın sapma ortalaması, ortalama sapma veya ortalama sapma olarak bilinir. (Genellikle, sapma dağılımın ortalamasından alınır.)

∑ toplamın toplamı;

X, puandır; M, ortalamadır; N toplam puan sayısıdır.

Ve 'd', bireysel puanların ortalamadan sapması anlamına gelir.

Ortalama Sapma Hesabı (Gruplandırılmamış veri):

Örnek 8:

Aşağıdaki değişken grubu için ortalama sapma bulun:

X = 55, 45, 39, 41, 40, 48, 42, 53, 41, 56

Çözüm:

Ortalama sapmayı bulmak için ilk önce verilen gözlem seti için ortalamayı hesaplıyoruz.

Sapmalar ve mutlak sapmalar Tablo 4.2'de verilmiştir:

Örnek 9:

Aşağıda verilen puanlar için ortalama sapmayı bulun:

25, 36, 18, 29, 30, 41, 49, 26, 16, 27

Yukarıdaki puanların ortalaması 29.7 olarak bulundu.

Ortalama sapmayı hesaplamak için:

Not:

Cebir uygularsanız, ∑ (X - M) 'in sıfır olduğunu görebilirsiniz.

Ortalama Sapma Hesabı (gruplanmış veri):

Örnek 10:

Aşağıdaki frekans dağılımı için ortalama sapmayı bulun:

Burada, sütun 1'de ci'leri, sütun 2'ye, karşılık gelen frekansları sütunlara, sütun 3'e, 'X' ile gösterilen ci'lerin orta noktalarını sütun 4'e, X'in işaret ettiği ci'lerin frekans ve orta noktalarının çarpımını, 5. sütuna yazıyoruz, ci'nin orta noktalarının mutlak sapmalarını | d | ve sütun 6'da, | fd | ile gösterilen mutlak sapmaların ve frekansların ürününü yazıyoruz.

Ortalama sapmanın faydaları:

1. Ortalama sapma, verilen bir dağılımdaki tüm değerleri dikkate alan en basit dağılım ölçüsüdür.

2. İstatistik konusunda uzman olmayan bir kişi tarafından bile kolayca anlaşılabilir.

3. Aşırı eşyaların değerinden çok fazla etkilenmez.

4. Bireysel puanların ortalamadan sapmalarının ortalamasıdır.

Sınırlamalar:

1. Ortalama sapma, sapmaların cebirsel işaretlerini dikkate almaz ve bu nedenle daha fazla matematiksel işlem yapamayabilir. Bu nedenle, yalnızca tanımlayıcı bir değişkenlik ölçütü olarak kullanılır.

2. Aslında, MD ortak kullanımda değildir. Modern istatistiklerde nadiren kullanılır ve genel sapma standart sapma ile incelenir.

MD Kullanımları:

1. Tüm sapmaların boyutlarına göre tartılması istendiğinde.

2. Tedbirlerin ortalamanın her iki tarafına ne kadar yayıldığını bilmek gerektiğinde.

3. Aşırı sapmalar gereğinden fazla standart sapmayı etkiler.

Ortalama Sapmanın Yorumlanması:

Ortalama sapmayı yorumlamak için, ortalama ve vaka sayısı ile birlikte bakmak her zaman daha iyidir. Ortalama gereklidir, çünkü ortalama ve ortalama sapma, aynı ölçüm ölçeğindeki sırasıyla nokta ve mesafedir.

Ortalama olmadan, ortalama sapma, ölçü ölçeği veya ölçü birimi için hiçbir ipucu olmadığı için yorumlanamaz. Davaların sayısı önemlidir, çünkü dağılımın ölçüsü buna bağlıdır. Daha az sayıda vaka için, önlemin daha fazla olması muhtemeldir.

İki örnekte, biz var:

İlk durumda, ortalama sapma ortalamanın neredeyse% 25'i iken ikinci durumda daha azdır. Ancak, ortalama sapma, ilk vakalarda daha az vaka olması nedeniyle daha fazla olabilir. Dolayısıyla yukarıda hesaplanan iki ortalama sapma neredeyse benzer bir dağılıma işaret ediyor.

Tedbir # 4. Standart Sapma veya SD ve Varyans:

Çeşitli dağılım ölçütlerinden en sık kullanılan ölçü "standart sapma" dır. Ayrıca, cebirsel işleme elverişli tek dağılımın ölçüsü olması nedeniyle en önemlisidir.

Burada ayrıca, tüm değerlerin dağılım ortalamasından sapmaları göz önünde bulundurulur. Bu önlem en az dezavantajdan muzdarip ve doğru sonuçlar veriyor.

Maddelerin ortalamadan sapmalarını hesaplarken cebirsel işaretleri ihmal etmenin sakıncalarını ortadan kaldırır. İşaretleri ihmal etmek yerine, sapmaların karesini aldık, böylece hepsini olumlu hale getirdik.

AD'den birkaç açıdan farklıdır:

ben. AD veya MD'yi hesaplarken, işaretleri dikkate almayız; oysa SD'yi bulmakta, ayrı sapmaları karıştırarak işaretlerin zorluğundan kaçınır;

ii. SD hesaplamasında kullanılan kare sapmalar her zaman ortalamadan, asla medyan veya moddan alınmaz.

“Standart sapma veya SD, bireysel puanların kare sapma ortalamasının ortalamanın dağılım ortalamasının kareköküdür”.

Daha açık olmak gerekirse, burada şunu belirtmeliyiz ki, SD hesaplanırken tüm sapmaları ayrı ayrı kare yaptığımızdan. Toplamlarını bulun, toplamları toplam puan sayısına bölün ve ardından kare sapmaların ortalamasının karekökünü bulun.

Bu yüzden SD, aynı zamanda “Ortalamadan ortalama kare sapmalar” anlamına da gelir ve genellikle küçük Yunanca harf σ (sigma) ile gösterilir.

Sembolik olarak, gruplanmamış veriler için standart sapma şöyle tanımlanır:

D = bireysel puanların ortalamadan sapması;

(Bazı yazarlar, bireysel puanların ortalamadan sapması olarak 'x' değerini kullanmaktadır)

∑ = toplamı; N = toplam vaka sayısı.

Ortalama kare sapmalara varyans denir. Veya basit bir deyişle, standart sapma karesine İkinci Dağılma veya Varyans Anı denir.

SD'nin hesaplanması (Gruplanmamış veri):

Gruplanmamış veriler için SD'yi hesaplamanın iki yolu vardır:

(a) Doğrudan yöntem.

(b) Kısa yol yöntemi.

(a) Doğrudan Yöntem:

Aşağıda verilen puanlar için standart sapmayı bulun:

X = 12, 15, 10, 8, 11, 13, 18, 10, 14, 9

Bu yöntem, aşağıdaki adımları içeren SD'yi bulmak için formül (18) kullanır:

Aşama 1:

Verilen verinin aritmetik ortalamasını hesaplayın:

Adım 2:

Sapma değerini d yani X - M değerlerini sütun 2'ye yazınız. Buradaki puanların sapması 12'den itibaren alınacaktır. Şimdi ∑d veya ∑ (X - M) sıfıra eşit olduğunu göreceksiniz. Düşün, neden böyle? Kontrol et. Eğer öyle değilse, hesaplamadaki hatayı bulun ve düzeltin.

Aşama 3:

Sapmaları kareleyin ve d2 değerini her sütuna karşı 3. sütuna yazın. Karelerindeki sapmaların toplamını bulun. ∑d 2 = 84.

Tablo 4.5 SD Hesaplaması:

Gerekli standart sapma 2.9.

4. Adım:

Kare sapmaların ortalamasını hesaplayın ve sonra standart sapma, yani σ değerini elde etmek için pozitif karekökü bulun.

(19) formülünü kullanarak, Varyans σ 2 = ∑d 2 / N = 84/10 = 8.4 olacaktır.

(b) Kısa yol yöntemi:

Vakaların çoğunda, verilen verilerin aritmetik ortalaması kesirli bir değere dönüşür ve daha sonra sapma ve kare alma işlemi SD hesaplanırken sıkıcı ve kireç tüketen hale gelir

Bu gibi durumlarda hesaplamayı kolaylaştırmak için, sapmalar varsayılan bir araçtan alınabilir. SD hesaplaması için ayarlanan kısa yol formülü daha sonra

nerede,

d = Puanın varsayılan ortalamadan sapması, diyelim AM; yani d = (X - AM).

d 2 = Sapma karesi.

∑d = Sapmaların toplamı.

∑d 2 = Kare sapmaların toplamı.

N = puanların veya değişkenlerin sayısı.

Hesaplama prosedürü aşağıdaki örnekte açıklanmıştır:

Örnek 11:

X = 12, 15, 10, 8, 11, 13, 18, 10, 14, 9 numaralı tabloda verilen puanlar için SD'yi bulun. Kısayol yöntemini kullanın.

Çözüm:

Kabul edelim ortalama AM = 11.

Formülde ihtiyaç duyulan sapma ve kareler aşağıdaki tabloda verilmiştir:

Tablodaki değerleri formüle koyarak, SD

Kısa yol yöntemi, önceki örnekte doğrudan yöntem kullanılarak elde ettiğimiz sonuçları veriyor. Ancak kısa yol yöntemi, aritmetik ortalamanın bir tam sayı olmadığı durumlarda hesaplama çalışmasını azaltma eğilimindedir.

SD'nin hesaplanması (Gruplandırılmış veri):

(a) Uzun Yöntem / Doğrudan Yöntem:

Örnek 12:

Aşağıdaki dağıtım için SD'yi bulun:

Burada ayrıca, ilk adım, c.i 'in X' ile işaret ettiği orta noktalarını almak zorunda olduğumuz ortalama M'yi bulmak ve f X. ürününü bulmak. Ortalama ∑ f x '/ N ile verilir. İkinci adım, X 'sınıfı aralıklarının orta noktalarının, yani d ile gösterilen ortalama X'-M'den sapmalarını bulmaktır.

Üçüncü adım, sapmaların karesini almak ve kare sapmaların çarpımını ve karşılık gelen frekansı bulmaktır.

Yukarıdaki problemi çözmek için, cılar sütun 1'e, frekanslar sütun 2'ye, c.'nin orta noktaları, yani X 'sütun 3'e, f X' çarpımı ise sütun 4'e, sapmalara yazılmıştır. X 'in ortalamasından 5 sütununa, kare sapma d2 6 sütununa, f d 2 sütunu 7'ye yazılır,

Aşağıda gösterildiği gibi:

Dolayısıyla, orta noktaların sapmaları 11.1'den alınacaktır.

Böylece, gereken standart sapma 4.74'tir.

(b) Kısa yol yöntemi:

Bazen, doğrudan yöntemde, asıl ortalamadan sapmaların ondalık sayılarla sonuçlandığı ve d2 ve fd 2 değerlerinin hesaplanmasının zor olduğu görülmektedir. Bu sorunu önlemek için standart sapmayı hesaplamak için kısa bir kesim yöntemi uygularız.

Bu yöntemde, gerçek ortalamadan sapmaları almak yerine, uygun bir şekilde seçilmiş varsayılan ortalamadan sapmaları alıyoruz.

Aşağıdaki formül daha sonra SD hesaplamak için kullanılır:

d, kabul edilen ortalamadan sapmadır.

Aşağıdaki adımlar standart sapmanın hesaplanmasında yer alır:

(i) Varsayım ortalamasından AM değişkenlerinin sapmalarını d = (X - AM) olarak almak

(ii) Bu sapmayı fd sütununu almak için karşılık gelen frekanslarla çarpın. Bu sütunun toplamı ∑ fd verir .

ilgili sapma ile fd (d)

(iii) fd 2 sütununu almak için çarpın. Bu sütunun toplamı 2 fd 2 olacaktır .

(iv) SD'yi bulmak için (22) formülünü kullanın.

Örnek 13:

Kısayol yöntemini kullanarak, tablo 4.7'deki verilerin SD'sini bulun.

Çözüm:

Ortalama AM = 10 kabul edelim. SD hesaplamak için gereken diğer hesaplamalar Tablo 4.8'de verilmiştir.

Tablodan değerleri koymak

Varyansı (19) formülünü kullanarak

(c) Adım Sapma Yöntemi:

Bu yöntemde, sütun 1'de ci'leri yazıyoruz; sütun 2'ye frekansları yazıyoruz; sütun 3'e d değerini yazın; burada d = X'-AM / i; 4. sütunda fd'nin ürününü ve 5. sütunda fd 2'nin değerlerini aşağıdaki gibi yazıyoruz:

Burada, Varsayılan Ortalama, CI 9-11'in yani 10'un orta noktasıdır, bu nedenle, d' ler, 10'dan alınmış ve 3'e bölünmüştür, c'nin uzunluğu, adım sapma yönteminde SD formülüdür.

i = c.'nin uzunluğu,

f = frekans;

d = sınıf aralıklarında (i) birimlerdeki Ci'nin orta noktalarının farz edilen ortalamadan (AM) sapmaları,

Tablodan değerleri koymak

Hesaplama prosedürleri aşağıdaki şekilde de ifade edilebilir:

Kombine Standart Sapma ( σ comb ):

İki puan kümesi tek bir lotta birleştirildiğinde, toplam dağılımın σ'sını iki bileşenli dağıtımların σ'larından hesaplamak mümkündür.

Formül:

σ 1, = dağıtım 1'in SD'si

σ 2 = dağıtım 2 SD

d 1 = (M 1 - M tarak )

d 2 = (M 2 - M tarak )

N 1 = Dağıtım 1'deki vaka sayısı.

N 2 = Dağıtım 2'deki vaka sayısı.

Bir örnek, formülün kullanımını gösterecektir.

Örnek 14:

Farz edelim ki, farklı boyutlarda iki sınıf için Başarı Testi'nde ortalamalar ve SD'ler verilmiş ve birleştirilmiş grubun o değerini bulmamız isteniyor.

Veriler aşağıdaki gibidir:

İlk önce onu bulduk

Formül (24) herhangi bir sayıda dağıtıma genişletilebilir. Örneğin, üç dağıtım durumunda, bu

SD'nin Özellikleri:

1. Her değişken değer aynı sabit değere yükseltilirse, dağılımın SD değeri değişmeden kalır:

Bu etkiyi bir örnek düşünerek SD üzerine tartışacağız. Tablo (4.10), 20 öğrencinin aritmetik ortalama puanıyla bir testte 5 öğrencinin orijinal puanlarını göstermektedir.

Her bir orijinal puana sabit bir 5 ekleyerek elde ettiğimiz aynı tabloda yeni puanlar (X ') da verilmektedir. Gruplandırılmamış veriler için formül kullanarak, puanların SD'sinin her iki durumda da aynı kaldığını görüyoruz.

Bu nedenle, her iki durumda da SD'nin değeri aynı kalır.

2. Her değişkenden sabit bir değer çıkarıldığında, yeni dağılımın SD değeri değişmeden kalır:

Öğrenciler ayrıca, her bir puandan bir sabit çıkardığımızda, ortalamanın sabit olarak azaldığını ancak SD'nin aynı olduğunu inceleyebilir. 'D'nin değişmemesinin nedeni budur.

3. Gözlenen her değer sabit bir değer ile çarpılırsa, yeni gözlemlerin SD'si de aynı sabit ile çarpılacaktır:

Orijinal dağılımın her bir skorunu (Tablo 4.10) 5 ile çarpalım.

Böylece, yeni dağılımın SD'si aynı sabit ile çarpılacaktır (burada 5'tir).

4. Gözlenen her değer sabit bir değere bölünürse, yeni gözlemlerin SD'si de aynı sabit ile bölünür. Öğrenciler bir örnekle inceleyebilirler:

Bu nedenle, sonuç olarak, SD menşei değişmesinden bağımsızdır (toplama, çıkarma), fakat ölçek değişikliğine (çarpma, bölme) bağımlıdır.

Göreceli Dağılım Ölçümleri (Değişim Katsayısı):

Dağılım ölçüleri, puanların merkezi değerinin etrafına dağılma derecesi hakkında bir fikir vermektedir. Bu nedenle, aynı merkezi değerlere sahip iki frekans dağılımı, çeşitli dağılım ölçümleri yardımı ile doğrudan karşılaştırılabilir.

Örneğin, bir sınıftaki sınavda erkekler, 1 = 15 ile SD = M1 = 60 ve kızlar score SD 2 = 10 ile SD: 2 kızların puan ortalaması M 2 = 60 ise, daha düşük SD olan kızlar ortalama puanlarına göre puanlamada erkeklerden daha tutarlı.

Eşit olmayan araçlara veya farklı ölçüm birimlerine sahip iki veya daha fazla dağılımın dağınıklığı veya değişkenliği açısından karşılaştırılacağı durumlar vardır. Bu tür karşılaştırmalar yapmak için, göreceli dağılım katsayıları veya varyasyon katsayısı (CV) kullanıyoruz.

Formül:

(Varyasyon katsayısı veya bağıl değişkenlik katsayısı)

V, σ'nın test ortalamasının yüzdesini verir. Bu nedenle ölçüm birimlerinden bağımsız olan bir orandır.

V, yorumunda belirli belirsizlikler nedeniyle kullanımı sınırlıdır. Oran skalaları ile kullanıldığında savunulabilir - birimlerin eşit olduğu ve gerçek bir sıfır veya referans noktası olduğu skalalar.

Örneğin V, fiziksel ölçeklerle tereddüt etmeden kullanılabilir - doğrusal büyüklükler, ağırlık ve zaman ile ilgili olanlar.

V kullanımında oran skalasında iki durum ortaya çıkmaktadır:

(1) Birimler farklı olduğunda ve

(2) M eşit olmadığı zaman, ölçeğin birimleri aynıdır.

1. Üniteler birbirinden farklı olduğunda:

Örnek 15:

10 yaşında bir erkek çocuk ortalama boyu 137 cm. 6.2 cm o ile. Aynı erkek grupta ortalama ağırlık 30 kg'dır. 3, 5 kg ile. Hangi özellikte grup daha değişkendir?

Çözüm:

Açıkçası, santimetre ve kilogramları doğrudan karşılaştıramıyoruz, ancak iki dağılımın göreceli değişkenliğini V cinsinden karşılaştırabiliriz.

Bu örnekte, iki grup yalnızca ortalama olarak değil, aynı zamanda cm olan ölçüm birimlerinde de farklılık gösterir. ilk durumda ve kg. saniyede. Böyle bir durumda grupların değişkenliğini karşılaştırmak için varyasyon katsayısı kullanılabilir.

Böylece hesaplıyoruz:

Dolayısıyla, yukarıdaki hesaplamadan itibaren, bu erkeklerin ağırlıkça yaklaşık iki katı değişken (11.67 / 4.53 = 2.58) olduğu görülüyor.

2. Araçlar eşit olmadığında, ancak ölçek birimleri aynı olduğunda :

Bir grup erkek ve bir grup erkek için yapılan bir teste ilişkin şu verilere sahip olduğumuzu varsayalım:

Ardından, karşılaştırın:

(i) Testte iki grubun performansı.

(ii) İki gruptaki puanların değişkenliği.

Çözüm:

(i) Erkek gruptaki ortalama puan erkeklerden daha yüksek olduğundan, erkek grup testin daha iyi yapılmasını sağlamıştır.

(ii) İki grubun puanlar arasındaki değişkenlik açısından karşılaştırılmasında varyasyon katsayısı erkeklerin V = 26, 67 ve erkeklerin V = 38, 46 olarak hesaplanmıştır.

Bu nedenle, erkek gruplarında puanların değişkenliği daha fazladır. Daha az özgeçmişe sahip olan erkek grubundaki öğrenciler, erkek gruplarına göre ortalama puanlarını puanlama konusunda daha tutarlıdır.

SD ve gözlemlerin yayılması:

Simetrik (normal) dağılımda,

(i) Ortalama ± 1 SD, skorların% 68, 26'sını kapsamaktadır.

Ortalama ± 2 SD, skorların% 95.44'ünü kapsar.

Ortalama ± 3 SD, skorların% 99.73'ünü kapsar.

(ii) Büyük numunelerde (N = 500), Range SD'nin yaklaşık 6 katıdır.

N değeri yaklaşık 100 ise, aralık SD'nin yaklaşık 5 katıdır.

N değeri yaklaşık 50 ise, Aralık SD'nin yaklaşık 4, 5 katıdır.

N, yaklaşık 20 ise, Aralık SD'nin yaklaşık 3.7 katıdır.

Standart sapmanın yorumu:

Standart sapma, skorların dağılımının niteliğini karakterize eder. Skorlar daha yaygın olduğunda, SD daha fazladır ve skorlar daha az dağılmış ise SD daha azdır. Dağılım ölçüsünün değerini yorumlamak için, ' σ ' değerinin ne kadar büyük olduğuna o kadar dağınık olanın puan ortalamaları olduğunu anlamalıyız.

Ortalama sapma durumunda olduğu gibi, standart sapmanın yorumu dikkate almak için M ve N değerini gerektirir.

Aşağıdaki örneklerde gerekli σ, ortalama ve N değerleri aşağıdaki gibi verilmiştir:

Burada, dağılım, örnek 1 ile karşılaştırıldığında, örnek 2'de daha fazladır. Değerlerin, örnek 1'deki değerlerle karşılaştırıldığında, örnek 2'de daha dağınık olduğu anlamına gelir.

SD'nin yararları:

1. SD katı bir şekilde tanımlanmıştır ve değeri her zaman kesindir.

2. En yaygın kullanılan ve önemli dağılım ölçüsüdür. İstatistiklerde merkezi bir konuma sahiptir.

3. Ortalama sapma gibi, dağılımın tüm değerlerine dayanır.

4. Burada, sapma belirtileri göz ardı edilmez, bunun yerine sapmaların her birini kareler alarak yok edilirler.

5. Cebirsel işleme elverişli olduğu ve korelasyonel çalışmalarda ve diğer istatistiksel analizlerde kullanıldığı için değişkenliğin ana ölçüsüdür.

6. Örnekleme dalgalanmalarından daha az etkilenir.

7. Değişkenliğin güvenilir ve en doğru ölçüsüdür. SD her zaman merkezi eğilimin en güvenilir ölçüsü olan ortalama ile gider.

8. Bir testten diğerine karşılaştırılabilir anlama sahip standart bir ölçü birimi sağlar. Ayrıca, normal eğri doğrudan SD ile ilişkilidir.

Sınırlamalar:

1. Hesaplanması kolay değildir ve kolay anlaşılmazdır.

2. Aşırı eşyalara daha fazla ağırlık verir ve ortalığa yakın olanlara daha az ağırlık verir. Aşırı bir puanın sapması kare olduğunda, daha büyük bir değere yol açar.

SD'nin Kullanımı:

Standart sapma kullanılır:

(i) En doğru, güvenilir ve kararlı değişkenlik ölçüsü istendiğinde.

(ii) Ortalamadan aşırı sapmalara daha fazla ağırlık verileceği zaman.

(iii) Korelasyon katsayısı ve diğer istatistikler daha sonra hesaplandığında.

(iv) Güvenilirlik ölçüleri hesaplandığında.

(v) Skorlar normal eğriye referansla doğru bir şekilde yorumlandığında.

(vi) Standart puanların hesaplanacağı zaman.

(vii) İki istatistik arasındaki farkın önemini test etmek istediğimizde.

(viii) Varyasyon katsayısı, varyans vb. hesaplandığında.