Dağılma ölçüleri

Bu makaleyi okuduktan sonra, sosyal araştırmalarda kullanılan çeşitli dağılım ölçütlerini öğreneceksiniz.

Sosyal araştırmalarda, belirli bir özelliğe göre cevaplayıcılar arasında homojenlik ve heterojenliğin derecesini bilmek istiyoruz. Herhangi bir sosyal veri kümesi, heterojenliği karakterize edebilecek değerlere sahiptir. Sosyal veri kümesi tipik olarak değerlerin heterojenliği ile karakterize edilir.

Aslında, bunların heterojen olmaları veya kendi aralarında farklılık göstermeleri, istatistiklerde temel öneme sahiptir. Merkezi eğilim ölçüleri tipik olarak bir veri kümesinin önemli bir özelliğini tanımlar, ancak bize bu diğer temel özellik hakkında hiçbir şey söylemezler.

Sonuç olarak, verilerin ne ölçüde dağıldığını belirleyen heterojenliği ölçmenin yollarına ihtiyacımız var. Bu açıklamayı sağlayan önlemlere dağılma veya değişkenlik ölçüleri denir. Şekil 18.4'te gösterilen aşağıdaki üç dağılım, istatistiksel verilerin dağılımının ölçülmesinin önemini gösterecektir.

Farklı Büyüklükteki Örneklerin Ortalama Değerlerinin Dağılımı :

Yukarıdaki şekilde üç eğrinin hepsinin aritmetik ortalamasının aynı olduğu görülebilir, ancak eğri A ile gösterilen değerlerin dağılımının eğri B ile gösterilene göre daha az değişkenlik (dağılım) gösterirken, eğri B daha az değişkenliğe sahiptir C eğrisi ile gösterilene kıyasla

Sadece dağılımın merkezi eğilim ölçüsünü göz önüne alırsak, üç eğri arasında önemli bir farkı kaçıracağız. Verilerin düzenini daha iyi anlamak için, dağılımının veya değişkenliğinin ölçüsünü almalıyız, şimdi çeşitli dağılım ölçütlerini göz önünde bulunduruyoruz.

aralık:

Aralık, en yüksek ve en düşük değerler arasındaki fark olarak tanımlanır: Matematiksel,

R (Aralık) = Mn - M L

burada Mn ve Ml en yüksek ve en düşük değeri temsil eder. Dolayısıyla, veri kümesi için: 10, 22, 20, 14 ve 14, aralık, 22 ve 10, yani 12 arasındaki fark olacaktır. Gruplandırılmış veri olması durumunda, aralığı, aşırı uç noktaların orta noktaları arasındaki fark olarak kabul ediyoruz. sınıflar. Bu nedenle, en düşük aralığın orta noktası 150 ve en yüksek olanın 850 olması durumunda, aralık 700 olacaktır.

Dağılım ölçüsünün nadiren kullanılan aralığın tek avantajı, kolayca hesaplanabilmesi ve kolayca anlaşılabilmesidir. Bu avantaja rağmen, genellikle çok kullanışlı bir dağılım ölçüsü değildir; temel dezavantajı, bize iki uç nokta arasındaki ara değerlerin dağılımı hakkında hiçbir şey söylememesidir.

Yarı-Ara-Çeyrek Aralık veya Çeyrek Sapma:

Bir başka dağılım ölçüsü, yaygın olarak Çeyrek Sapma olarak bilinen yarı-çeyrekler arası aralıktır. Çeyrekler, dizi veya değer serisini her biri dağılımdaki öğelerin yüzde 25'ini içeren dört eşit parçaya bölen noktalardır. Çeyrekler daha sonra bu dört bölümün her birinde en yüksek değerlerdir. Çeyrekler arası aralık, birinci ve üçüncü çeyreklerin değerleri arasındaki farktır.

Böylece, Q1 ve Q3'ün birinci ve üçüncü çeyrekleri temsil ettiği durumlarda, yarı çeyrekler arası aralık veya çeyreklik sapma, formül = Q3 –Q1 / 2 ile verilir.

Çeyrek Sapma Hesaplaması:

Çeyrek sapma mutlak bir dağılım ölçüsüdür. Serinin dağılımlarını karşılaştırmak için çeyreklik sapma kullanılacaksa, mutlak ölçüyü çeyreklik sapma katsayısına dönüştürmek gerekir.

Ortalama sapma :

Menzil ve çeyrek sapma ciddi dezavantajlara sahiptir, yani bir serinin sadece iki değeri dikkate alınarak hesaplanır. Dolayısıyla, bu iki dağılım ölçüsü, serinin tüm gözlemlerine dayanmamaktadır. Sonuç olarak, dizinin bileşimi tamamen göz ardı edilir. Bu kusurdan kaçınmak için, serinin merkezi bir değere ilişkin tüm gözlemleri dikkate alınarak dağılım hesaplanabilir.

Dağılımın hesaplanma yöntemine ortalama sapmaların (ortalama sapma) adı verilir. Adından da anlaşılacağı gibi, çeşitli maddelerin merkezi eğilim ölçüsünden sapmalarının aritmetik ortalamasıdır.

İyi bildiğimiz gibi, merkezi bir değerden sapmaların toplamı her zaman sıfır olacaktır. Bu, bir ortalama sapma elde etmek için (merkezi değerlerin ortalaması ya da herhangi biri hakkında), bir şekilde ya da diğerinin olumsuz işaretlerden kurtulması gerektiğini düşündürmektedir. Bu, işaretleri göz ardı ederek ve farklılıkların mutlak değerini alarak yapılır.

Varsayımsal örneğimizde, 12, 14, 15, 16 ve 18 sayısının ortalaması 15'tir. Bu, bu sayılardan 15'inin, işaretleri baştan çıkarmadan ve sonra sonuçları ekleyerek toplamı elde edeceğimiz anlamına gelir. sapma.

Bunu 5'e bölerek elde ederiz:

= 1.6 (burada | d | mutlak sapmaların toplamı anlamına gelir).

Dolayısıyla, ortalamada puanların 1, 6'dan farklı olduğunu söyleyebiliriz.

Gruplandırılmamış tarihte ortalama Sapma hesaplanması (Bireysel Gözlemler):

Sürekli Serilerde ortalama sapma hesaplaması:

Ortalama Sapma Katsayısı :

Serilerin ortalama sapmalarını karşılaştırmak için, ortalama sapma katsayısı veya bağıl ortalama sapma hesaplanır. Bu, ortalama sapmanın, sapmaların hesaplandığı merkezi eğilim ölçüsü ile bölünmesiyle elde edilir. Böylece,

Ortalama katsayısı. Sapma / X

Bu formülü önceki örneğe uygulayarak,

Ortalama Sapma Katsayısı = 148/400 = 0.37

Standart sapma :

Dağılımın en faydalı ve sık kullanılan ölçüsü, ortalamanın standart sapma ya da kök-ortalama kare sapmadır. Standart sapma, ortalama ile ilgili sapmaların karesinin aritmetik ortalamasının karekökü olarak tanımlanır. Sembolik,

σ = √Σd 2 / N

σ (Yunanca Sigma harfi) standart sapmayı, Σd 2 ise ortalama ve N'den ölçülen sapma karelerinin toplamı için ve madde sayısı için.

Bireysel Gözlemler Serisinde Standart Sapmanın Hesaplanması:

Kısayol Yöntemi:

Kesikli Serilerde Standart Sapma Hesabı :

Kesikli bir seride, varsayılan bir ortalamadan sapmalar önce hesaplanır ve madde frekansları ile çarpılır. Sapmalar karelenir ve öğelerin ilgili sıklıkları ile çarpılır. Bu ürünler toplamı ve frekansların toplamına bölünür. Standart sapma aşağıdaki formülle hesaplanır:

Aşağıdaki çizim formülü açıklar:

Sürekli Serilerde Standart Sapma Hesabı :

Sürekli bir seride sınıf aralıkları orta noktaları ile temsil edilir. Bununla birlikte, genellikle sınıf aralıkları eşit büyüklüktedir ve dolayısıyla varsayılan ortalamanın sapmaları sınıf aralıkları birimlerinde ifade edilir. Alternatif olarak, adım sapmalara, sapmaların sınıf aralığının büyüklüğü ile bölünmesiyle ulaşılır.

Bu nedenle, standart sapmanın hesaplanması için formül aşağıdaki gibi yazılmıştır:

burada ortak faktör veya sınıf aralığının büyüklüğü anlamına gelir.

Aşağıdaki örnek bu formülü gösterecektir:

Varyasyon katsayısı:

Standart sapma, mutlak dağılımın ölçüsünü temsil eder. İki veya daha fazla dağılımın nispi dağılımını ölçmek de gereklidir. Standart sapma ortalamasına bağlı olduğunda, göreceli dağılımı ölçer. Karl Pearson, genellikle varyasyon katsayısı olarak bilinen basit bir nispi dağılım ölçüsü çalışmıştır.

Tablo 18.47'deki problem için varyasyon katsayısı: