İstatistikte Kullanılan Teknikler

Bu yazıda bazı istatistik tekniklerden bahsedeceğiz. Tekniklerden bazıları şunlardır: 1. Merkezi Eğilim Ölçüleri 2. Değişkenlik 3. Olasılık 4. Frekans Dağılımı 5. Zaman Serileri.

Merkezi Eğilim Ölçüleri:

Ortalamalar:

Etraftaki gözlem kümesinin etrafında durduğu noktanın konumu hakkında fikir veren herhangi bir istatistiksel ölçü, merkezi eğilim ölçüsü olarak adlandırılır. En sık kullanılan ölçüm, 'Ortalama' veya aritmetik ortalamadır.

İki işçinin bir hafta boyunca günlük kazancı aşağıdaki gibidir:

1. işçi Rs 70, 50, 100, 90, 50 Ortalama kazanç = Rs 76

2. işçi Rs 200, 250, 50, 300, 150 Ortalama kazanç = Rs 190

Dolayısıyla, yukarıdaki örnekten, ikinci bir çalışanın ortalama olarak birinciden daha fazla kazandığı sonucuna varabiliriz. Bir ortalamanın hesaplanmasının amacı - kolayca görülebileceği gibi - gözlem dizisini, bütün gözlemlerin temsilcisi olarak kabul edilen tek bir değerle değiştirmektir. Yukarıda verilen örnekten, aritmetik ortalamanın orta değere yakın bir değer olduğu ve bazı gözlemlerin bazılarının daha küçükken gözlemlerden daha büyük olduğu görülebilir.

Dolayısıyla, bir değişken üzerindeki gözlemlerin aritmetik ortalamasının, gözlemlerin sayısına bölünen gözlemlerin toplamı olarak tanımlandığı söylenebilir.

İlk çalışan için, aritmetik ortalama aşağıdaki gibi hesaplanmıştır:

(Rs 70 + 50 + 100 + 90 + 50) -5 = Rs 76

Geometrik Ortalama (GM) Geometrik Ortalama, bir gözlem grubunun tüm gözlemlerin ürününün ’kökü olarak tanımlanır. Diyelim ki gözlemler x 1, x 2, x 3, …, x n .

GM aşağıdaki gibi hesaplanabilir:

Bu bir log tablosu yardımı ile hesaplanabilir.

Mod:

Mod, en sık meydana gelen değişkenlerin veya gözlemlerin değeri olarak tanımlanır. Örneğin, gözlemler –2, 9, 6, 2, 8, 2, 2, 7, 2 ve 3 ise, modun maksimum sayısı için yani 5 olduğu gibi 2 olduğu görülür. zamanlar.

Medyan:

Medyan, gözlemler artan veya azalan bir düzende düzenlendiğinde, en ortadaki değişkenin değeridir. Değerlerin yarısının ortancadan daha düşük olacağı ve değerlerin yarısının daha büyük olacağı açıktır. Bu nedenle, eğer gözlemler 3, 9, 6, 4, 5, 7 ve 10 ise, o zaman değerleri artan bir sıra 3, 4, 5, 6, 7, 9 ve 10'da düzenleyerek ortanca değerin 4. gözlem ve 6'ya eşittir.

Bununla birlikte, eğer gözlemlerin sayısı eşitse, o zaman en üstte iki değer vardır ve bu iki değerin aritmetik ortalamasını almak gelenekseldir. Örneğin, gözlem 10 yukarıdaki değişkenlerden çıkarılırsa, en ortadaki iki değer 5 ve 6'dır ve ortanca değer 5 + 6 ± 2 = 5.5'tir.

Verileri ve buradaki değişkenlik unsurunu ölçmek ve analiz etmek için diğer önemli istatistiksel araçlar arasında (i) Aralık, (ii) Çeyrek aralıklar arası aralık, (iii) Ortalama mutlak sapma, (iv) Standart sapma, (v ) Frekans dağılımı (hem Simetrik hem de Asimetrik).

Simetrik dağılım, histogramı iki parçaya bölen ve bir kısım diğerinin ayna görüntüsü olan bir simetri çizgisinin varlığı ile karakterize edilir. Ancak, ticaret ve ekonomideki dağılımların çoğu bu tür değildir. Asimetrik dağılımlar, çarpık dağılımlar olarak da bilinir. Eğiklik, simetri eksikliği anlamına gelir ve eğik dağılımlar, histogramın bir tarafında daha uzun bir kuyruk ile karakterize edilir.

Değişkenlik Ölçümü:

Aritmetik ve Geometrik Araçlar veya Medyanlar, iki veya daha fazla popülasyon veya gözlemin karşılaştırılmasında temel teşkil eder. Ancak diğer değişkenlik veya sapma önlemleri de gözlemlerin birbirinden ne kadar farklı olduğunu ifade etmede önemlidir. İstatistiklerde, dağılım değişkenlik veya sapma ile eş anlamlıdır.

Aşağıda, değişkenliğin önemli önlemleri verilmiştir:

aralık:

Bir dizi gözlemin en büyük ve en küçük değerleri arasındaki fark 'aralık' olarak adlandırılır.

Yarı-Ara Çeyrek Aralığı :

Gözlemlerin 2. ve 3. Çeyrek'teki değeri arasındaki farka, yarı çeyrek aralıkları denir. Bu, sayıları az olan gözlemlerin çok düşük ve çok yüksek değerlerinin etkisini ortadan kaldırır.

Ortalama mutlak sapma:

Ortalama mutlak sapma, gözlemlerin gözlemlerin aritmetik ortalamasından farklılaşması anlamına gelir.

Örnek: Gözlemler x 1, x 2 … x n ve aritmetik ortalama x.

Formül:

ve dolayısıyla, ortalama

Fakat ∑ (x 1 - x̅) = 0, x 1, x 2, … .x n'nin değeri ne olursa olsun

Bu nedenle, ∑ (x i - x̅) formülü değişkenlik ölçüsü olarak kullanılamaz. Bu zorluk, işaretler (+ veya -) dikkate alınmadığı takdirde önlenebilir. Bu, x i - x̅ belirli bir sapmanın işareti sadece x i gözleminin x'in solunda mı yoksa sağında mı olduğunu gösterdiğinden ve bunun merkezi noktadan (x) sapmaların hesaplanmasında hiçbir ilgisi olmadığını gösterdiğinden, mantıklıdır. Herhangi bir gözlem.

Standart sapma:

Gözlemlerin aritmetik ortalamalarından (x̅) sapması pozitif (+) veya negatif (-) olabilir. İstatistiklerde, aritmetik ortalamadan sapma işaretleri, sadece merkezi eğilimden (x direction) gözlem yönünü gösterir ve bu nedenle göz ardı edilir. Mutlak değerleri almak yerine sapmaların kareleri aşağıdaki gibi alındığında, x'ten sapma arasındaki negatif (-) işaretlerden de kaçınılabilir.

Değişkenlik ölçüsü orijinal gözlemlerle aynı birimde olması gerektiğinden, standart sapma aşağıdaki formülle hesaplanır:

Bir frekans dağılımı için, x 1 x 2, …, sınıfların orta değerleri olarak x n ve frekanslar olarak f 1 f 2, …, fn olarak, Standart Sapma (SD) aşağıdaki iyileştirme ile hesaplanır. yukarıdaki formül:

Standart Sapma, istatistiklerde değişkenliğin en yaygın kullanılan ölçüsüdür. İstatistiki problemlerde en çok tercih edilen ölçü kılan birçok özelliğe sahiptir.

Örnek:

Beş İşletme Yönetimi öğrencisinin IQ seviyeleri aşağıdaki gibidir:

bu nedenle, Standart Sapma: 13.22

13.22, gözlemlerin kendisiyle aynı birimlerde ifade edilen Standart Sapmadır. 13.22 değeri aynı sayısal skaladaki bir noktadır.

Yukarıdaki standart sapma, 5 kişilik bir nüfusun varyanslarından elde edilmiştir. Bununla birlikte, pratikte, Standart Sapma genellikle popülasyondan hesaplanamaz, çünkü popülasyon o kadar büyük olduğu zaman, genellikle sapmanın hesaplanması amacıyla numune alınır.

Örnek veriler için değişkenlik örnek varyansı ile ölçülür ve standart sapma aşağıdaki formül kullanılarak hesaplanır:

Örnek veriler kullanıldığından, 'n', popülasyon gözlemini ifade eden 'N' yerine örnek boyutunu belirtir.

Olasılık Kavramı:

Genelde günlük yaşamımızda, gelecekteki bazı olayları - bu muhtemelen olacak ', ' bunun olasılığı çok yüksek 'ya da' böyle bir belirsizlikle belli bir belirsizlikle 'tüm olasılıklarda ortaya çıkacak' gibi kelimelerle tahmin ediyoruz. ifadeleri. Bu ifadeler büyük ölçüde özneldir ve geçmişte benzer durumları analiz etme gücümüze bağlıdır. Bir olayın olasılık nosyonunun ve bunun istatistiksel araçlarla ölçülmesinin bazı araçlarının önemi, ticari bankalar için çok büyüktür.

Bir müşteriye borç verirken bankacı, söz konusu müşterinin temerrüt olasılığını bilmek ister; bu, istatistiksel hesaplamaları kullanarak olasılık incelemesi temelinde ölçülür. Olasılığı kesin bir şekilde temel düzeyde tanımlamak oldukça zor olsa da, rastgele deney ve frekans tanımlama teknikleri kullanılarak aynı şeyi tahmin etmek için çaba gösterilebilir.

Rastgele deneme, tüm olası sonuçları bilinen ve aynı koşullar altında tekrarlanabilen bir deney anlamına gelir, ancak sonucun kesin olarak tahmin edilmesi mümkün değildir. Bir malın çeşitli günlerdeki fiyatı, rastgele bir deneyin sonucu olarak düşünülebilir. Sonuçlar genellikle E 1, E 2, E 3 …, E n ile gösterilecek ve sayıca sonlu olduğu varsayılmıştır.

Frekans dağılımı:

Eğer sonuç E1, rastgele deney n kez tekrarlandığında r kez meydana gelirse, E 1'in olasılığı, tekrar sayısı sınırsız bir şekilde arttığından, 'r / n' oranıyla tanımlanır. Bu nedenle, olasılık sınırsız sayıda deney tekrarlandığında, olasılık göreceli frekans sınırı olarak tanımlanır.

Zaman serisi:

Bir değişkenin farklı zaman noktalarında (zamana bağlı olan) bir dizi gözlem, bir zaman serisidir. Bu nedenle, bu tür gözlemler, belirli bir süre boyunca bir miktarın değişikliklerini veya varyasyonlarını verir ve genellikle tarihsel veya kronolojik veriler olarak adlandırılır. Bu veri tipi için değişkenlerden biri 't' ile gösterilen zaman, diğeri zamana bağlı 'Yt' ile gösterilir.

Örneğin, farklı mevsimlerde mahsulün verimi, farklı aylarda çelik üretimi, üç ayda bir çay ihracatı, yılın farklı aylarında dondurma satışı vb. Yukarıda belirtilen tüm örnekler bazı ekonomik veya ticari faaliyetlerle ilgilidir. ve bu değişkenler üzerine yapılan bir dizi gözlem genellikle ekonomik zaman serisi verileri olarak adlandırılır. Zaman serisi verilerine bir başka örnek ise yılın çeşitli günlerinde inç cinsinden yağış miktarıdır.

Bu nedenle, zamana bağlı olan herhangi bir değişkenin zaman serisi verilerini oluşturduğu açıktır. İş dünyası, bankacılar, sanayiciler vb. Gibi ilgili tarafların zaman serilerinden çıkardığı değerli sonuçlar, kararlarını önemli ölçüde etkileyen verilerden trend ölçümüne yol açmaktadır.