Korelasyon: Anlamı, Çeşitleri ve Hesaplanması

Bu makaleyi okuduktan sonra öğreneceksiniz: - 1. Korelasyon Tanımları 2. Korelasyonun Anlamı 3. İhtiyaç 4. Tipler 5. Bilgi İşlem Yöntemleri.

Korelasyon Tanımları:

Bir değişkendeki değişime diğer değişkendeki bir değişiklik eşlik ediyor gibi görünüyorsa, iki değişkenin ilişkilendirildiği söylenir ve bu karşılıklı bağımlılığa korelasyon veya eş değişkenlik denir.

Kısacası, iki değişken arasındaki eşzamanlı varyasyon eğilimine korelasyon veya ortak değişkenlik denir. Örneğin, bir grup öğrencinin yüksekliği ve ağırlığı arasında bir ilişki olabilir, iki farklı konudaki öğrencilerin puanlarının aralarında karşılıklı bağımlılık veya ilişkide olması beklenir.

İki değişken arasındaki ilişki veya değişkenliğin derecesini ölçmek, korelasyon analizinin konusudur. Dolayısıyla korelasyon, iki değişken arasındaki ilişki veya “beraberlik” veya yazışma anlamına gelir.

İstatistiklerde korelasyon, iki dizi ölçüm (veya puan) arasındaki yazışma veya orantılılığı belirleme yöntemidir. Basitçe söylemek gerekirse, korelasyon bir değişkenin diğeri ile ilişkisini gösterir.

Korelasyonun Anlamı:

İki değişken arasındaki ilişki derecesini veya ilişkinin miktarını nicel olarak ölçmek için bir ilişki indeksi kullanılır ve korelasyonun ortak etkinliği olarak adlandırılır.

İlişkili eşgüdüm, bize iki değişkenin ne ölçüde ilişkili olduğunu ve bir değişkende varyasyonların diğerinde varyasyonlarla ne ölçüde değiştiğini söyleyen sayısal bir endekstir. Korelasyonun ortak etkinliği her zaman r veya ρ (Rho) ile sembolize edilir.

'R' kavramı, eş zamanlı etkin ürün moment korelasyonu veya Karl Pearson Korelasyon Katsayısı olarak bilinir. 'Ρ' (Rho) sembolü Sıra Fark Korelasyon Katsayısı veya spearman'ın Sıra Korelasyon Katsayısı olarak bilinir.

' R ' boyutu, iki değişken arasındaki korelasyon gemisinin miktarını (veya derecesini veya derecesini) gösterir. Eğer korelasyon pozitifse, ' r ' değeri + ve 'nin korelasyonu negatif ise, V'nin değeri negatiftir. Dolayısıyla, katsayı belirtileri ilişkinin türünü gösterir. V'nin değeri +1 ila -1 arasında değişmektedir.

Korelasyon, mükemmel pozitif korelasyon ile mükemmel negatif korelasyon arasında değişebilir. Ölçeğin üstü mükemmel pozitif korelasyonu gösterecek ve + 1'den başlayacak ve daha sonra sıfırdan geçerek tüm korelasyonun olmadığını gösterir.

Ölçeğin dibi -1 ile bitecek ve mükemmel negatif korelasyonu gösterecektir. Böylelikle korelasyonun sayısal ölçümü +1 ile -1 arasında gerçekleşen ölçekle sağlanır.

[NB — Korelasyon katsayısı yüzdedir, sayıdır. Genellikle iki ondalık basamağa kadar yuvarlanır].

Korelasyon İhtiyacı:

Korelasyon bir yapıya anlam kazandırır. Temel psiko-eğitimsel araştırma için korelasyonel analiz esastır. Aslında, temel ve uygulamalı psikolojik araştırmaların çoğu, doğa ile korelasyonludur.

Korelasyon analizi için gereklidir:

(i) Psikolojik ve eğitimsel testlerin özelliklerini bulma (güvenilirlik, geçerlilik, madde analizi vb.).

(ii) Bazı verilerin hipotez ile tutarlı olup olmadığını test etmek.

(iii) Bir değişkeni diğerinin bilgisi temelinde tahmin etmek.

(iv) Psikolojik ve eğitim modelleri ve teorileri oluşturmak.

(v) Verilerin öncelikli yorumlanması için değişkenlerin / önlemlerin gruplanması.

(vi) Çok değişkenli istatistiksel testler yapmak (Hoteling's T 2 ; MANOVA, MANCOVA, Discriminant analizi, Faktör Analizi).

(vii) Değişkenlerin izolasyon etkisi.

Korelasyon Türleri:

İki değişkenli bir dağılımda, korelasyon şöyle olabilir:

1. Olumlu, Olumsuz ve Sıfır Korelasyon; ve

2. Doğrusal veya Eğrisel (Doğrusal olmayan).

1. Olumlu, Olumsuz ya da Sıfır Korelasyonu:

Bir değişkendeki (X) artış, diğer değişkendeki (Y) ilgili bir artış izlerse; korelasyonun pozitif korelasyon olduğu söylenir. Olumlu korelasyonlar 0 ile +1 arasındadır; üst sınır yani + 1, mükemmel pozitif korelasyon katsayısıdır.

Mükemmel pozitif korelasyon, bir değişkendeki her birim artış için diğerinde oransal artış olduğunu belirtir. Örneğin “Isı” ve “Sıcaklık” mükemmel bir pozitif korelasyona sahiptir.

Öte yandan, bir değişkendeki (X) artışın diğer değişkende (Y) ilgili bir düşüşe yol açması durumunda korelasyonun negatif korelasyon olduğu söylenir.

Negatif korelasyon 0 ile - 1 arasında değişmektedir; Mükemmel negatif korelasyon veren alt limit. Mükemmel negatif korelasyon, bir değişkendeki her birim artış için diğerinde orantılı birim azalma olduğunu gösterir.

Sıfır korelasyonu, X ve Y değişkenleri arasında ilişki olmadığı anlamına gelir; yani bir değişkendeki (X) değişiklik, diğer değişkendeki (Y) değişiklik ile ilişkili değildir. Örneğin, vücut ağırlığı ve zekası, ayakkabı büyüklüğü ve aylık maaş; vb. Sıfır korelasyon - 1 - + 1 aralığının orta noktasıdır.

2. Doğrusal veya Eğrisel Korelasyonu:

Doğrusal korelasyon, iki değişken arasındaki değişimin aynı yönde veya zıt yönde oranıdır ve bir değişkenin diğer değişkene göre grafiksel gösterimi düz çizgidir.

Başka bir durum düşünün. Birincisi, bir değişkenin artmasıyla, ikinci değişken bir noktaya kadar orantılı olarak artar; bundan sonra birinci değişkende bir artış ile ikinci değişken azalmaya başlar.

İki değişkenin grafiksel gösterimi eğri bir çizgi olacaktır. İki değişken arasındaki böyle bir ilişki, eğrisel korelasyon olarak adlandırılır.

Eş-Verimli Korelasyon Hesaplama Yöntemleri:

İki değişkenli dağılımın gruplandırılmamış verilerinin kolaylığı için, korelasyonun ortak etkinliğinin değerini hesaplamak için aşağıdaki üç yöntem kullanılır:

1. Dağılım diyagramı yöntemi.

2. Pearson Ürün Momenti Korelasyonun Eş-Verimliliği.

3. Spearman's Rank Order Correlation Ortak Çalışması.

1. Dağılım Şeması Yöntemi:

Dağılım diyagramı veya nokta diyagramı, iki değişken arasındaki korelasyon hakkında kesin sonuçlar çıkarmak için kullanılan bir grafik cihazdır.

Bir dağılım diyagramı hazırlarken, gözlemlenen gözlem çiftleri yatay eksen boyunca X değişkeninde ve Y ekseni boyunca dikey eksende Y değişkeninde ölçümler alarak bir grafik kağıdına noktalar tarafından çizilir.

Bu noktaların grafiğe yerleştirilmesi, değişkende aynı veya zıt yönlerde değişip değişmediklerine dair değişikliği göstermektedir. Çok kolay, basit ama kaba bir hesaplama korelasyonudur.

İki dizi için uygun ölçekler alınarak frekanslar veya noktalar grafik üzerinde çizilir. Çizilen noktalar derecesine göre daha büyük veya daha küçük genişlikte bir bantta yoğunlaşma eğiliminde olacaktır. 'En uygun çizgi' serbest el ile çizilir ve yönü korelasyonun niteliğini gösterir. Scatter diyagramları, örnek olarak, çeşitli korelasyon derecelerini gösteren Şekil 5.1 ve Şekil 5.2'de gösterilmiştir.

Çizgi yukarı doğru hareket ederse ve bu yukarı doğru hareket soldan sağa ise pozitif korelasyon gösterecektir. Benzer şekilde, çizgiler aşağı doğru hareket ederse ve yönü soldan sağa ise, negatif korelasyon gösterecektir.

Eğim derecesi, korelasyon derecesini gösterecektir. Eğer çizilen noktalar geniş bir şekilde dağılmışsa korelasyonun olmadığını gösterecektir. Bu yöntem basitçe korelasyonun pozitif veya negatif olduğu gerçeğini açıklar.

2. Pearson Ürün Momenti Korelasyonun Eş-Verimli:

Korelasyon katsayısı olan r, Galon ve Bravais'in daha önceki çalışmalarını takiben ürün momenti yöntemini geliştiren Profesör Karl Pearson'dan sonra genellikle “Pearson r” olarak adlandırılır.

Oran olarak korelasyon katsayısı:

Ürün-moment korelasyon katsayısı, esas olarak, bir değişkendeki değişikliklerin eşlik ettiği veya ikinci değişkendeki değişikliklere bağlı olan ifadeyi ifade eden oran olarak düşünülebilir.

Bir örnek olarak, beş üniversite öğrencisinin eşleştirilmiş yükseklik ve ağırlıklarını veren aşağıdaki basit örneği düşünün:

Ortalama yükseklik 69 inç, ortalama ağırlık 170 pound ve o 2.24 inç ve o sırasıyla 13.69 pound. Sütun (4) 'te her öğrencinin boyunun ortalama yükseklikten sapması (x) ve sütun (5)' te her öğrencinin ağırlığının ortalama ağırlıktan sapması verilmiştir. (6) sütununda yer alan bu eşleştirilmiş sapmaların (xy) ürünü, bireysel yükseklikler ve ağırlıklar arasındaki anlaşmanın bir ölçüsüdür. Xy sütununun toplamı ne kadar büyük olursa yazışma derecesi de o kadar yüksek olur. Yukarıdaki örnekte ∑xy / N değeri 55/5 veya 11'dir. Mükemmel uyum, yani r = ± 1.00 olduğunda ∑ xy / N değeri maksimum limiti aşıyor.

Böylece, ∑ xy / N, x ve y arasında uygun bir ilişki ölçüsü vermez. Bunun nedeni, böyle bir ortalamanın, boy ve ağırlığın ifade edildiği birimlerden bağımsız olmadığı için sabit bir ölçü olmamasıdır.

Sonuç olarak, bu oran inç ve pound yerine santimetre ve kilogram kullanılırsa değişecektir. Birimlerdeki farklılıkların sorunlarından kaçınmanın bir yolu, her sapmayı bir σ skoru veya standart skor veya Z skoru olarak ifade etmek, yani her x ve y'yi kendi σ'una bölmektir.

Her x ve y sapması daha sonra bir oran olarak ifade edilir ve test ünitelerinden bağımsız olarak saf bir sayıdır. Σ puan sütununun (9) toplamının N'ye bölünmesiyle, ilişkinin kararlı bir ifadesi olan bir oran elde edilir. Bu oran “ürün momentu” korelasyon katsayısıdır. Örneğimizde, .36 değeri, bu küçük örnekte boy ve kilo arasında oldukça yüksek bir pozitif korelasyon olduğunu gösterir.

Öğrenci, oranımızın veya katsayımızın, ilgili X ve Y ölçümlerinin σ puanlarının ortalama ürünü olduğuna dikkat etmelidir.

R xy'nin doğası:

(i) r xy bir ürün momentidir r

(ii) rxy, bir orandır, = rxy .

(iii) rxy + - veya - 1.00 sınırlarıyla sınırlandırılabilir veya sınırlandırılabilir.

(iv) r xy, aritmetik bir ortalama olarak kabul edilebilir (r xy, standart skor ürünlerinin ortalamasıdır).

(v) r xy, X ya da Y ya da her ikisindeki puanların doğrusal dönüşümünden etkilenmez.

(vi) Değişkenler standart puan formunda olduğunda, r, bir değişkenin bir değişkeni, diğer değişkenin değişmesiyle ilişkili ortalama değişimin bir ölçüsünü verir.

(vii) r xy = √b yx b xy ki burada b yx = X üzerinde Y regresyon katsayısı, b xy = X üzerinde X regresyon katsayısı r xy = regresyon çizgilerinin eğimlerinin karekökü.

(Viii) r xy, araçların büyüklüğünden etkilenmez (puanlar her zaman görecelidir).

(İx) Değişkenlerden biri S 2 x veya S 2 Y = 0 değişken değilse r xy hesaplanamaz.

(x) 60'ın r xy'si, r xy = - .60 ile aynı büyüklükte bir ilişki ifade eder. İşareti, ilişkinin yönünü ve ilişkinin gücünü ifade eder.

r xy için (xi) df, rxy'nin önemini test etmek için kullanılan N-2'dir. R nin test önemi, regresyonun test edilmesinin önemidir. Regresyon çizgisi eğim ve kesişmeyi içerir, bu nedenle 2 df kaybolur. N = 2 olduğunda, rxy ya + 1.00 ya da -00'dür, çünkü r'nin sayısal değerinde örnekleme değişimi için bir özgürlük yoktur.

A. rxy'nin hesaplanması (Gruplandırılmamış Veriler) :

Burada, r'nin hesaplanmasında formülün kullanılması “sapmaların nereden alındığı” na bağlıdır. Farklı durumlarda, gerçek ortalamadan veya sıfırdan veya katsayı korelasyonunun hesaplanması için uygun şekilde uygulanan AM Tip Formülünden sapmalar alınabilir (ortalama ya da bütün olarak) ortalama değere bağlıdır.

(i) İki ve İki Dağılım Araçlarından Sapmalar Alındığında r Formülü .

rxy = X ve Y arasındaki korelasyon

x = X testindeki ortalamadan herhangi bir X puanının sapması

y = karşılık gelen Y puanının Y testindeki ortalamadan sapması

∑xy = Tüm sapma ürünlerinin toplamı (X ve Y)

σ x ve σ y = X ve Y skorlarının dağılımındaki standart sapmalar.

burada x ve y, gerçek araçlardan sapmalardır ve ∑x 2 ve ∑y2, iki yoldan alınan x ve y'deki kare sapmaların toplamıdır.

Bu formül tercih edilir:

ben. Her iki değişkenin ortalama değerleri kesirde olmadığı zaman.

ii. Kısa, gruplanmamış seriler arasındaki ilişkiyi ne zaman ortaya çıkar (örneğin, yirmi beş olgu ya da öylesine).

iii. İki dağıtımın gerçek yollarından sapmalar alındığında.

Gerekli adımlar Tablo 5.1'de gösterilmektedir. Burada sayılıyorlar:

Aşama 1:

Paralel sütunlarda eşleştirilmiş X ve Y puanlarını listele, karşılık gelen puanların birlikte olduğundan emin olun.

Adım 2:

İki aracı Mx ve My'yi belirleyin . Tablo 5.1'de bunlar sırasıyla 7.5 ve 8.0'dır.

Aşama 3:

Her puan çiftinde x ve y sapmalarını belirleyin. Sıfır olması gereken cebirsel toplamları bularak onları kontrol edin.

4. Adım:

Tüm sapmaların karesini alın ve iki sütun halinde listeleyin. Bu, σ x ve σ y hesaplamak içindir.

Adım 5:

∑x 2 ve ∑y 2 elde etmek için sapmaların karelerini toplayın ve xy ürününü bulun ve bunları ∑xy için toplayın.

6. Adım:

Bu değerlerden σ x ve σ y hesaplar.

Alternatif ve daha kısa bir çözüm:

Başka bir amaç için gerekli olmadıkça σ x ve σ y'nin hesaplanmasını ihmal eden alternatif ve daha kısa bir rota vardır.

Formül Uygulaması (28):

(ii) Orijinal puanlardan veya Ham puanlardan r xy'nin hesaplanması:

Bu, sapmaların kullanılmasını gerektirmeyen, gruplanmamış veri içeren başka bir prosedürdür. Tamamen orijinal puanlarla ilgilenir. Formül yasaklayıcı görünebilir ancak uygulanması gerçekten kolaydır.

Bu formül tercih edilir:

ben. Doğrudan ham puanlardan r hesaplandığında.

ii. Veriler küçük gruplara ayrıldığında orijinal puanlar ft.

iii. Ortalama değerler kesirlerde olduğunda.

iv. İyi bir hesap makinesi mevcut olduğunda.

X ve Y, X ve Y değişkenlerindeki orijinal puanlardır. Diğer semboller onlarla ne yapıldığını söyler.

Tablo 5.2'de gösterilen adımları takip ediyoruz:

Aşama 1:

Tüm X ve Y ölçümlerini yapın.

Adım 2:

Her skor çifti için XY ürününü bulun.

Aşama 3:

X, Y, X 2, Y 2 ve XY'yi toplayın.

4. Adım:

Formül (29) uygula:

(ii) Varsayılan Ortalama'dan sapmalar alındığında r xy'nin hesaplanması:

Formül (28), doğrudan iki gruplandırılmış skor serisinden r'nin hesaplanmasında yararlıdır, ancak hesaplama araçlarının ve σ'nın uzun metodunu gerektirdiği için dezavantajları vardır. Gerçek araçlardan alındığında x ve y sapmaları genellikle ondalıktır ve bu değerlerin çarpılması ve karesi alınması genellikle sıkıcı bir iştir.

Bu nedenle - kısa gruplanmamış serilerle çalışırken bile - araçları kabul etmek, bu AM'lerden sapmaları hesaplamak ve formülü uygulamak (30) uygulamak daha kolaydır.

Bu formül tercih edilir:

ben. Gerçek araçlar genellikle ondalık olduğunda ve bu değerlerin çarpılması ve karesi alınması genellikle sıkıcı bir iştir.

ii. AM'lerden sapmalar alındığında.

iii. Kesirlerden kaçınmamız gerektiğinde.

R bilgisayarındaki adımlar aşağıdaki gibi özetlenebilir:

Aşama 1:

Test 1 (X) ortalamasını ve Test 2 (Y) ortalamasını bulun. Tablo 5.3 M X = 62.5 ve M Y = 30.4'te gösterilen araçlar.

Adım 2:

Hem X hem de Y'nin AM'sini, yani 60.0 olarak AM X'i ve 30.0 olarak AM Y'yi seçin .

Aşama 3:

Test 1'deki her bir puanın AM, 60.0'dan sapmasını bulun ve x 'sütununa girin. Daha sonra Test 2'deki her bir puanın AM, 30.0'dan sapmasını bulun ve y sütununa girin.

4. Adım:

Tüm x 've hepsini' kareler ve bu kareleri sırasıyla x ' 2 ve y' 2 sütunlarına girin. ∑x ' 2 ve ∑y' 2 elde etmek için bu sütunları toplayın.

Adım 5:

X 've y' ile çarpın ve bu ürünleri (işaretiyle ilgili olarak) x'y 'sütununa girin. Toplam x'y 'sütunu, işaretleri dikkate alarak ∑x'y' almak için.

6. Adım:

Düzeltmeler, Cx ve Cy, AM X'in Mx'den AM x ve My'nin My'den çıkarılmasıyla bulunur. Daha sonra, Cx, 2.5 (62.5 - 60.0) ve Cy, .4 (30.4 - 30.0) olarak bulundu.

7. Adım:

5.3x'y ', 334, ∑x' 2, 670 için ve ∑y ' 2, 285 için formül 5.3'te gösterildiği gibi (30) formülünün yerine geçerek rxy için çözülür .

R'nin özellikleri:

1. Bir korelasyon katsayısının değeri, bir veya iki değişkene bir sabit eklendiğinde değişmez.

Değişkenlerden birine veya her ikisine bir sabit eklendiğinde, r katsayısı korelasyonu üzerindeki etkisini gözlemlemek için bir örnek düşünelim.

Şimdi, X'teki her bir puana 10, Y'nin her bir skoruna 20 puan ekledik ve bu skorları sırasıyla X ve Y 'ile temsil ediyoruz.

Orijinal ve yeni gözlem çiftleri için r'nin hesaplanmasına ilişkin hesaplamalar Tablo 5.4'te verilmiştir:

(29) formülünü kullanarak, orijinal puanın korelasyon katsayısı şöyle olacaktır:

Yeni puanlar için aynı formül şöyle yazılabilir:

Böylece, bir korelasyon katsayısı değerinin, bir veya iki değişkene bir sabit eklendiğinde değişmediğini gözlemledik.

2. Bir korelasyon katsayısının değeri, sabit bir veya iki değişkenden bir sabit çıkarıldığında değişmez:

Öğrenciler bunu örnek alarak inceleyebilirler. Değişkenlerin her birinin veya her ikisinin bir puanı sabit bir şekilde çıkarıldığında, korelasyon katsayısı değeri de değişmeden kalır.

3. Bir korelasyon katsayısı değeri, bir veya iki değişken değer grubunun bir sabit ile çarpılması durumunda değişmeden kalır:

Değişkenleri bir sabit değer ile çarpmanın r değeri üzerindeki etkisini gözlemlemek için, önceki örnekteki birinci ve ikinci kümelerin orjinal puanlarını sırasıyla 10 ve 20 ile çarptık.

X 've Y' arasındaki r daha sonra aşağıdaki gibi hesaplanabilir:

X 've Y' katsayısının korelasyonu şöyle olacaktır:

Dolayısıyla, bir korelasyon katsayısı değerinin bir sabitin bir veya iki değişken değer setiyle çarpılması durumunda değişmediğini gözlemlemekteyiz.

4. Bir veya iki değişken değer grubunun bir sabite bölünmesi durumunda bile, r'nin değeri değişmeden kalacaktır:

Öğrenciler bunu örnek alarak inceleyebilirler.

B. Gruplandırılmış Verilerdeki Korelasyon Katsayısı :

İki değişken X ve Y üzerindeki ölçüm çiftlerinin sayısı (N) büyük, hatta orta boyutta ve hesap makinesi bulunmadığında, geleneksel prosedür verileri hem X hem de Y olarak gruplamak ve bir dağılım diyagramı oluşturmaktır. veya iki yönlü frekans dağılımı veya iki değişkenli frekans dağılımı olarak da adlandırılan korelasyon şeması.

Sınıf aralığının büyüklüğü ve aralıkların sınırları seçimi, daha önce verilen kuralların aynısıdır. Bu fikri açıklığa kavuşturmak için, Fizik ve Matematik sınavında 20 kişilik bir sınıfın kazandığı puanlarla ilgili iki değişkenli bir veri düşünüyoruz.

Dağılım diyagramı hazırlama:

Çift veri grubunun oluşturulmasında, sütun ve satır içeren bir tablo hazırlanır. Burada, her bir değişken çiftini eşzamanlı olarak iki sınıfta sınıflandırıyoruz, biri Fizik (X) ve diğeri Matematik (Y) 'de skoru Tablo 5.6'da gösterildiği gibi göstermektedir.

20 öğrencinin Fizik (X) ve Matematik (Y) puanları aşağıdaki Tabloda gösterilmiştir:

İki değişkenli bir frekans dağılım tablosu hazırlayabiliriz, böylece her bir puan çiftine bahis koyabiliriz. Bir saçılım programının yapısı oldukça basittir. Yukarıdaki şemada gösterildiği gibi bir tablo hazırlamak zorundayız.

Sol kenar boşluğu boyunca, X-dağılımının sınıf aralıkları aşağıdan yukarıya doğru sıralanır (artan sırada). Diyagramın üst kısmında Y dağılımının cii'sı soldan sağa doğru çıkar (artan sırada).

Her bir puan çifti (hem X hem de Y'de), ilgili hücrede bulunan bir kütle ile temsil edilir. 1 Nolu Öğrenci 32 Fizik (X) ve 25 Matematik (Y) aldı. 32 inç (X) puanı onu son sıraya yerleştirir ve 25 inç (Y) onu ikinci sütuna yerleştirir. Böylece, skorlar çifti için (32, 25) 5. sıradaki ikinci sütunda bir taksitli işaretlenecektir.

Benzer şekilde, 2 Nolu öğrenci durumunda, puanlar için (34, 41), 5. sıranın 4. sütununa bir taksit koyacağız. Aynı şekilde, 20 satır ilgili satır ve sütunlara konacaktır. (Satırlar X puanlarını ve sütunlar Y puanlarını gösterir).

Sağ kenar boşluğu boyunca, f x sütunu, her bir ci içindeki, X dağılımındaki vakaların sayısı tablo halinde gösterilmiş ve grafikteki satır boyunca her bir ci içindeki durumların sayısı, Y dağılımının tablo.

F x sütununun toplamı 20 ve fy satırının toplamı da 20'dir. Aslında iki değişkenli bir dağılımdır, çünkü iki değişkenli eklem dağılımını temsil eder. Scattergram daha sonra bir “korelasyon tablosu” dur.

Bir korelasyon tablosundan r'nin hesaplanması:

R'nin hesaplanmasında izlenecek adımların aşağıdaki ana hatları, öğrencinin her adımda okuduğu gibi sürekli olarak Tablo 5.7'ye başvurması halinde anlaşılacaktır:

Aşama 1:

İlişkili iki değişken için bir scattergram oluşturun ve ondan bir korelasyon tablosu çizin.

Adım 2:

Her C dağılımının frekansını sayın - X ve f x sütununa yazın. Her bir dağıtım ci - sinin frekansını sayınız ve f satırını doldurunuz.

Aşama 3:

X dağılımı için bir ortalama alın ve ci'yi çift satırla işaretleyin. Verilen korelasyon tablosunda, ci, 40 - 49'daki ortalamayı varsayalım ve tabloda gösterildiği gibi çift çizgiler koyalım. AM çizgisinin üstündeki sapmalar (+ ve) ve altındaki sapmalar (- ve) olacaktır.

AM çizgisine, yani ortalamanın 0 (sıfır) olduğunu kabul ettiğimiz ci'ye karşı sapma ve üstünde d +1, +2 olarak not edilir. 13 ve altındaki d' nin - 1 olduğu not edilir. Şimdi dx sütunu doldurulur. Ardından f x ile çarpın. ve fdx'i almak için her satırın dx'i . Fdx 2 elde etmek için her satırın dx ve fdx'lerini çarpın.

[Not: SD'yi varsayılan ortalama yönteminde hesaplarken, d'leri işaretlemek ve fd ve fd 2'yi hesaplamak için bir ortalama varsayıyorduk. Burada da aynı prosedür izlenir.]

4. Adım:

Adım 3'teki ile aynı prosedürü uygulayın ve dy, fdy ve fdy 2'yi hesaplayın. Dağıtım-Y için, ci 20-29'daki ortalamayı varsayalım ve tabloda gösterildiği gibi sütunu işaretlemek için çift çizgiler koyalım. Bu sütunun solundaki sapmalar negatif, sağ pozitif olacaktır.

Böylece, ortalamanın varsayıldığı sütun için d, 0 (sıfır) ve soldan d işaret - 1 ve sağdan d +1, +2 ve +3 olarak işaretlenir. Şimdi dy sütunu doldurulur. Fdy elde etmek için her sütunun fy ve dy değerlerini çarpın. Fdy 2'yi elde etmek için dy ve fdy değerlerini her sütuna çarpın .

Adım 5:

Bu evre önemli olduğundan, farklı X dağılımları için dy'nin hesaplanmasında ve farklı Y dağılımları için dx'de dikkatle işaretleyeceğiz.

dağılımının farklı ci'leri için dy -X: İlk satırda 1 f, 20-29 olan kolonun altındadır ve bobini 0'dır (En alta bak. Bu sıranın dy girişi 0'dır). Yine 1 f, kolonu altında, 40-49, olanı + 2'dir. Böylece, ilk sıra için dy = (1 x 0) + (1 x 2) = + 2.

İkinci sırada şunu bulduk:

1 f Kolonun altında, boyası + 2 olan 40-49 ve

2 f s, her biri + 3 olan 50-59 sütununun altındadır.

Böylece 2. sıra için dy = (1 x 2) + (2 X 3) = 8.

Üçüncü sırada

2 f s, her biri 0 olan 20-29 sütununun altında,

2 f s, her biri +2 olan 40-49 sütunun altında ve 1 f, boyası +3 olan 50-59 sütunun altındadır.

Böylece 3. sıra için dy = (2 x 0) + (2 x 2) + (1 X 3) = 7.

Dördüncü sırada

3 f s, her biri 0 olan 20-29 sütununun altında,

2 f s kolonun altında, her biri 30'39 olan ve her biri + 1 olan ve 1 f kolonun altında, 50-59 olan ve + 3 olan sütunların altında,

Böylece 4. sıra için dy = (3 X 0) + (2 X 1) + (1 x 3) = 5.

Aynı şekilde 5. sırada

5. sıra için dy = (2 x - 1) + (1 x 0) + (1 x 2) = 0

farklı ci için dx, 'v dağıtım' - Y:

İlk sütunda,

2 f s, dx - 1 olan 30-39 sıranın karşısında.

Öyleyse 1. sütunun dx'i = (2 x - 1) = - 2

İkinci sütunda,

1 f, dx +3 olan 70-79 ci’ye karşı,

2 f s, dx'leri +1 olan 50-59 ci'ye karşı,

3 f c, dx'leri her biri 0 olan 40-49'a karşı,

1 f, dx - 1 olan 30-39 ci'ye karşıdır.

İkinci sütun için dx = (1 x 3) + (2 X 1) + (3 X 0) + (1 x - 1) = 4. Üçüncü sütunda,

3. sütun için dx = 2 × 0 = 0

Dördüncü sütunda,

4. sütun için dx = (1 x 3) + (1 x 2) + (2 x 1) + (1 x - 1) = 6.

Beşinci sütunda,

5. sütun için dx = (2 x 2) + (1 x 1) + (1 X 0) = 5.

6. Adım:

Şimdi, her satırdaki dx.dy değerini hesaplayın - X, her satırdaki dx girişlerini her satırdaki dy girişleriyle çarparak hesaplayın. Daha sonra, her bir sütunun dx.dy değerini hesaplayın - Y, her sütunun dy girişlerini her sütunun dx girişleriyle çarparak.

7. Adım:

Şimdi, fdx, fdx 2, dy ve dx.dy sütunlarının cebirsel toplamını alın (dağıtım için - X). Fdy, fdy 2, dx ve dx.dy satırlarının cebirsel toplamını alın (dağıtım için - Y)

8. adım:

Σ. X-dağılımının dx.dy = ∑ Y-dağılımının dx.dy

fdx = dx satırının toplamı (yani ∑ dx )

fdy = toplam dy kolonu (yani ∑ dy )

9. adım:

Bulunan sembollerin değerleri

fdx = 13, ∑ fd 2 x = 39

fdy = 22, ∑ fd 2 y = 60

Dx.dy = 29 ve N = 20.

Bir korelasyon tablosundaki korelasyon katsayısını hesaplamak için aşağıdaki formülü uygulayabilirsiniz:

Formül (31) 'in paydasında, ' i 'hariç, ' x ' ve' y ' formülü uygulayacağımızı işaretleyebiliriz. Burada Cx, Cy, σ x, σ v'nin sınıf aralıklarında (yani, i'de) ifade edildiğini not edebiliriz. Böylece, σ x ve σ y hesaplanırken, i kullanılmaz. Bu arzu edilir, çünkü tüm ürün sapmaları yani ∑ dx.dy'ler aralık birimleridir.

Böylece hesaplıyoruz:

Korelasyon Katsayısının Yorumlanması:

Sadece korelasyonun hesaplanması, katsayının anlamlı olması için ne kadar büyük olması gerektiğine karar verene kadar ve bizim için ne ifade ediyor? Elde edilen korelasyon katsayısı değeri ile neyi kastediyoruz?

Korelasyon Katsayısının Yanlış Yorumlanması:

Bazen, korelasyon katsayısının değerini yanlış anlar ve sebep-sonuç ilişkisini kurarız, yani bir değişken diğer değişkende değişkenliğe neden olur. Aslında mantıklı bir temele sahip olmadıkça bu şekilde yorum yapamayız.

Korelasyon katsayısı, bize iki değişken arasındaki ilişkinin niteliğine dair bilgi değil, X ve Y değişkenleri arasındaki ilişki derecesinin nicel olarak belirlenmesini sağlar. Nedensellik değişmez bir dizi anlamına gelir - A her zaman B'ye yol açar, oysa korelasyon sadece iki değişken arasındaki karşılıklı ilişkilerin bir ölçüsüdür.

Örneğin, uyumsuzluk ve kaygı arasında yüksek bir korelasyon olabilir:

Fakat yüksek korelasyon temelinde, yanlış düzenlemenin kaygıya yol açtığını söyleyemeyiz. Yüksek kaygının, haksızlığa uğramanın nedeni olması mümkün olabilir. Bu, uyumsuzluk ve kaygının karşılıklı olarak ilişkili değişkenler olduğunu göstermektedir. Başka bir örnek ele alalım.

Okuldaki bir konudaki yetenek ile dersteki başarı arasında yüksek bir korelasyon vardır. Okul sınavlarının sonunda bu nedensel ilişkiyi yansıtacak mı? Olabilir ya da olmayabilir.

Özne çalışmasında yetenek kesinlikle öznenin başarısında farklılığa neden olur, ancak konuyla ilgili öğrencinin yüksek başarısı sadece yüksek özeliğin sonucudur; diğer değişkenlere de bağlı olabilir.

Bu nedenle, korelasyonun büyüklüğünü sebep-sonuç açısından ortak-etkinliğini yorumlarken, eğer inceleme altındaki değişkenler bu tür bir yorumlama için mantıklı bir temel sağlarsa ve uygunsa uygundur.

Korelasyon Katsayısının boyutunu etkileyen faktörler:

Ayrıca korelasyon katsayısının boyutunu etkileyen ve yanlış yorumlamaya yol açabilecek aşağıdaki faktörlerin de farkında olmalıyız:

1. “r” nin boyutu korelasyondaki örnekteki ölçülen değerlerin değişkenliğine çok bağlıdır. Değişkenlik ne kadar büyük olursa, korelasyon o kadar yüksek olur, her şey eşit olur.

2. Bir araştırmacı, bu grupları belirli davranış açısından karşılaştırmak için aşırı bir konu grubu seçtiğinde, 'r' boyutu değiştirilir. Aşırı grupların birleşik verilerinden elde edilen “r” aynı grubun rastgele bir örneğinden elde edilen “r” den daha büyük olacaktır.

3. Aşırı vakaları gruba eklemek veya bırakmak, “r” boyutunda değişime neden olabilir. Aşırı davanın eklenmesi korelasyon boyutunu artırabilirken aşırı davanın düşürülmesi “r” nin değerini düşürür.

Ürün kullanım anları r:

Korelasyon, Eğitimsel ve Psikolojik Ölçme ve Değerlendirme alanında kullanılan en yaygın analitik prosedürlerden biridir. Bu yararlıdır:

ben. İki değişken arasındaki yazışma derecesini (veya ilişkisini) açıklamak.

ii. Bir değişkenin öngörülmesi - bağımsız değişkene dayanarak bağımlı değişken.

iii. Bir testi doğrulamak; örneğin bir grup zeka testi.

iv. Bir testin nesnellik derecesinin belirlenmesi.

v. Eğitim ve mesleki rehberlik ve karar vermede.

vi. Testin güvenilirliğini ve geçerliliğini belirlemek.

vii. Çeşitli ilişkilerin rolünü belirlemek, belli bir yetenek ile ilişkilidir.

viii. İnsan yeteneklerinde altta yatan değişkenlerin faktör yüklerini belirlemeye yönelik faktör analizi tekniği.

Ürün momenti varsayımları r :

1. Normal dağılım:

Korelasyonu hesaplamak istediğimiz değişkenler normal olarak dağıtılmalıdır. Varsayım rastgele örneklemeden yapılabilir.

2. Doğrusallık:

Ürün moment korelasyonu, lineer korelasyon olarak bilinen düz çizgide gösterilebilir.

3. Sürekli seri:

Sürekli serilerde değişkenlerin ölçümü.

4. Eşcinsellik:

Homosidastisite durumunu (eşit değişkenlik) karşılamalıdır.

3. Spearman's Rank Korelasyon Katsayısı:

Eğitim ve Psikolojide, nesnelerin veya bireylerin iki değişken üzerinde liyakat veya yeterlilik sırasına göre sıralanıp düzenlenebileceği bazı durumlar vardır ve bu iki grup rütbe kovarsa veya aralarında anlaşırsa, ilişki derecelerini rütbe korelasyonuyla ölçürüz .

Yine, yapılan ölçümler arasındaki ilişkinin doğrusal olmadığı ve ürün anı r ile tanımlanamadığı problemler vardır.

Örneğin, liderlik kabiliyeti temelinde bir grup öğrencinin değerlendirilmesi, bir güzellik yarışmasında kadınların sıralaması, tercih sırasına göre sıralanan öğrenciler veya resimler, estetik değerlerine göre sıralanabilir. Çalışanlar, iş performansı konusunda denetçiler tarafından rütbeli olabilir.

Okul çocukları, sosyal uyum konusunda öğretmenler tarafından sıralanabilir. Bu gibi durumlarda, nesneler veya bireyler iki değişken üzerindeki liyakat veya yeterlilik sırasına göre sıralanabilir ve düzenlenebilir. Spearman, iki sıra grubu arasındaki korelasyonun derecesini veya derecesini ölçmek için Sıra Korelasyon Katsayısı adlı bir formül geliştirmiştir.

Bu korelasyon katsayısı Yunanca ρ (Rho olarak adlandırılan) harfi ile gösterilmektedir ve şöyle verilmektedir:

nerede, ρ = rho = Spearman's Rank Korelasyon Katsayısı

D = Eşlenmiş dereceler arasındaki fark (her durumda)

N = Sıralanan öğelerin / bireylerin toplam sayısı.

Rho (ρ) 'nın özellikleri:

1. Sıra Korelasyon Katsayısı'nda iki değişkenli değişkenin gözlemleri veya ölçümleri sıra şeklindeki sıralamaya göre sıralanır.

2. Katsayının büyüklüğü, rütbe farklarının büyüklüğünden doğrudan etkilenir.

(A) Eğer her iki test için de aynı değerler varsa, her bir sıralama farkı sıfır olacak ve sonuçta D2 sıfır olacaktır. Bu, korelasyonun mükemmel olduğu anlamına gelir; yani, 1.00.

(B) Sıra farkları çok büyükse ve kesir birden büyükse, korelasyon negatif olacaktır.

Rho (ρ) varsayımları:

ben. N küçük veya veriler fena değil.

ii. Nüfus dağılımının bazı özelliklerinden özgür veya bağımsızdırlar.

iii. Birçok durumda, kantitatif ölçümlerin bulunmadığı durumlarda sıralama yöntemleri kullanılır.

iv. Nicel ölçümler mevcut olmasına rağmen, aritmetik işçiliği azaltmak için saflar ikame edilmiştir.

v. Bu tür testler parametrik olmayan olarak tanımlanmaktadır.

vi. Bu gibi durumlarda, veriler sıra numarası, 1., 2., 3.…. Bunlar hesaplama amacıyla 1, 2, 3, ………, N numaralı kardinallerle değiştirilir. Sıra sayıları için kardinal sayıların değiştirilmesi her zaman aralıkların eşitliğini kabul eder.

I. Test Puanlarından ρ Hesaplama:

Örnek 1:

Aşağıdaki veriler sırasıyla Matematik ve Genel Bilimler bölümündeki 5 öğrencinin puanlarını vermektedir:

İki dizi test puanı arasındaki ilişkiyi Rank Farkı Yöntemi ile hesaplayın.

Matematik ve Genel Bilim puanları arasındaki korelasyon katsayısının değeri pozitif ve orta düzeydedir.

Spearman'ın Korelasyonu Eş-Verimli Olarak Hesaplama Adımları:

Aşama 1:

Öğrencileri, adları veya seri numaralarını sütun 1'de listeleyin.

Adım 2:

Sütun 2 ve 3'te, her öğrencinin veya bireyin sınav I ve II'deki puanlarını yazınız.

Aşama 3:

Bir sütun 2 puan kümesini alın ve en düşük puan N'ye eşit bir rütbe elde edinceye kadar en yüksek puan için 9, en yüksek puan 8 olan 8 ve daha sonraki en yüksek puan için 2 olan 1 puan atayın; hangisi 5.

4. Adım:

II. Sütundaki 3. küme kümesini alın ve 1. seviyeye en yüksek puana atayın. İkinci sette en yüksek puan 10'dur; bu nedenle rütbe 1 elde edin. Bir sonraki en yüksek B öğrencisi 8; Bu nedenle, rütbe 2'dir. C öğrencisi rütbe 3, E rütbe 4 ve D rütbe 5'tir.

Adım 5:

Her öğrencinin rütbe farkını hesaplayın (sütun 6).

6. Adım:

Sütun 6'da kaydedilen farklılıkların toplamını kontrol edin. Her zaman sıfırdır.

7. Adım:

Sütun 6 derecelerinin her bir farkı, kare 7'ye bölünür ve 7 sütununa kaydedilir.

8. adım:

N ve 2D 2'nin değerini, Spearman'ın korelasyon katsayısı olan formülüne koyun.

2. Dereceli Verilerden Hesaplama:

Örnek 2:

Konuşma yarışmasında Prof. Mehrotra ve Prof. Shukla, 10 öğrenciyi yargıladı. Yargılamaları aşağıda sunulan saflarda yer aldı. Yargılamalarının ne ölçüde uzlaşılacağını belirleyin.

Ortak korelasyonun değeri + .83'tür. Bu, iki yargıç arasında yüksek derecede bir anlaşma olduğunu göstermektedir.

3. Bağlı Sıralar için ρ (Rho) 'nun Hesaplanması:

Örnek 3:

Aşağıdaki veriler, Deneme I ve Deneme II'de 2 haftalık bir boşluk ile iki test denemesinde 10 öğrencinin puanlarını vermektedir.

İki araştırmanın puanları arasındaki korelasyonu rank farkı yöntemiyle hesaplayın:

Deneme I ve II arasındaki korelasyon pozitif ve çok yüksektir. Testin Deneme I ve II'sinde 10 öğrencinin aldığı puanlara dikkatlice bakın.

10 öğrencinin aldığı puanlarda özel bir özellik buluyor musunuz? Muhtemelen, cevabınız “evet” olacaktır.

Sütun 2 ve 3'teki yukarıdaki tabloda, birden fazla öğrencinin aynı puanları aldığını göreceksiniz. 2. sütunda A ve G öğrencileri aynı puan alıyor. 10. 3. sütunda, A ve B, C ve F ve G ve J öğrencileri de sırasıyla 16, 24 ve 14 olan aynı puanları almaktadır.

Kesinlikle bu çiftler aynı değerlere sahip olacak; Bağlı Rütbeler olarak bilinir. Sıralamaları tekrarlanan puanlara atama prosedürü tekrarlanmayan puanlardan biraz farklıdır.

4. sütuna bakın. Öğrenci A ve G'nin her birinin 10'unun benzer puanları var ve grupta 6. ve 7. sıradalar. 6. ve 7. dereceyi atamak yerine, her iki gruba ortalama 6.5 yani (6 + 7/2 = 13/2) atanmıştır.

Aynı prosedür II. Deneme'deki puanlar açısından da izlenmiştir. Bu durumda bağlar üç yerde meydana gelir. C ve F öğrencileri aynı puana sahiptir ve bu nedenle ortalama puanı (1 + 2/2 = 1.5) alırlar. Öğrenci A ve B, 5. ve 6. sıradadır; dolayısıyla her birine 5, 5 (5 + 6/2) rütbe verilir. Benzer şekilde, öğrenci G ve J, her birine 7, 5 (7 + 8/2) rütbesine sahiptir.

Değerler ikiden fazla tekrarlanırsa, rütbeleri atamak için aynı prosedür izlenebilir:

Örneğin:

Eğer üç öğrenciye 5, 6 ve 7. sırada 10, bir puan alırsanız, her birine 5 + 6 + 7/3 = 6 derecesine sahip olacaksınız.

Ρ (rho) 'nun hesaplanması için takip edilen prosedür adımlarının geri kalanı daha önce açıklandığı gibidir.

Yorumlama:

Ρ değeri, Karl Pearson'un Korelasyon Katsayısı ile aynı şekilde yorumlanabilir. -1 ile + 1 arasında değişir. + 1 değeri, iki sıra kümesi arasındaki ilişkiyi mükemmel şekilde pozitif olarak kabul eder veya ρ = - 1 değeri mükemmel bir negatif ilişkiyi gösterir. Sıralar arasında bir ilişki ya da anlaşma olmaması durumunda, ρ = 0'dır.

Sıra Farkı Yönteminin Avantajları:

1. Spearman's Rank Order Correlation hesaplama katsayısı, Pearson'un Moment Çarpım Moment Yöntemi ile hesaplanan (r) 'den daha hızlı ve kolaydır.

2. Verilerin yalnızca sıralı formda mevcut olması veya eşleştirilmiş değişken sayısının 5'ten fazla olması ve minimum veya birkaç dereceli bağlarla 30'dan büyük olmaması kabul edilebilir bir yöntemdir.

3. p'yi yorumlamak oldukça kolaydır.

Sınırlamalar:

1. Zaman aralığı verisi sıralı verilere dönüştürüldüğünde puan farklarının büyüklüğü ile ilgili bilgiler kaybolur; örneğin, Tablo 5.10'da, Deneme II'deki D, 18'den 21'e kadar puan alırsa, sırası sadece 4 olarak kalır.

2. Eğer dava sayısı daha fazlaysa, onlara rütbe vermek sıkıcı bir iştir.