Ki-Kare Testi: Anlamı, Uygulamaları ve Kullanımları

Bu makaleyi okuduktan sonra öğreneceksiniz: - 1. Ki-Kare Testinin Anlamı 2. Ki-Kare Testinin Önem Derecesi 3. Sıfır Hipotezi Altındaki Ki-Kare Testi 4. Geçerlilik Koşulları 5. Katkı Maddesi 6. Uygulamalar 7. kullanır.

Ki-Kare Testinin Anlamı:

Ki-kare (χ 2 ) testi, deneysel olarak elde edilen sonuçları, bazı hipotezlerde teorik olarak beklenenlerle karşılaştırmanın yararlı bir yöntemini temsil eder.

Dolayısıyla Ki-kare, gözlemlenen ve beklenen frekansların gerçek sapmalarının bir ölçüsüdür. Böyle bir önlemin öneminin, teori ile gerçek arasındaki farklılığı incelemekten kaçınılması gereken örnekleme çalışmalarında çok büyük olacağı çok açıktır.

Gördüğümüz gibi ki-kare beklenen ve gözlemlenen frekanslar arasındaki bir farklılık ölçüsüdür ve beklenen ve gözlemlenen frekanslar arasında bir fark yoksa Ki-kare değeri 0'dır.

Gözlenen ve beklenen frekanslar arasında bir fark varsa, o zaman ki-kare değeri 0'dan fazla olacaktır. Yani, Ki-kare büyüdükçe, beklenen sonuçlardan deneysel olarak gözlemlenen gerçek bir sapma olasılığı artar.

Eğer hesaplanan ki-kare değeri, tablo değerine göre çok küçükse, gerçek ve beklenen frekanslar arasındaki farklılığın çok az olduğunu ve sonuç olarak uygunluğun iyi olduğunu gösterir. Öte yandan, ki-karenin hesaplanan değeri, tablo değerine göre çok büyükse, beklenen ve gözlenen frekanslar arasındaki farkın çok büyük olduğunu ve sonuçta uyumun zayıf olduğunu gösterir.

Ki-kareyi değerlendirmek için, Ki-kare hesaplanmış değeri ve uygun serbestlik dereceleriyle Tablo E'ye giriyoruz. Df = (r - 1) (c - 1) sayısı, burada r, satır sayısı ve c, verinin tablolandığı sütun sayısıdır.

Böylece 2 x 2 tablo serbestlik derecesi (2 - 1) (2 - 1) veya 1'dir. Benzer şekilde 3 x 3 tabloda, serbestlik derecesi (3 - 1) (3 - 1) veya 4 ve 3 x 4 tablo serbestlik dereceleri (3 - 1) (4 - 1) veya 6'dır.

Ki-Kare Testinin Önemi:

Beklenen ve gözlenen frekanslar arasındaki farkın örnekleme dalgalanmalarından mı kaynaklandığına ve bunun önemli olup olmadığına veya farkın başka bir nedenden dolayı olup olmadığına karar vermek için hesaplanan χ 2 (Ki-kare) değerleri tablo değerleri ile karşılaştırılır. böyle önemli. Teori ve gerçeğin farklılığı her zaman belirli olasılıklar açısından test edilir.

Olasılıklar, çizilen sonuca dayanabileceğimiz güven derecesini göstermektedir. Χ 2 tablo değerleri çeşitli olasılık seviyelerinde mevcuttur. Bu seviyelere anlamlılık seviyeleri denir. Genellikle, verilen serbestlik dereceleri için .05 ve .01 değerlerinde χ 2 değeri tablolardan görülmektedir.

Hesaplanan değerin value 2, tablodaki değerden büyükse, önemli olduğu söylenir. Başka bir deyişle, gözlemlenen ve beklenen frekanslar arasındaki tutarsızlık şansa bağlı olamaz ve sıfır hipotezini reddediyoruz.

Bu nedenle, deneyin teoriyi desteklemediği sonucuna vardık. Öte yandan, eğer hesaplanan değer χ2 karşılık gelen tablo değerinden düşükse, istenen önem seviyesinde önemsiz olduğu söylenir.

Bu, gözlemlenen değerler (deney) ve beklenen değerler (teori) arasındaki tutarsızlığın şansa, yani örneklemenin dalgalanmalarına bağlı olabileceği anlamına gelir.

Boş Hipotez Altında Ki-Kare Testi:

Farz edelim ki, bazı deneylerde elde edilen bir dizi gözlemlenmiş frekans verilmiş ve deney sonuçlarının belirli bir hipotezi veya teoriyi destekleyip desteklemediğini test etmek istiyoruz. 1990 yılında Karl Pearson, deneysel değerler ile bazı teori veya hipotezler altında elde edilen teorik değerler arasındaki farkın önemini test etmek için bir test geliştirmiştir.

Bu test χ 2- test olarak bilinir ve gözlem (deney) ile teori arasındaki sapmanın şansa (örnekleme dalgalanmaları) ya da gerçekten gözlenen teoriye uyma teorisinin yetersizliğine bağlı olup olmadığını test etmek için kullanılır. veri.

Sıfır Hipotezi altında, gözlemlenen (deneysel) ile teorik veya hipotetik değerler arasında anlamlı bir fark olmadığını, yani teori ve deney arasında iyi bir uyumsuzluk olduğunu belirtiriz.

Ki-kare denklemi (χ 2 ) aşağıdaki gibi ifade edilir:

f o = gözlemlenen veya deneysel olarak tespit edilmiş gerçeklerin ortaya çıkma sıklığı

f e = bazı hipotezlerde beklenen oluşum sıklığı.

Dolayısıyla ki-kare, gözlemlenen ve beklenen frekanslar arasındaki farkın karesini her durumda beklenen frekanslara bölerek elde edilen değerlerin toplamıdır. Başka bir deyişle, gözlemlenen ve beklenen frekanslar arasındaki farklar kareler şeklindedir ve her durumda beklenen sayıya bölünür ve bu bölümlerin toplamı χ 2'dir .

Ki-kare testinin birkaç resmi yukarıda verilen tartışmayı açıklığa kavuşturur. F o ve f e arasındaki farklar daima + ve ile yazılır.

1. Gözlemlenen sonuçların, eşit olasılık hipotezi (boş hipotez) hipotezinde beklenenlerden farklılığının test edilmesi:

Örnek 1:

Doksan altı denekten F (olumlu), I (kayıtsız) veya U (elverişsiz) olarak işaretleyerek “AIDS eğitimi Yükseköğretim ikinci kademe müfredatına entegre edilmeli” önerisine yönelik tutumlarını ifade etmeleri istenir.

48 'F', 24 'I' ve 24 'U' işaretli olduğu görülmüştür:

(i) Grupta herhangi bir tercih yoksa, gözlemlenen sonuçların beklenen sonuçlardan önemli ölçüde farklı olup olmadığını test edin.

(ii) “Gruptaki tercihler arasında bir fark olmadığı” hipotezini test edin.

(iii) Bulguları yorumlar.

Çözüm:

X 2'nin hesaplanması ve sonuçların çıkarılması için aşağıdaki adımlar izlenebilir:

Aşama 1:

Bazı teorik ya da hipotezler altında her bir durumda gözlemlenen frekanslara karşılık gelen beklenen frekansları (f e ) hesaplayın.

Örneğimizde teori eşit olasılıktadır (sıfır hipotezi). İkinci sırada boş hipotezde beklenecek cevapların dağılımı eşit olarak seçilmiştir.

Adım 2:

Her frekans için sapmaları (f o - f e ) hesaplayın. Bu farklılıkların her biri kareye bölünür ve bölünür (256/32, 64/32 ve 64/32).

Aşama 3:

Hesaplamak için bu değerleri ekleyin:

4. Adım:

Tablodaki serbestlik dereceleri df = (r - 1) (c - 1) formülünden (3 - 1) (2 - 1) veya 2 olarak hesaplanır.

Adım 5:

2 df için hesaplanan (kritik) değerleri belirli bir anlamlılık düzeyinde, genellikle% 5 veya% 1 olarak arayın.

Df = 2 ise, .01 seviyesinde anlamlı olan χ 2 değeri 9.21'dir (Tablo E). Elde edilen χ 2 değeri 12> 9.21.

ben. Bu nedenle, belirgin bir farklılık önemlidir.

ii. Boş hipotez reddedildi.

iii. Grubumuzun gerçekten öneriyi desteklediği sonucuna varıyoruz.

“Eşit cevap” hipotezini reddediyoruz ve grubumuzun önerisini desteklediği sonucuna varıyoruz.

Örnek 2:

Belirli bir toplulukta haftada bir otomobil kazası sayısı aşağıdaki gibidir:

12, 8, 20, 2, 14, 10, 15, 6, 9, 4

Bu sıklıklar, bu 10 haftalık dönemde kaza koşullarının aynı olduğu inancıyla uyuşuyor mu?

Çözüm:

Boş Hipotez - Verilen frekansların (belirli bir toplulukta haftada kaza sayısı) verilen sıklıkların, 10 haftalık sürede kaza koşullarının aynı olduğu inancıyla tutarlı olduğuna dair boş hipotezi ayarlayın.

10 haftanın üzerindeki toplam kaza sayısı:

12 + 8 + 20 + 2 + 14 + 10 + 15 + 6 + 9 + 4 = 100.

Boş hipotez altında, bu kazaların 10 haftalık süre boyunca eşit şekilde dağıtılması gerekir ve bu nedenle 10 haftanın her biri için beklenen kaza sayısı 100/10 = 10'dur.

Hesaplanan χ 2 = 26.6 değeri tablo değerinden daha büyük olduğundan, 21.666. Anlamlı ve sıfır hipotezi .01 anlamlılık düzeyinde reddedildi. Bu nedenle, kaza koşullarının 10 haftalık süre boyunca kesinlikle tek tip (aynı) olmadığı sonucuna varıyoruz.

2. Normal dağılım hipotezinde beklenen sonuçlardan gözlemlenen sonuçların farklılığının test edilmesi:

Hipotez, eşit derecede muhtemel olmak yerine normal dağılışı izleyebilir. Bir örnek, bu hipotezin ki-kare ile nasıl test edilebileceğini göstermektedir.

Örnek 3:

İki yüz satıcı, satış yöneticilerinin fikir birliği ile çok iyi, tatmin edici ve fakir olarak üç gruba ayrıldı.

Bu reyting dağılımı, normal olarak satıcı popülasyonumuzda satma kabiliyeti dağıtılırsa beklenenden önemli ölçüde farklı mıdır?

Satış yeteneğinin normal olarak dağıldığı hipotezini kurduk. Normal eğri - 3σ ila + 3σ aralığındadır. Eğer satış kabiliyeti normal dağılmışsa, taban çizgisi üç eşit bölüme ayrılabilir, yani

(+ 1σ ila + 3σ), (- 1σ ila + 1σ) ve (- 3σ ila - 1σ) sırasıyla iyi, tatmin edici ve zayıf satıcıları temsil eder. Tablo A'ya atıfta bulunarak vakaların% 16'sının + 1σ ile + 3σ arasında, -% 1 ile + 1σ arasında -% 68 ile - 3σ ile - 1σ arasında olduğunu; Problemimizde 200% 16 = 32 ve% 68 = 200 =% 68'dir.

df = 2. P, 0, 01'den küçük

Hesaplanan χ 2 = 72.76

Hesaplanan> 2 / 72.76> 9.21. Dolayısıyla P, 01'den daha azdır.

.˙. Gözlenen frekanslar ve beklenen frekanslar arasındaki tutarsızlık oldukça önemlidir. Bu temelde, bu gruptaki normal satış kabiliyeti dağılımının hipotezi reddedilmelidir. Dolayısıyla, derecelendirme dağılımının beklenenden farklı olduğu sonucuna varıyoruz.

3. Beklentilerimiz önceden belirlenmiş sonuçlara dayandığında Ki-kare testi:

Örnek 4:

Bezelye ıslahı üzerine bir deneyde bir araştırmacı aşağıdaki verileri elde etmiştir:

Teori, fasulyelerin oranını dört grupta tahmin ediyor, A, B, C ve D 9: 3: 3: 1 olmalı. 1.600 fasulye arasında yapılan bir deneyde, dört gruptaki sayılar 882, 313, 287 ve 118 idi. Deney sonuçları genetik teorisi destekliyor mu? (0, 05 düzeyinde test edin).

Çözüm:

Deneysel değerler ile teori arasında anlamlı bir fark olmadığı hipotezini kurguladık. Başka bir deyişle, teori ve deney arasında iyi bir yazışma vardır, yani teori deneyi destekler.

Hesaplanan χ 2 değeri 4.726 <7.81 olduğundan, anlamlı değildir. Dolayısıyla sıfır hipotezi .05 anlamlılık düzeyinde kabul edilebilir ve deney sonuçlarının genetik teoriyi desteklediği sonucuna varılabilir.

4. Tablo girdileri küçük olduğunda Ki-kare testi:

Tablo girişleri küçük olduğunda ve tablo 2 x 2 kat olduğunda, yani, df = 1, χ 2 süreklilik için bir düzeltme (Yates Düzeltmesi adı verilir) yapılmazsa önemli bir hataya maruz kalır.

Örnek 5:

Kırk fareye iki yol arasında seçim yapma imkanı verildi. 13 kişinin ışıklı yollar (yani daha fazla aydınlatmalı yollar) ve 27 kişinin karanlık yollar seçtiği tespit edildi.

(i) Aydınlatmanın farelerin rota tercihinde bir fark yaratmadığı hipotezini test edin (.05 düzeyinde test edin).

(ii) Farelerin karanlık yollara doğru tercih edilip edilmediğini test edin.

Çözüm:

Aydınlatma rota tercihlerinde bir fark yaratmazsa, yani H 0 doğruysa, orantılı tercih her rota için 1/2 olur (yani, 20).

Örneğimizde, aşağıdaki sebeplerden dolayı her bir (f o - f e ) farkından .5 çıkaracağız:

Veriler şu şekilde sıralanabilir:

2 x 2 katlama tablosundaki beklenen girdiler sorunumuzdakiyle aynı olduğunda, ki-kare formülü aşağıdaki gibi biraz daha kısa bir biçimde yazılabilir:

(i) .05 düzeyinde χ 2 kritik değeri 3.841'dir. 4.22 elde edilen 222, 3.841'den fazladır. Dolayısıyla sıfır hipotezi .05 düzeyinde reddedilir. Görünüşe göre aydınlık ya da karanlık, farelerin rota seçiminde bir faktördür.

(ii) Örneğimizde bir kuyruklu test yapmak zorundayız. Tablo E'ye girerken, 4.22'nin χ 2'sinin P = .043 olduğunu (enterpolasyonla) bulduk.

.˙. P / 2 = 0215 veya% 2. Başka bir deyişle, 100'de, böyle bir ayrışmanın meydana gelmesi ihtimalinin 2 şansı vardır.

Bu nedenle, farklılıkların 02 düzeyinde önemli olduğunu işaret ediyoruz.

Bu nedenle, farelerin karanlık yollar için bir tercihi olduğu sonucuna varıyoruz.

5. Acil durum tablolarında ki-kare bağımsızlık testi:

Bazen iki değişken veya özellik arasında bir ilişki (veya ilişkilendirme) olup olmadığını test etmemizi gerektiren durumlarla karşılaşabiliriz. Başka bir deyişle two 2, iki veya daha fazla kategoride sınıflandırılabilecek özellikler veya özellikler arasındaki ilişkiyi araştırmak istediğimizde yapılabilir.

Örneğin, babanın göz renginin oğulların göz rengiyle ilişkili olup olmadığını, ailenin sosyo-ekonomik durumunun eğitimin farklı markaların tercihine göre olup olmadığını test etmemiz gerekebilir. çift ​​ve aile büyüklüğü ile ilişkili olup, belirli bir aşının belirli bir hastalık üzerinde kontrol edici bir etkisi olup olmadığı vs.

Bir test yapmak için, beklenmedik durum tablosunun her bir hücresi için f (beklenen frekans) hesaplamak için bir beklenmedik durum tablosu hazırlıyoruz ve sonra formül kullanarak χ 2'yi hesaplıyoruz:

Sıfır hipotezi:

χ 2, iki özelliğin birbirinden bağımsız olduğu varsayımıyla hesaplanır, yani iki özellik arasında ilişki yoktur.

Bir hücrenin beklenen frekansının hesaplanması aşağıdaki gibidir:

Örnek 6:

2.000 aileden belirli bir örnekte 1.400 aile, 1236'nın Hindu aileleri ve 164'ün Hindu olmayan çay tüketicisidir.

600 aile, 564'ü Hindu ailesi, 36'sı Hindu olmayan çay tüketicisi değildir. Χ 2 kullanın - Hindu ve Hindu olmayan aileler arasında çay tüketimi arasında anlamlı bir fark olup olmadığını test edin ve belirtin.

Çözüm:

Yukarıdaki veriler, aşağıda belirtildiği gibi 2 x 2 beklenmedik durum tablosu şeklinde düzenlenebilir:

İki niteliğin, 'çay tüketiminin' ve 'toplumun' bağımsız olduğuna dair sıfır hipotezi (H 0 ) oluşturduk. Başka bir deyişle, Hindu ve Hindu olmayan aileler arasında çay tüketimi arasında anlamlı bir fark yoktur.

Χ 2, viz., 15.24 hesaplanan değerinin .01 anlamlılık düzeyinde χ 2 tablo değerinden çok daha büyük olması; χ 2 değeri oldukça önemlidir ve sıfır hipotezi reddedilir.

Bu nedenle, iki toplumun (Hindu ve Hindu Olmayan), aralarındaki çay tüketimine göre önemli ölçüde farklılık gösterdiği sonucuna varıyoruz.

Örnek 7:

Aşağıda verilen tablo, bir kolera salgını sırasında elde edilen verileri göstermektedir.

Kolera atağını önlemede aşılamanın etkinliğini test edin.

Çözüm:

İki niteliğin viz., Aşılama ve koleradan atak olmadığının ilişkili olmadığı null hipotezini (H 0 ) belirledik. Verilen tablodaki bu iki özellik bağımsızdır.

Hipotezimize dayanarak beklenen frekansları şu şekilde hesaplayabiliriz:

(F e ) 'nin hesaplanması:

1 df için yüzde 5 değer 3.8 2, 41 2 hesaplanan değerden çok daha az olan 3.841'dir. Bu nedenle, bunun ışığında, hipotezin yanlış olduğu, aşılanmanın ve koleradan atak olmaması ile ilişkili olduğu sonucuna varılmaktadır.

Ki-Kare Testinin Geçerliliği için Koşullar:

Aşağıdaki koşullar yerine getirildiğinde Ki-kare testi istatistiği kullanılabilir:

1. N, toplam frekans, 50 den daha büyük, oldukça büyük olmalıdır.

2. Örnek gözlemler bağımsız olmalıdır. Bu, hiçbir öğenin numuneye iki veya daha fazla dahil edilmemesi gerektiği anlamına gelir.

3. Varsa, hücre frekansları üzerindeki kısıtlamalar bef o = ∑f e = N gibi doğrusal olmalıdır (yani, frekansların kare ve daha yüksek güçlerini içermemelidir).

4. Hiçbir teorik frekans küçük olmamalıdır. Küçük, göreceli bir terimdir. Tercihen, her teorik frekans 10'dan büyük olmalı, fakat herhangi bir durumda 5'ten az olmamalıdır.

Herhangi bir teorik frekans 5'ten küçükse, χ 2 -test gibi uygulayamayız. Bu durumda, 5'ten küçük olan frekansları önceki veya sonraki frekansla (frekanslar) eklemek, böylece elde edilen toplamın 5'ten büyük olması ve serbestlik derecelerinin buna göre ayarlanması için oluşan “havuzlama” tekniğini kullanırız.

5. Verilen dağılım, göreceli frekans veya oranlarla değiştirilmemeli, veriler orijinal birimlerde verilmelidir.

6. Yates düzeltmesi, özel durumlarda df = 1 olduğunda (yani 2 x 2 tablolarda) ve hücre girişleri küçük olduğunda uygulanmalıdır.

7. χ 2 - Test çoğunlukla yönsüz bir test olarak kullanılır (yani iki kuyruklu bir test yaparız). Bununla birlikte, bir kuyruklu test yapmak için tests 2 test yapılabileceği durumlar olabilir.

Tek kuyruklu testte P değerini iki katına çıkarırız. Örneğin, df = 1 olduğunda, 05 düzeyinde χ 2'nin kritik değeri 2.706'dır (2.706, 10. seviye altında yazılan değerdir) ve kritik değeri; . 2, 01 düzeyinde 5.412'dir (değer .02 düzeyinin altına yazılmıştır).

Ki-Kare Testinin Katkı Maddesi:

χ 2, çok faydalı bir ekleme özelliğine sahiptir. Aynı alanda çok sayıda örnek çalışma yapıldıysa, gerçek konum hakkında doğru bir fikir edinmek için sonuçlar bir araya getirilebilir.

Belirli bir aşının belirli bir hastalığa karşı etkili olup olmadığını test etmek için on deney yapıldığını varsayalım. Şimdi burada on farklı χ 2 değere ve on farklı df değerine sahip olacağız.

Bir değer elde etmek için on χ 2 ekleyebiliriz ve benzer şekilde on df değeri de birlikte eklenebilir. Böylece bir χ 2 değerine ve bir serbestlik derecesine sahip olacağız. Şimdi tüm bu on deneyin sonuçlarını bir araya getirip P değerini öğrenebiliriz.

Belirli bir alanda beş bağımsız deney yapıldığını varsayalım. Her durumda bir df olduğunu ve aşağıdaki values2 değerlerinin alındığını varsayalım.

Şimdi% 5 anlamlılık düzeyinde (veya P - .05 için) bir df için χ 2 değeri 3.841'dir. Yukarıda verilen χ 2 ' nin hesaplanan değerlerinden, sadece bir kolaylıkta, yani, No. 3 deneyinin value 2' nin gözlenen değerinin, tablodaki 3.841 değerinden düşük olduğunu fark ettik.

Bu deney söz konusu olduğunda farkın önemsiz olduğu, ancak kalan dört durumda χ 2'nin hesaplanan değerinin 3.841'den fazla olduğu ve% 5 anlamlılık düzeyinde beklenen ve gerçek frekanslar arasındaki farkın anlamlı olduğu anlamına gelir. .

Tüm values 2 değerlerini eklersek (4.3 + 5.7 + 2.1 + 3.9 + 8.3) veya 24.3'ü alırız. Serbestlik derecelerinin toplamı 5'tir. Bu, 5 df için χ 2'nin hesaplanan değerinin 24, 3 olduğu anlamına gelir.

Χ 2 tablosuna bakarsak, 5 df için% 5 anlamlılık düzeyinde χ 2 değerinin 11.070 olduğunu göreceğiz. 24.3 olan χ 2'nin hesaplanan değeri, tablodaki değerden çok daha yüksektir ve böylece gözlemlenen ve beklenen frekanslar arasındaki farkın anlamlı olduğu sonucuna varabiliriz.

% 1 anlamlılık seviyesine ulaşsak bile (veya P = .01) χ 2 değerinin değeri sadece 15.086'dır. Bu nedenle, örnekleme dalgalanmalarının sonucu olarak .32 değerinin 24.3'e eşit veya daha fazla olması olasılığı, hatta .01'den çok daha düşüktür veya bir başka deyişle, fark önemlidir.

Chi-Test Uygulamaları:

Χ 2-en iyi istatistik uygulamaları aşağıda belirtildiği gibi tartışılabilir:

Beklentilerimiz eşit olasılık hipotezine dayandığında, gözlemlenen sonuçların beklenen sonuçlardan ayrılmasının test edilmesi.

2. Beklentiler normal dağılıma dayandığında Ki-kare testi.

3. Beklentilerimiz önceden belirlenmiş sonuçlara dayandığında Ki-kare testi.

4. Süreksizlik düzeltmesi ya da χ 2 hesaplanmasında Yates düzeltmesi.

5. Acil durum tablolarında ki-kare bağımsızlık testi.

Ki-Kare Testinin Kullanımı:

1. Test sıklıklar açısından yapılmasına rağmen, kavramsal olarak en iyi oranlar için bir test olarak görülebilir.

2. test 2 testi hipotez testinde kullanılır ve tahmin için faydalı değildir.

3. Ki-kare testi birkaç durumlu karmaşık acil durum tablosuna uygulanabilir.

4. Ki-kare testi çok faydalı bir özelliğe sahiptir, yani 'ek özellik'. Aynı alanda çok sayıda örnek çalışma yapılırsa, sonuçlar bir araya toplanabilir. Bu, χ 2 değerlerinin eklenebileceği anlamına gelir.