Ki-Kare Testi ile İlgili Çalışma Notları

Bu makale ki-kare testi ile ilgili bir çalışma notu sunmaktadır.

X 2 (Yunanca X X Ki-kare olarak telaffuz edilir) testi, ampirik olarak gözlemlenen frekansların, belirli bir teorik varsayımlar kümesi altında beklenebilecek olanlardan önemli ölçüde farklı olup olmadığını değerlendirmenin bir yöntemidir. Örneğin, siyasal tercih ve ikamet yeri veya doğuş yerinin çapraz sınıflandırıldığını ve verinin aşağıdaki 2 x 3 beklenmedik durum tablosunda özetlendiğini varsayalım.

Tabloda kent halkının oranlarının ülkedeki üç siyasi parti için 38/48 = 0.79, 20/46 = 0.34 ve 12/18 = 0.67 (iki dekara yuvarlanmış) olduğu görülmektedir. Daha sonra bu farklılıkların istatistiksel olarak anlamlı olup olmadığını bilmek isteriz.

Bu amaçla, üç siyasi parti arasında doğuş bakımından hiçbir fark olmadığını varsayan boş bir hipotez önerebiliriz. Bu, kentsel ve kırsal nüfusun oranlarının üç siyasi partinin her biri için aynı olması beklendiği anlamına geliyor.

Boş hipotezin doğru olduğu varsayımına dayanarak, bu marjinal toplamlar göz önüne alındığında beklenebilecek bir dizi frekansı hesaplayabiliriz. Başka bir deyişle, yukarıdaki varsayım temelinde kentlilerin olmasını beklediğimiz Kongre partisini tercih eden kişi sayısını hesaplayabilir ve bu rakamı gerçekte gözlemlenenle karşılaştırabiliriz.

Eğer boş hipotez doğruysa, ortak bir oranı şöyle hesaplayabiliriz:

38 + 20 + 12/48 + 46 + 18 = 70/112 = 0, 625

Bu tahmin edilen oranla, 48 x (0.625) = Kongreye bağlı 30 kişi, 46 x (0.625) = 28.75, Janata Partisi'ne bağlı 18 kişi ve Lok Dal'a bağlı 18 x (0.625) = 11.25 kişi bekleyebiliriz. kentliler. Bu rakamları üç numunenin ilgili boyutlarından ilgili gözlenen rakamlardan çıkarırken, Kongre'ye bağlı 48 - 30 = 18, Janata'ya bağlı 46 - 28.75 = 17.25 ve 42 kişiden Lok Dal'a bağlı 18 - 11.25 = 6.25 kişi bulduk Kırsal alanlardan.

Bu sonuçlar, beklenen frekansların ar olduğu aşağıdaki tabloda gösterilmiştir. parantez içinde gösterilmiştir.

Boş hipotezin uygulanabilirliğini test etmek için beklenen ve gözlenen frekansları karşılaştırıyoruz. Karşılaştırma, aşağıdaki X 2 istatistiklerine dayanmaktadır.

X2 = Σ (O - E) 2 / E

O, gözlemlenen frekansları ve beklenen frekansları için E'yi gösterir.

Serbestlik Derecesi :

Serbestlik derecelerinin sayısı, bir beklenmedik durum tablosunda bize uygulanan bağımsız kısıtlamaların sayısı anlamına gelir.

Aşağıdaki örnek kavramı gösterecektir:

A ve B'nin iki özelliğinin bağımsız olduğunu varsayalım.

Beklenen frekans veya AB hücresi 40 x 30/60 = 20 olacaktır. Bu tanımlandığında, kalan üç hücrenin frekansları otomatik olarak sabitlenir. Bu nedenle, hücre için αB beklenen frekans 40 - 20 = 20, benzer şekilde AB hücresi için 30 - 20 = 10 olmalı ve αB için 10 olmalıdır.

Bu, 2 × 2 masa için, sadece üç seçeneğimizde özgürlüğümüz olmadığı halde, tek bir seçeneğimiz var. Böylece, serbestlik dereceleri (df) aşağıdaki formülle hesaplanabilir:

df - (c - 1) (r - 1)

df serbestlik derecelerini, sütun sayısını c, satır sayısını da r.

Böylece, 2 x 3 tabloda (Tablo 18.54)

df = (3 - 1) (2 - 1) = 2 x 1 = 2

Önem Seviyesi :

Daha önce belirtildiği gibi ki-kare testi, gözlemlenen ve beklenen frekanslar arasındaki farkın, örnekleme dalgalanmalarından mı kaynaklandığını ve önemsiz mi yoksa aksine mi olduğunu, farkın başka bir nedenden dolayı ve önemli olup olmadığını incelemek için kullanılır.

Farkın anlamlı olduğu çıkarımını yapmadan önce araştırmacılar, Ho'ya alternatif olarak oluşturulan araştırma hipoteziyle (H1) zıt olarak sıklıkla boş bir hipotez (Ho olarak sembolize edilmiş) olarak adlandırılan bir hipotez oluştururlar.

Genellikle, her zaman olmasa da, boş hipotez birkaç grup arasında bir fark olmadığını ya da değişkenler arasında bir ilişki olmadığını belirtirken, araştırma hipotezi ya olumlu ya da olumsuz bir ilişkiyi öngörebilir.

Başka bir deyişle, boş hipotez, örnekleme dışı hataların bulunmadığını ve farkın yalnızca şansa bağlı olduğunu varsayar. Daha sonra böyle bir farkın ortaya çıkma olasılığı belirlenir.

Olasılık, çizilen çıkarıma dayanabileceğimiz güven derecesini gösterir. Ki-kare'nin tablo değerleri çeşitli olasılık seviyelerinde mevcuttur. Bu seviyelere anlamlılık seviyeleri denir. Tablodan ki-kare değerlerini belli anlamlılık düzeylerinde öğrenebiliriz.

Genellikle (sosyal bilimler probleminde), verilen serbestlik derecelerinden ki-kare değeri 0, 05 veya 0, 01 düzeyindeki değer tablodan görülür ve gözlenen ki-kare değeri ile karşılaştırılır. Gözlenen değer veya y1, 0.05'teki tablo değerinden fazlaysa, farkın anlamlı olduğu anlamına gelir.

Serbestlik derecesi :

Ki-kare testini kullanmak için bir sonraki adım, serbestlik derecelerini hesaplamaktır: Şekil 1'deki gibi 2 x 2 acil durum tablosunun olduğunu varsayalım.

Satır ve sütun toplamının rt1 ve rt2 - ve ct1 ve ct2 olduğunu biliyoruz. Serbestlik derecelerinin sayısı, serbestçe belirleyebileceğimiz hücre-değerlerin sayısı olarak tanımlanabilir.

Şekil 1'de, bir satır 1 değerini (şekilde kontrol edilerek belirtilir) belirledikten sonra, o satırdaki ikinci değer ve ikinci satırın değerleri (X ile gösterilir) zaten belirlenir; bunları belirtmekte özgür değiliz çünkü satır toplamlarını ve sütun toplamlarını biliyoruz. Bu, 2 x 2 beklenmedik durum tablosunda yalnızca bir değer belirtmekte özgür olduğumuzu göstermektedir.

Prosedür :

Ki-kare için hesaplama:

Uygunluk Testi Olarak Ki-Kare:

Önceki bölümde ki-kare'yi bağımsızlık testi olarak kullandık; Bu, boş bir hipotezi kabul etmek veya reddetmektir. X ~ testleri, gözlemlenen bir frekans dağılımı ve teorik bir frekans dağılımı arasında anlamlı bir fark olup olmadığına karar vermek için de kullanılabilir.

Bu şekilde, uyumun gözlenen ve beklenen frekansların ne kadar iyi olduğunu belirleyebiliriz. Diğer bir deyişle, gözlemlenen frekansların eğrisi beklenen frekansların eğrisine süper uygulandığı zaman, gözlemlenen ve beklenen veriler arasında anlamlı bir farklılık yoksa, uyum iyi kabul edilecektir.

Bununla birlikte, hücrelerdeki oranlar değişmeden kalsa bile ki-kare değerinin doğrudan toplam vaka sayısına (N) bağlı olduğunu hatırlamalıyız. Vaka sayısını iki katına çıkarırsak, ki kare değeri iki katına çıkar; Eğer dava sayısını üçe katlarsak, ki kare kare vb.

Bu gerçeğin sonuçları aşağıda verilen bir örnekle gösterilebilir:

Bu örnekte ki-kare değeri 3, 15'tir. Bu temelde, doğal olarak ilişkinin anlamlı olmadığı sonucuna varırız.

Şimdi, 500 sonuçla ilgili verilerin şu sonuçlarla toplandığını varsayalım:

Şekillerden hesaplanan Ki-kare değeri, şimdi önceki örnekte elde edilen değerin iki katı olan 6.30'dur. 6.30 değeri istatistiksel olarak anlamlıdır. Sonuçları yüzdelerle ifade etmiş olsaydık, yorumda bir fark olmazdı.

Yukarıdaki örnekler, ki-kare'nin N ile doğru orantılı olduğu çok önemli bir noktayı göstermektedir. Dolayısıyla, sadece vaka sayısındaki bir değişiklikten etkilenmeyen bir ölçüme ihtiyacımız olacaktır. Ölçü phi (measure) bu tesisi, yani ölçüsümüzde arzu ettiğimiz mülkü verir. Bu ölçü basit ki ki-kare değeri ile çalışılan olguların sayısal toplamı arasındaki bir orandır.

Ölçü phi (ø) şöyle tanımlanır:

Ø = √x 2 / n

yani, ki-kare'nin karekökü vaka sayısına bölünür.

Böylece, bu formülü, yukarıda belirtilen iki örneğe uygulayarak, ilk örnekte, aldığımız:

Böylece, ki-kareden farklı olarak ø ölçüsü, karşılaştırılabilir hücrelerdeki oranlar aynı olduğunda aynı sonucu verir.

G. Udny Yule, genellikle içinde ortaklığı ölçen “Q” (daha yaygın olarak Yule'nin Q'su olarak bilinir) olarak adlandırılan başka bir ilişkilendirme katsayısı önermiştir. x 2 masa. Birleşme katsayısı (Q), eğer 2x2 tablonun hücreleri aşağıdaki tabloda belirtildiği gibi belirlenmişse, fark ile diyagonal hücrelerin çapraz ürünlerinin toplamı arasındaki oran hesaplanarak elde edilir:

acbc / ad + be

a, b, c ve d hücre frekanslarına atıfta bulunur.

Birleşme katsayısı (Q) eksi bir ile artı bir (+1) arasında, reklamdan küçük veya büyük olduğu için değişir. Hücrelerden herhangi biri sıfır olduğunda Q, +1 sınırlarına ulaşır, yani ilişkilendirme tamamlanır (korelasyon mükemmeldir). Değişkenler bağımsız olduğunda (yani, bir ilişkilendirme olmadığında) Q, yani reklam olduğunda sıfırdır. = ve ol. Q = 0.

Yukarıdaki formülün uygulanması aşağıdaki örnekte gösterilmektedir:

Aşağıdaki tabloda sunulan verilere dayanarak Yule'nin Medeni Hal ile Medeni Hal ve Muayenedeki Performans Arasındaki Katsayılarını Hesaplayalım:

Yule'nin formülündeki yukarıdaki değerleri değiştirerek:

Bu nedenle, medeni durumla sınavdaki performans arasında hafif bir negatif ilişki vardır.

Soruna başka bir açıdan da bakabiliriz.

Başarısız olan evli öğrencilerin yüzdesi = 60 × 100/150 = 40.

Başarısız olan bekar öğrencilerin yüzdesi, = 100 × 100/350 = 28, 57'dir (Yaklaşık).

Böylece evli öğrencilerin yüzde 40'ı ve evlenmemiş öğrencilerin yaklaşık yüzde 29'u sınavda başarısız oldu. Bu nedenle, öğrencilerin düşük performansları medeni duruma bağlanabilir.

Nedensel çıkarımlar deneysel durumlarda çok güvenli bir şekilde sağlanabilir. Deneysel tasarımlarla uğraşırken bu konuyu dikkate aldık. Sosyal bilimlerde, bir deney oluşturmak çok zordur, bu yüzden çalışmaların çoğu deneysel değildir. Bununla birlikte, analitik prosedürler, deneysel olmayan çalışmalarda nedensel ilişkiler hakkında çıkarımlar yapmak için tasarlanmıştır.

Çoğu sosyal araştırma, “nüfustan” alınan örneklerin incelenmesini içerdiği ve bu “nüfusa” yönelik genellemeler çıkarmaya çalıştığı sürece, bu genellemelerin ne ölçüde çizildiğini bilmek, bilime göre gereklidir. haklı.

Diyelim ki, kız ve erkek öğrencilerin örnekleri üzerinde yapılan bir çalışmada, sonuçların iki örnek arasında çalışmalara ayırdıkları saat sayısı bakımından önemli farklılıklar gösterdiğini varsayalım.

Gözlemlenen farklılıkların erkek ve kız öğrenciler arasındaki gerçek farklılıkları yansıtıp yansıtmadığını veya öğrencilerin iki “popülasyonunun” aslında çalışmalara harcadıkları saat, ancak bu “popülasyonlardan” alınan örneklerle aynı olup olmadığını sorabiliriz. çünkü çalışma bu dereceye kadar 'şans' ile farklılaşmış olabilir.

Bu tür bir soruyu olasılık ifadeleri bağlamında cevaplamamızı sağlayacak bir dizi istatistiksel prosedür tasarlanmıştır.

Örnekleri karşılaştırırken ya da deney ve kontrol grupları arasındaki farkı incelerken, normalde çalışılan örnekler tarafından temsil edilen 'popülasyonlar' arasındaki gerçek farkın doğası hakkındaki bazı hipotezleri test etmek istiyoruz.

Sosyal bilimlerde, genellikle göreceli olarak ham hipotezi ile ilgileniriz (örneğin, kız öğrenciler çalışmalarına erkek öğrencilere göre daha fazla zaman ayırırlar).

Genellikle daha spesifik veya kesin bir hipotez göz önünde bulundurma konumunda değiliz (örneğin, iki “nüfus” arasındaki farkı tam olarak belirten). Verilerimiz, kız öğrenci örnekleminin çalışmalara ortalama dört saat ayırdığını, erkek öğrenci örnekleminin ise sadece iki saat ayırdığını göstermektedir.

Açıkçası, örneklerimizin bulguları hipotez ile uyumludur, yani, kız öğrenciler çalışmalarına erkek meslektaşlarından daha fazla zaman ayırmaktadır. Ancak, örneklerimizi temel alan bulguların, elde edebileceğimiz bulgularla tam olarak aynı olamayabileceği ihtimalini sürekli olarak aklımızda tutmalıyız.

Şimdi, kız öğrenciler arasında yapılan çalışmalara daha fazla zaman harcadığımızı tahmin etmek istiyoruz, toplam 'nüfusu' incelemiş miydik. 'Boş hipotezi' test edersek böyle bir tahmin mümkündür.

'Boş hipotez', 'popülasyonların' incelenen özellikler açısından farklı olmadığını belirtir. Bu durumda, 'boş bir hipotez', bir bütün olarak öğrencilerin daha geniş bir popülasyonunda, kadın ve erkek öğrencilerin alt gruplarının, çalışmalarına ayırdıkları zaman bakımından farklılık göstermediğini belirtir.

Önemlilik denilen çeşitli istatistiksel teknikler, iki örneğimizin erkeklerin birbiriyle ilişkili iki popülasyonu arasında bir fark olmasa bile, tesadüfen, yaptıkları ölçüde farklılık gösterme ihtimalini tahmin etmemize yardımcı olacak şekilde geliştirilmiştir. ve zamanla ilgili kız öğrenciler çalışmalara ayrılmıştır.

Çeşitli test önemi yöntemleri arasında, belirli bir çalışma için hangi yöntemin uygun olacağına karar verilmesi, kullanılan ölçümlerin niteliğine ve özelliklerin dağılımına (örneğin çalışma saatleri, çocuk sayısı, maaş beklentileri vb.) Bağlıdır. ).

Bu anlamlılık testlerinin çoğu, ölçümlerin aralık ölçeğini oluşturduğunu ve karakteristik dağılımının normal bir eğriye yaklaştığını varsaymaktadır. Sosyal araştırmalarda, bu varsayımlar nadiren gerçeğe karşılık gelir. Bununla birlikte, son istatistiksel gelişmeler, bu varsayımlara dayanmayan parametrik olmayan testler biçiminde buna bir tür çözüm getirmiştir.

Bu noktada, “boş hipotezi” nin, iki “nüfus” arasında bir fark olduğunu belirten bir hipotezi (çağrıldığı gibi alternatif hipotez) test ederken, asıl ilgi alanımızın test edilmesinin nedenini anlamaya çalışmalıyız. örnekler ile temsil edilir.

Nedeni takdir etmek kolaydır. “Nüfus” ta gerçek tabloyu bilmediğimizden, yapabileceğimizin en iyisi, örneklememize dayanarak bu konuda çıkarımlar yapmaktır.

İki örneği karşılaştırıyorsak, elbette, iki olasılık vardır:

(1) Ya örnekle temsil edilen popülasyonlar aynı veya

(2) Farklılar.

İki 'popülasyondan' örneklerimiz bazı özellikler bakımından farklıdır; Örneğimizdeki çalışmalara adanmış saatler. Açıkçası, örneklerin temsil ettiği iki 'popülasyon' aslında söz konusu özellik açısından farklılık gösterirse, bu olabilir.

Bununla birlikte, bu, bu “popülasyonların” farklı olduğuna dair kesin bir kanıt oluşturmaz, çünkü numunelerin her zaman temsil etmek istedikleri “popülasyonlara” tam olarak uymadığı olasılığı vardır.

Bu nedenle, örneklem seçiminde yer alan şans unsurunun bize çizdikleri birbirinden farklı örnekler vermiş olabileceği ihtimaline yer vermeliyiz, ancak çekildikleri iki “nüfus” aslında farklı değildir.

Bu nedenle sormak isteyebileceğimiz soru şudur:

“Alındıkları“ popülasyonlar ”farklı olmasa bile, birbirlerinden farklı örnekleri alabiliyor muyuz?” Bu kesin bir “boş hipotez” cevabını veren sorudur.

'Boş hipotez', bu ölçüde farklı olan iki örneğin aslında aynı olan iki 'popülasyondan' alınabileceği ihtimalini tahmin etmemize yardımcı olur. 100'de 1? ya da her neyse.

İstatistiksel anlamlılık testi, bu ölçüde farklılık gösteren iki örneğin aslında benzer olan 'popülasyonlardan' alınabileceğinin imkansız olduğunu gösteriyorsa, iki 'popülasyonun' muhtemelen birbirinden farklı olduğu sonucuna varabiliriz.

Burada akılda tutulması gereken bir nokta, tüm istatistiksel anlamlılık testlerinin ve dolayısıyla numunelerden popülasyonlara tüm genellemelerin, numunelerin çizim sürecine önyargı girebilecek şekilde seçilmediği varsayımına dayanmasıdır.

Başka bir deyişle, seçtiğimiz örneğin 'popülasyondaki' tüm vaka veya öğelerin numuneye dahil olma konusunda eşit veya belirtilebilir bir şansı olacak şekilde çizildiği varsayılmaktadır.

Bu varsayım gerekçelendirilmezse, anlamlılık testleri anlamsız ve uygulanabilir değildir. Başka bir deyişle, anlamlılık testleri yalnızca örneklemede olasılık ilkesi kullanıldığında uygulanır.

İllüstrasyonumuza dönersek, bulgularımızın iki örnek arasında bir fark göstermediğini varsayalım: bu, örneklemimizdeki hem kız hem de erkek öğrencilerin çalışmalarına eşit zaman ayırdıkları anlamına gelir.

Daha sonra, erkek ve kız öğrencilerin iki “popülasyonunun” bu nitelik bakımından benzer olduğunu söyleyebilir miyiz? Elbette, bunu kesin olarak söyleyemeyiz, çünkü popülasyonlar gerçekte farklılık gösterdiğinde örneklerin aynı olması ihtimali vardır.

Ancak, iki numunenin farklı olduğu duruma geri dönmek için, 'boş hipotezi' reddedebilirsek temsil ettikleri iki popülasyonun muhtemelen farklı olduğunu doğrulayabiliriz; Diğer bir deyişle, iki örnek arasındaki farkın yukarıdaki 'popülasyonlar' farklı olmadığında ortaya çıkma ihtimalinin düşük olduğunu gösterebilirsek.

Fakat yine de, 'boş hipotezi' reddetmekte yanlış olma ihtimalimiz var, çünkü yüksek oranda olanaksız olayların bile gerçekleşmesi ihtimali doğasında.

Bunun da başka bir tarafı var. Tıpkı 'boş hipotezi' reddetmekte yanlış olabileceğimiz gibi, 'boş hipotezi' kabul etmekte yanlış olabiliriz. Yani, istatistiksel anlamlılık testimiz, 'popülasyonlar' benzer olsa bile, örnek farklılıklarının tesadüfen kolayca ortaya çıkabileceğini gösterse bile, yine de, 'popülasyonların' aslında farklı olduğu doğru olabilir.

Başka bir deyişle, iki hata türünden herhangi birini yapma riskiyle karşı karşıyayız:

(1) Gerçekte doğru olduğunda “boş hipotezi” ni reddedebiliriz.

(2) “Yanlış hipotezi” ni aslında yanlış olduğu zaman kabul edebiliriz.

İlk tip hatayı, Tip I hatayı çağırabiliriz. Bu, iki popülasyonun aslında aynı olduklarında farklılık gösterdiğinin anlaşılmasından ibarettir.

İkinci hata tipi Tip II hatası olarak adlandırılabilir. Bu, iki popülasyonun aslında farklı olduklarında aynı olduklarının anlaşılmasından ibarettir.

Tip I hata yapma riski, istatistiksel testlerimizde kabul etmeye hazır olduğumuz önem seviyesine göre belirlenir, örneğin, 0.05, 0.01, 0.001, vb. (100'de 5, 100'de 1 ve 1000'de 1 Dolayısıyla, örneğin, bir anlamlılık testi, iki örnek arasındaki farkın 100'de 5 kereden fazla olmamak üzere tesadüfen oluşması beklendiğini gösterdiğinde, popülasyonların gerçekten farklı olduğuna karar verirsek.

Bu, örneklemle temsil edilen iki “popülasyon” aslında aynıysa (belirli bir nitelik açısından), o zaman 100'de 5'ini 'boş hipotezi' reddetmekte yanlıĢ olacağımıza göre kabul ediyoruz. Elbette, boş hipotezi reddetme ölçütümüzü daha katı ve sıkı hale getirerek ölçütümüzü yaparak Tip I hata yapma riskini en aza indirebiliriz.

Örneğin, 0.01'deki anlamlılık seviyesine karar verebiliriz, yani 'boş hipotezi' ancak iki testteki iki örnek arasındaki farkın yalnızca yüzlerce kez tesadüfen ortaya çıkabileceğini göstermesi durumunda reddederiz.

Temel olarak, söylediğimiz şey, eğer testin ilgili 'popülasyonlardan' seçilen belirli bir büyüklükteki yüz örnekten birinin, olasılık ilkesini kullanarak belirttiğini gösterirse 'boş hipotezi'ni reddedeceğimizdir. Nitelikler açısından bu, incelenen iki örnekte görülmektedir.

'Boş hipotezi' reddetme kriteri, önem seviyesini daha da artırarak daha da kesinleştirilebilir. Ancak buradaki zorluk, Tip I ve Tip II'nin hatalarının birbirimizle o kadar ilişkili hale gelmesidir ki, kendimizi bir Tip I hata yapmaya karşı korudukça, bir Tip II hata yapmayı daha savunmasız bırakıyoruz.

Yapmaya istekli olduğumuz tip I hata riskinin derecesini belirledikten sonra, Tip II hata olasılığını azaltmanın tek yolu daha büyük numuneler almak ve mümkün olan en fazla bilgiyi en iyi şekilde kullanan istatistiksel testleri kullanmaktır.

Tip II hataya ilişkin durum, “açılış karakteristiği eğrisi” ile çok kesin bir şekilde gösterilebilir . Bu eğrinin davranışı, numunenin büyüklüğüne bağlıdır. Örnek büyüdükçe, daha az muhtemel olması, gerçeklik durumundan oldukça uzakta olan bir durum olduğunu öne süren bir hipotezi kabul edeceğimizdir.

Tip I ve Tip II hataları arasındaki ilişki ters olduğu sürece, iki risk türü arasında makul bir denge kurulması gerekir.

Sosyal bilimlerde, testler örnekler arasındaki farkın 100 üzerinden 5 kattan daha fazla şans eseri meydana gelmeyeceğini gösterdiğinde 'boş hipotezi' reddetmek neredeyse kesinleşmiş bir uygulama ya da kongre haline gelmiştir. başka bir makul rehber değildir.

İki tür hata arasındaki dengenin nasıl sağlanacağına dair karar araştırmacı tarafından verilmelidir. Bazı durumlarda, yanlış olduğunda bir hipotezi reddetmekten emin olmak, doğru olduğunda kabul etmemek yerine daha önemlidir. Diğer durumlarda, tersi doğru olabilir.

Örneğin, bazı ülkelerde, yanlış olduğu zaman suçluluk hipotezini reddetmek, doğru olduğunda bu hipotezi kabul etmemek yerine, yani bir kişi makul bir şüphe olduğu sürece suçlu sayılmaz. suçu hakkında. Diğer bazı ülkelerde, bir suçla suçlanan kişi, suçluluk eksikliğini gösterdiği zamana kadar suçlu kabul edilir.

Elbette, birçok araştırmada, bir Tip I veya Tip II hatasının daha maliyetli olup olmadığına karar vermek için net bir temel yoktur ve bu nedenle araştırmacı, istatistiksel önemi belirlemede geleneksel seviyeyi kullanır. Ancak, bir hata türünün açıkça diğerinden daha maliyetli ve zararlı olacağı bazı çalışmalar olabilir.

Bir kuruluşta, yeni bir iş bölümü metodunun daha etkili olacağını ve bu yöntemin çok fazla masraf gerektireceğini varsayalım.

Bir deney grubu, diğeri kontrol grubu olarak çalışan iki personel grubundan oluşan bir deney varsa, yeni yöntemin örgütsel hedefler için gerçekten yararlı olup olmadığını ve yeni yöntemin işe yarayıp yamayacağını tahmin etmek için kurulmuşsa Çok fazla harcama yapıldığında, kuruluş, üstünlüğüne dair önemli bir güvence olmadıkça, bunu benimsemek istemeyecekti.

Başka bir deyişle, bir Tip 1 hatası yapmak pahalıya mal olur, yani yeni yöntemin aslında böyle olmadığı zaman daha iyi olduğu sonucuna varılır.

Yeni yöntemin, eski yöntemle aynı olan harcamaları içermesi durumunda, II tipi hata istenmez ve daha zarar verici olacaktır, çünkü yönetimin yeni yöntemi gerçekten üstün olduğunda benimsemesinde başarısızlığa yol açabilir. Bu nedenle organizasyon için mağazalarda uzun vadeli faydalar vardır.

Örneklemden 'popülasyona' genellemeler basitçe istatistiksel bir olasılık ifadesidir. Diyelim ki, 0.05 anlamlılık düzeyinde çalışmaya karar verdik. Bu, "sıfır hipotezi" ni yalnızca, gözlemlediğimiz büyüklükteki örnek farkının 100'de 5 kereden fazla olmayan bir şansla gerçekleşmesi beklenebileceği takdirde reddedeceğimiz anlamına gelir.

Elbette, böyle bir farkın 100 üzerinden 5 kezden daha fazla tesadüfen meydana gelmesi bekleniyorsa, 'boş hipotezi' kabul edeceğiz. Şimdi soru şudur: Bulgularımız, böyle bir farkın olabileceği 5 zamandan birini temsil ediyor mu? tesadüfen ortaya çıktı?

Bu soru, yalıtılmış bir bulgu temelinde kesin olarak cevaplanamaz. Bununla birlikte, bulgularımızdaki kalıpları incelerken, bunun hakkında bir şeyler söylememiz mümkün olabilir.

Bir filmin belirli bir hükümet programına yönelik tutumları üzerindeki etkilerini test etmekle ilgilendiğimizi varsayalım, aile planlaması. Diyelim ki, deneme için istenen koşulları maksimumda tutmaya özen gösterdik.

Şimdi, programa yönelik tutumların bir ölçüsü olarak kullandığımızı varsayalım, yalnızca bir maddeyi, yani çocukları ayırmaya yönelik tutumu kullanın ve filmi görenlerin bu konuya karşı filmi görmeyenlere göre daha olumlu bir eğilim gösterdiğini anlayın.

Şimdi farz edelim ki, istatistiksel test, farkın yirmi yılda bir defadan fazla rastgele örnekleme dalgalanmaları nedeniyle tesadüfen ortaya çıkmayacağını göstermiştir. Mantıksal olarak, aynı zamanda yirmi bir kez (veya 100'de 5 kez) tesadüfen ortaya çıkabileceği anlamına gelir. Belirttiğimiz gibi, örneğimizin 100'de beş arasında olup olmadığını bilmenin kesin bir yolu yok. Şimdi ne yapabiliriz?

Diyelim ki, aile refahı hükümet programına yönelik tutumun makul bir göstergesi olan katılımcılara 40 farklı soru sorduk. % 5'lik bir güven seviyesi kullanıyorsak ve 100 soru sorduğumuzda, bunlardan 5'inde şansa bağlı istatistiksel olarak anlamlı farklılıklar bulmayı bekleyebiliriz.

Bu nedenle, çeşitli maddeler hakkındaki 40 sorudan 2 tanesinde istatistiksel olarak anlamlı farklar bulmayı bekleyebiliriz. Ancak, filmi görenlere ilişkin 40 sorudan 25'inde, filmi görmeyenlere kıyasla daha olumlu tutumlar olduğunu varsayalım.

Durum böyle olunca, tutumlarda gerçek bir fark olduğu sonucuna varmakta kendimizi daha güvende hissedebiliriz (istatistiksel test farkın her soruda 100'de 5 kez tesadüfen ortaya çıkabileceğini gösterse de).

Şimdi, 40 sorudan sadece bir tanesine, yani çocukların aralığına ilişkin tepkilerin, filme maruz kalan ve olmayanlar arasında istatistiksel olarak anlamlı bir fark gösterdiğini varsayalım. Bu fark tesadüfen de olmuş olabilir.

Öte yandan, filmin içeriğinin aslında bu konudaki görüşlerini etkilediği, ancak başka herhangi bir şeyde (sterilite işlemleriyle ilgili olanlar gibi) etkisi olduğu olabilir. Ancak, hipotezimiz, filmin çocukların aralığına yönelik tutumlarını diğer 39 sorudan herhangi birine karşı olan tutumlardan daha fazla etkileyebileceğini önceden öngörmediği sürece, bu yorumu yapma konusunda haklı değiliz.

Bu tür bir yorum, yani bulguları ortaya çıktıktan sonra açıklamaya çağrılan kişi, 'durumdan sonraki' yorumlama olarak bilinir, çünkü bu, bulguları ne olursa olsun doğrulamak için verilen açıklamaları içerir. Bu bulguları haklı çıkarmak için hangi açıklamayı yapabileceği konusunda araştırmacının marifetine bağlıdır. Bu nedenle, zıt bulguları bile haklı gösterebilir.

Merton çok açık bir şekilde, post-gerçeklik yorumlarının gözlemleri “açıklamak” için tasarlandığını belirtti. Bilgi sonrası açıklama yöntemi tamamen esnektir. Araştırmacı, işsizlerin daha önce olduğundan daha az kitap okuma eğiliminde olduğunu tespit ederse, işsizliğin neden olduğu kaygının yoğunlaşmayı etkilediğinin ve bu nedenle okumanın zorlaştığı hipotezi ile "açıklanabilir".

Bununla birlikte, işsizlerin öncekinden daha fazla kitap okuduğu görülürse (istihdamda iken), yeni bir post-postum açıklama yapılabilir; Bunun açıklaması, işsizlerin daha fazla boş zamanları olduğu ve bu nedenle daha fazla kitap okuduklarıdır.

Elde edilen bir ilişki (değişkenler arasında) üzerine yapılan eleştirel test, post-posizyon gerekçeleri ve bununla ilgili açıklama değildir; daha ziyade, onu tahmin etme ya da buna dayanarak diğer ilişkileri tahmin etme yeteneğidir. Bu nedenle, önceden tahmin edilemeyen ve istatistiksel olarak anlamlı olsa da, çocukların aralıklarına yönelik tutumlarda bir fark bulunmadığımızı bulduk, yaptığımız çalışma tarafından belirlenmiş sayılmaz.

İstatistiksel ifadeler olasılık ifadesi olduğundan, bir hipotezi doğru olarak kabul edip etmeyeceğimize karar vermek için yalnızca istatistiksel kanıtlara asla tamamen güvenemeyiz.

Bir araştırma sonucunun yorumlanmasındaki güven, sadece bulgunun güvenilirliğine ilişkin istatistiksel güveni gerektirmez (yani farklılıkların tesadüfen oluşma olasılığı yoktur), ayrıca, araştırmanın ön kabullerinin geçerliliği hakkında bazı kanıtlar gerektirir.

Bu delil mutlaka dolaylıdır. Verilen araştırma bulgularının zaman testine dayanan ve bu nedenle önemli güvencenin olduğu diğer bilgilerle uyumundan gelir.

En titizlikle kontrol edilen soruşturmada bile, bir kişinin sonuçlarının yorumlanmasında veya nedensel ilişkilerin belirlenmesinde güvenin oluşturulması araştırmanın tekrarlanmasını ve bulguların diğer çalışmaların sonuçlarına ilişkilendirilmesini gerektirir.

İstatistiksel testler ve bir dizi çalışmanın bulguları, iki grup arasında tutarlı bir fark olduğu veya iki değişken arasındaki tutarlı bir ilişki olduğunu öne sürse bile, bu hala ilişkinin nedeninin kanıtını teşkil etmediğini belirtmek gerekir.

Nedensel çıkarımlar yapmak istiyorsak (örneğin, X Y üretir), bir ilişkinin varlığını oluşturmak için gerekli olanların üstünde ve üstünde varsayımları yerine getirmeliyiz. Ayrıca, sonucun sadece istatistiksel olarak önemli olması nedeniyle sosyal veya psikolojik olarak anlamlı olmadığı not edilmeye değerdir. İstatistiksel olarak anlamlı birçok farklılık, pratik sosyal bakışta önemsiz olabilir.

Örneğin, kentsel ve kırsal insanlar arasında bir IQ noktasından daha düşük bir ortalama fark istatistiksel olarak anlamlı olabilir, ancak pratik günlük yaşamda bu kadar önemli olmayabilir. Aksine, küçük ama güvenilir bir farkın büyük pratik önemi olduğu durumlar vardır.

Örneğin, büyük çaplı bir ankette, yüzde yarım veya bir fark, yüz binlerce kişiyi temsil edebilir ve farkın farkındalığı, önemli politika kararları için önemli olabilir. Bu nedenle araştırmacı, bulgularının istatistiksel önemi ile ilgilenmenin yanı sıra sosyal ve psikolojik anlamlarıyla da ilgilenmelidir.

Nedensel İlişkiler Çıkarımı:

Belirgin zorluklar nedeniyle, bu tür katı deneysel tasarımlar, sosyal bilimsel araştırmalarda nadiren kullanılabilir. Sosyal bilimlerde yapılan araştırmaların çoğu karakter bakımından deneysel değildir.

Bu tür çalışmalarda, değişkenler arasındaki ilişkinin nedensel olup olmadığını belirleme yolunda bazı ampirik engeller vardır. Sosyal davranış verilerinin analizinde en zor görevlerden birinin sebep-sonuç ilişkilerinin kurulması olduğu defalarca dile getirilmiştir.

Sorunlu bir durum, kökenine ve olma sürecine, sadece bir faktöre değil, çeşitli faktör ve sekansların kompleksine borçludur.

Bu unsurların ortadan kaldırılması süreci, sosyolojik imgelem için büyük bir zorluk teşkil etmekte ve araştırmacıların becerilerini sınamak için kullanılmaktadır. Nedene yol açan 'tek izli' bir açıklamayı takip etmek tehlikelidir. Karmaşık sosyal durumların ortaya çıkmasında genel olarak önemli bir rol oynayan bir dizi nedensel faktör bataryası aramak zorunludur.

Karl Pearson'un uygun bir şekilde gözlemlediği gibi, “sırayla hiçbir olgunun veya sahnenin tek bir nedeni yoktur; tüm önceki aşamalar ardışık nedenlerdir; Bilimsel olarak nedenleri belirttiğimizde, gerçekten bir deneyim rutininin ardışık aşamalarını tarif ediyoruz. ”

Yule ve Kendall, istatistiklerin “analiz için kabul etmesi, verilerin bir çok nedenin etkisine maruz kalması gerektiği ve nedenlerin önemli olanları ve gözlenen etkinin ne kadarının kaynaklandığını kendilerinden keşfetmeye çalışması gerektiği gerçeğini kabul etti. Her birinin operasyonu. ”

Paul Lazarsfeld “ayırt edici” olarak adlandırdığı tekniğe dahil olan aşamaları takip etti. Değişkenler arasındaki nedensel ilişkilerin belirlenmesinde kullanımını savunuyor. Lazarsfeld bu prosedürü ortaya koyuyor:

a) İddia edilen bir olayın aşağıdaki gibi doğrulanması:

In order to verify this occurrence, it is necessary to ascertain if the person has actually experienced the alleged situations. If so, how does the occurrence manifest itself and under what conditions, in his immediate life?

What reasons are advanced for the belief that there is a specific interconnection between two variables, eg, loss of employment and loss of authority? How correct is the person's reasoning in this particular instance?

(b) Attempting to discover whether the alleged condition is consistent with objective facts of the past life of this person.

(c)Testing all possible explanation for the observed condition.

(d) Ruling out those explanations which are not in accord with the pattern of happenings.

It is quite understandable that most difficulties or obstacles to establishing causal relationships afflict non-experimental studies most sharply. In non-experimental studies where the interest is in establishing causal relationships among two variables, the investigator must find substitutes for safeguards that are patently built into the experimental studies.

Many of these safeguards enter at the time of planning data- collection, in the form of providing for the gathering of information about a number of variables that might well be the alternative conditions for producing the hypothesized effect.

By introducing such additional variables into the analysis, the researcher approximates some of the controls that are inherent in experiments. Nevertheless, the drawing of inferences of causality does always remain somewhat hazardous in non-experimental studies.

We shall now discuss some of the problems and the strategies to overcome them, relating to drawing inferences about causality in non-experimental studies. If a non-experimental study points to a relationship or association between two variables, say X and Y, and if the research interest is in causal relationships rather than in the simple fact of association among variables, the analysis has taken only its first step.

The researcher must further consider (besides association between X and Y) whether Y (effect) might have occurred before X (the hypothesized cause), in which case Y cannot be the effect of X.

In addition to this consideration, the researcher must ponder over the issue whether factors other than X (the hypothesized cause) may have produced Y (the hypothesized effect). This is generally taken care of by introducing additional variables into the analysis and examining how the relation between X and Y is affected by these further variables.

If the relationship between X and Y persists even when other presumably effective and possibly alternative variables are introduced, the hypothesis that X is the cause of Y remains tenable.

For example, if the relation between eating a particular seasonal fruit (X) and cold (Y) does not change even when other variables such as age, temperature, state of digestion, etc., are introduced into the analysis, we may accept the hypothesis that X leads to Y as tenable.

But it is possible in no small number of cases that the introduction of other additional variables may change the relationship between X and Y. It may reduce to totally eliminate the relationship between X and Y or it may enhance the relationship in one group and reduce it in another.

If the relationship between X (eating of seasonal fruit) and Y (cold) is enhanced in a sub-group characterized by Z (bad state of digestion) and reduced in sub-group not characterized by Z (normal state of digestion), we may conclude that Z is the contingent condition for the relationship between X and Y.

This means, in other words, that we have been able to specify condition (Z) under which the relation between X and Y holds. Now if introduction of Z in the analysis reduces or totally eliminates the relationship between X and Y, we shall be safe in concluding either that X is not a producer of Y, that is, the relation between X and Y is 'spurious' or that we have traced the process by which X leads to Y (ie, through Z).

Let us turn to consider the situation in which we can legitimately conclude that the relation between X and Y is spurious.

An apparent relationship between two variables X and Y is said to be spurious if their concomitant variation stems not from a connection between them but from the fact that each of them (X and Y) is related to some third variable (Z) or a combination of variables that does not serve as a link in the process by which X leads to Y.

The situation characterizing spurious relationship may be diagrammed as under:

The objective here is to determine the cause of Y, the dependent variable (let us say, the monetary expectation by college graduates). The relationship (broken line) between X the independent variable (let us say, the grades obtained by students) and the monetary expectation of graduates (Y) has been observed in the course of the analysis of data.

Another variable (Z) is introduced to see how the relation between X and Y behaves with the entry of this third factor. Z is the third factor (let us say, the income-level of the parents of students). We find that the introduction of this factor reduces the relationship between X and Y.

That is, it is found that the relation between higher grade in the examination and higher monetary expectations does not hold itself up, but is considerably reduced when we introduce the third variable, ie, the level of parents' income.

Such an introduction of Z brings to light the fact that not X but Z may probably be a determining factor of Y. So the relationship between X and Y (shown in the diagram by a dotted line) is a spurious one, whereas the relation between Z and Y is a real one. Let us illustrate this with the help of hypothetical data.

Suppose, in the course of the analysis of data in a study, it was seen that there is a significant correlation between the grades or divisions (I, II, III) that students secured in the examination and the salary they expect for a job that they might be appointed to.

It was seen, for instance, that generally the first divisioners among students expected a higher remuneration compared to the second divisioners and the second divisioners expected more compared to the third divisioners.

The following table illustrates the hypothetical state of affairs:

It is clearly seen from the table that there is a basis for hypothesizing that the grades of the students determine their expectations about salaries. Now, let us suppose that the researcher somehow hits upon the idea that the income-level of the parents (X) could be one of the important variables determining or influencing the students' expectations about salaries (Y). Thus, Z is introduced into the analysis.

Suppose, the following table represents the relationship among the variables:

Not:

HML in the horizontal row, dividing each category of the students' grades, stand respectively for high parental level of income, moderate parental level of income and low parental level of income. The above table clearly shows that the relation between X and Y has become less significant compared to the relation between Z and Y. '

To get a clearer picture, let us see the following table (a version of Table B omitting the categories of X) showing the relationship between Z and, ie, parental income level and students' monetary expectations:

We can very clearly see from the table that, irrespective of their grades, the students' monetary expectations are very strongly affected by the parental levels of income (Z).

We see that an overwhelming number of students (ie, 91.5%) having high monetary expectations are from the high parental income group, 92% having moderate monetary expectations are from moderate parental income group and lastly, 97% having low monetary expectations are from the low parental income group.

Comparing this picture with the picture represented by Table A, we may say that the relation between X and Y is spurious, that is, the grade of the students did not primarily determine the level of the monetary expectations of the students.

It is noted in Table A that students getting a higher grade show a significant tendency toward higher monetary expectations whereas the lower grade students have a very marked concentration in the lower monetary expectation bracket.

But when we introduce the third variable of parental income, the emerging picture becomes clear enough to warrant the conclusion that the real factor responsible differential levels of monetary expectations is the level of parental income.

Tablo C'de, söz konusu kombinasyonların altındaki üç gruba karşılık gelen öğrenci vakalarının çok güçlü ve müthiş bir yoğunluğunu görüyoruz, mesela, yüksek para beklentileri ve yüksek ebeveyn geliri, orta düzeyde parasal beklentiler ve orta düzeyde ebeveyn geliri ve düşük parasal beklentiler ve düşük ebeveyn geliri, yani sırasıyla% 5, % 92, 1 ve% 1'dir.

İlgili Süreci ve Değişkenler Arasındaki İlişkinin İzlenmesi: Daha önce belirtildiği gibi, eğer üçüncü bir Z, bağımsız değişken X ile bağımlı değişken arasındaki ilişkiyi azaltır veya ortadan kaldırırsa, X ve Y arasındaki ilişkinin sahte olduğu sonucuna varabiliriz, ya da X'in Y'ye yönlendirdiği süreci izleyebildiğimizi

Şimdi, X ile Y arasındaki ilişki sürecinin üçüncü bir Z faktörü ile izlendiği sonucunu garanti edecek koşulları göz önüne alacağız.

Araştırmacılar, bir çalışmada daha küçük toplulukların ortalama bir samimiyet puanının daha yüksek olduğunu bulduğunu, samimiyet puanının bir samimiyet ölçeği kullanarak bir toplumun üyeleri arasındaki ilişkinin samimiyetinin bir ölçüsü olduğunu varsayalım.

Farz edelim ki, orta ölçekli toplulukların küçük ölçekli topluluklara kıyasla daha az yakınlık puanına sahip olduğunu ve büyük ölçekli toplulukların en düşük ortalama yakınlık puanına sahip olduğunu bulmuşlardır. Böyle bir bulgu, topluluğun büyüklüğünün topluluğun üyeleri arasındaki ilişkinin yakınlığını belirlediğini göstermektedir.

Başka bir deyişle, gözlemler, küçük ölçekli bir toplulukta yaşayan üyelerin daha büyük bir ilişkilendirme yakınlığına sahip olduğu sonucunu garanti ederken, büyük ölçekli topluluklar, üyeler arasındaki ilişkilerin daha az yakın olması ile karakterize edilir.

Aşağıdaki tabloda, varsayımsal veriler sunulmaktadır:

Tablonun ikinci sütununda, toplulukların her birine karşılık gelen örnekler gösterilmiştir.

Tablonun ikinci sütununda, toplulukların her birine karşılık gelen örnekler gösterilmiştir. 3. sütunda, üyeler arasındaki günlük derneklerle ilgili bir ölçekte belirli maddelere verilen cevaplara dayanarak hesaplanan topluluk türlerine karşılık gelen ortalama yakınlık puanları gösterilmiştir.

Tablodan, ortalama yakınlık puanlarının toplumun büyüklüğüne ters olarak değiştiği, yani boyutun küçüldüğü, yakınlık puanının ne kadar yüksek olduğu ve bunun tersine büyüklüğün arttıkça yakınlık puanının azaldığı görülmektedir.

Şimdi, araştırmacıların, üç topluluk türünün, üyeler arasında etkileşim için sundukları fırsatlar bakımından, yaşam düzenlemeleri, konut düzeni, yaygın olarak paylaşılan kamu hizmetleri vb.

Bu nedenle, araştırmacılar, üçüncü faktörü etkileşim potansiyelinin analizine, yani insanların içinde yaşadıkları koşulların kendi aralarında etkileşim için fırsatlar sunma ihtimalinin derecesine dahil edecektir.

Üç çeşit toplumun bir topluluk üyeleri arasındaki etkileşimde farklılıklar ürettiği, konut modellemesi, yaşam düzenlemeleri, ortak olarak paylaşılan imkanlar vb. Farklılıklar yoluyla olduğu varsayımını kontrol etmek için, araştırmacılar topluluğun boyutunu ve ortalama samimiyet puanıyla ilişkili olarak ortaklaşa etkileşim potansiyeli.

Bu yüzden kırılma potansiyeli, analize dahil edilen üçüncü Z değişkenidir. Etkileşim potansiyeli, düşük etkileşim potansiyeli olan (b) orta etkileşim potansiyeli ve (c) yüksek etkileşim potansiyeli olarak sınıflandırılmıştır.

Aşağıdaki tablo varsayımsal verileri temsil etmektedir:

Tablodaki satırları okurken, etkileşim potansiyelinin toplumun büyüklüğü ne olursa olsun topluluk üyelerinin yakınlık puanlarıyla güçlü bir şekilde ilişkili olduğunu görüyoruz.

Diğer bir deyişle, küçük ölçekli topluluklar, orta ölçekli topluluklar veya büyük ölçekli topluluklar için bu sırayı göz önünde bulundursak da, her durumda etkileşim potansiyelinde bir artış ile ortalama yakınlık puanında bir artış vardır. Dahası, girişleri satırlar boyunca okuyarak, topluluğun boyutunun ve etkileşim potansiyelinin önemli bir korelasyon içerdiği açıkça anlaşılıyor.

Örneğin, küçük bir topluluktaki yanıt verenlerin yaklaşık üçte ikisi yüksek etkileşim potansiyeli olan koşullar altında yaşamaktadır; Ayrıca orta ölçekli topluluk sakinlerinin çok daha küçük bir bölümünün yüksek etkileşim potansiyeli olan koşullar altında ve büyük etkileşimli topluluk sakinlerinin yüksek etkileşim potansiyeli altındaki koşullar altında çok küçük bir oranda yaşadığını görüyoruz.

Şimdi, samimiyet puanlarını yalnızca topluluk türü ile birliğin samimiyeti arasındaki ilişkinin önemli ölçüde azaldığını bulmak için sütunlardan okuduk. Aslında, yüksek etkileşim potansiyeli altında yaşayan insanlar için, toplumun büyüklüğü ile yakınlık puanı arasında kesin bir ilişki yoktur.

Araştırmacılar, bu ilişki kümesinden topluluğun büyüklüğü ile yakınlık puanı arasındaki ters ilişkinin iyi olduğu sonucuna varabilir, ancak belirli bir topluluk türünün üyeler arasında yakınlığı teşvik etmesinin en temel yollarından birinin, teklif vermek olduğu sonucuna varılabilir. Aralarındaki etkileşim oranını artıran fırsatlar.

Başka bir deyişle, küçük ölçekli topluluklar daha yüksek bir ortalama samimiyet puanı ile karakterize edilir, çünkü küçük boyutları üyeler arasında yüksek derecede etkileşim için birçok fırsat için bir ortam sağlar. Öte yandan, büyük ölçekli topluluklar nispeten daha düşük bir samimiyet puanı ile nitelendirilmektedir.

Ancak düşük samimiyet puanı, toplumun büyüklüğüne göre değil, büyük ölçekli bir toplumun, küçük ölçekli topluluklar gibi, üyeler arasında daha yüksek etkileşim için fırsatlar sunamadığı gerçeğine atfedilebilir.

Bu nedenle, araştırmacılar, topluluğun büyüklüğü ile üyeler arasındaki ortalama yakınlık puanı arasındaki ilişkinin sahte olduğu sonucuna varmak yerine, X'in (yani, topluluk türünün) Y'yi etkilediği süreci izleyebildikleri sonucuna varmış olabilirler. (samimiyet puanı).

Birincisi, X ve Y değişkenleri arasındaki ilişkinin sahte olduğu sonucuna varmış, ikincisi ise X - Y arasındaki sürecin Z (X - Z - Y) arasında izlenebileceği sonucuna varmıştır. Her iki durumda da, üçüncü bir Z değişkeninin eklenmesi, aralarındaki ilişkiyi azaltmış veya ortadan kaldırmıştır (X ve Y).

Bununla birlikte, bir fark not edilebilir. İlk örnekte, Z değişkeni (yani, ebeveynlerin gelir düzeyi), diğer iki değişkene (sınavdaki öğrencilerin notu ve öğrencilerin parasal beklentileri) önceden açıkça belliydi.

İkinci örnekte, üçüncü değişken Z (topluluklar tarafından sağlanan etkileşim potansiyeli), varsayılan nedensel değişkenden (topluluk büyüklüğü) önce gerçekleşmedi. Bununla eşzamanlıydı ve ondan başlıyor gibi düşünülebilir.

Dolayısıyla değişkenlerin zaman dizisi, açık bir nedensel ilişkinin sahte olup olmadığına karar vermede önemli bir husustur. Yani, başlangıçta ilgili değişkenler X ve Y arasındaki ilişkiyi ortadan kaldıran veya ortadan kaldıran üçüncü değişken Z ise, genellikle X ve Y değişkenleri arasındaki görünür nedensel ilişkinin sahte olduğu sonucuna varırız.

Fakat eğer Z'nin üçüncü değişkeni, X ile aynı anda veya X'ten sonra gerçekleştiği biliniyorsa veya varsayılıyorsa, X'in Y'ye yönlendirdiği işlemin izlendiği sonucuna varmak mümkündür. nedensel ilişkiye olan güven, karakter açısından deneysel olmayan çalışmalardan kaynaklanırsa, bunları diğer muhtemel değişkenleri elimine etmenin kritik testine tabi tutmak gerekir.

Bu nedenle, çalışma sırasında, araştırmanın hipotezinin merkezi olarak ilgilendiği durumlar dışındaki muhtemel etkili değişkenler hakkındaki verileri toplamak önemlidir.

Daha önce, bir üçüncü değişkenin analize dahil edilmesinin, bir alt grup içindeki ilişkinin yoğunlaştırılması ve diğer bir alt gruptaki aynı şeyin azaltılması etkisine sahip olabileceği belirtildi. Böyle bir durumda, X ile Y arasındaki ilişkinin geçerli olduğu bir koşul (Z) belirlediğimizi söylüyoruz.

Şimdi belirtim sürecini açıklayalım. Bir topluluk çalışmasında, gelir ve eğitim düzeyi arasındaki ilişkiyi tanımladığımızı varsayalım.

Bu, aşağıda verilen tabloda gösterilmiştir:

Tabloda eğitim ve gelir arasındaki ilişkinin oldukça belirgin bir ilişki olduğunu görüyoruz. Eğitim ne kadar yüksek olursa, genellikle yıllık 5.000 Rs / - ve üstü gelir elde eden davaların yüzdesi de o kadar yüksek olur. Bununla birlikte, ilişkinin daha fazla spesifikasyon gerektirdiğine karar verebiliriz.

Yani, bu ilişkinin elde ettiği koşullar hakkında daha fazla bilgi edinmek isteyebiliriz. Diyelim ki, düşünce bize kentsel sanayi toplumunda yaşayan katılımcıların gerçeği, ücretli istihdam için eğitimin avantajlarını ve dolayısıyla gelirdeki yansımasını olumlu yönde etkileyebileceğini vurguluyor.

Bu varsayım üzerine, üçüncü faktör Z'yi, yani kentsel sanayi toplumunda yaşayanlar ve kırsal sanayi dışı toplumda yaşayanları analiz etmeye ve X ile Y arasındaki ilk ilişkiyi nasıl etkilediğini görmeye hazırlıyoruz. yani, eğitim ve gelir).

Aşağıdaki tabloda gösterildiği gibi bir resim aldığımızı varsayalım:

Tablo B'nin, endüstriyel olmayan kırsal kesimde yaşayan insanlar için gelir ve eğitim arasındaki ilişkinin, kentsel-endüstriyel toplumda yaşayanlar için olandan çok farklı bir yansıması olduğunu açıkça görebiliyoruz. Endüstri kentlerinde yaşayanlar için eğitim ve gelir arasındaki ilişkinin orijinal ilişkiden biraz daha yüksek olduğunu görüyoruz.

Ancak, kırsaldaki sınai olmayan topluluklarda yaşayanlar için yukarıdaki tablodaki ilişki başlangıçtaki ilişkiden oldukça düşüktür.

Bu nedenle, üçüncü faktörün tanıtılması ve orijinal ilişkinin üçüncü faktör (Z) bazında parçalanması, X ve Y arasındaki ilişkinin daha da belirgin olduğu bir durumun belirlenmesine yardımcı olmuştur. ilişki daha az belirgindir.

Benzer şekilde, bir araştırma sırasında yüksek gelir kategorisine giren kişilerin daha düşük gelir kategorisindeki çocuklara göre daha az çocuk sahibi olduğunu varsayalım. Diyelim ki (teorik oryantasyon temelinde) şehir yerleşimi faktörünün ilişkiyi etkilemede önemli olabileceğini düşünüyoruz.

Bu faktörü tanıtmak, gelir düzeyi ve çocuk sayısı arasındaki orijinal ilişkinin şehirde daha belirgin hale geldiğini ve kırsal kesimde insanlar arasında Z koşulunu tanımladığımızdan daha az belirgin hale geldiğini düşünelim. (ilişkinin kararlı bir şekilde geliştiği veya telaffuz edildiği).

Bir Çalışmanın Bulgularını Yorumlama:

Şimdiye kadar, kendimizi esas olarak, birlikte adlandırdıklarımızı, verilerin analizini içeren prosedürler ile ilgilendik. Bununla birlikte, araştırmacının görevi, bulgularını veri analizi yoluyla ulaşabileceği ampirik genellemeler biçiminde sunarak durduğunda tam değildir.

Örneğin, “evlenmemiş insanların evli insanlarla karşılaştırıldığında daha yüksek bir intihar insidansı olduğunu belirten bir araştırmacı, ampirik genelleme koymuş olmasına rağmen, genel olarak bilime olan yükümlülüğünü yerine getirmediğini belirtti. kendi başına bir değeri var.

Bilimin daha fazla ilgisini çeken araştırmacı, gözleminin başlangıçta göze gizlenmiş olan bazı temel koyucu ilişkilere ve süreçlere işaret ettiğini göstermeye çalışmalıdır. Başka bir deyişle, araştırmacı gözleminin yüzey düzeyinde göründüğünden daha geniş ve derin bir anlama sahip olduğunu göstermelidir.

Araştırmacı, intihar örneğimize geri dönebilmek için, “evlenmemiş kişilerin intihar ile nitelendirildiğini” gözleminin aslında sosyal uyum ve intihar oranı arasındaki ilişkiyi yansıttığını gösterebilmelidir (Durkheim teorisi).

Araştırmacı, somut bulgularının altında yatan ilişkileri ve süreçleri ortaya koyduğunda, bulguları ve diğerleri arasında soyut ilişkiler kurabilir.

Temelde, araştırmacının çalışması, verilerin toplanması ve analiz edilmesinin çok ötesine geçer. Görevi, çalışmasının bulgularını yorumlamaya kadar uzanır. Araştırmacı, bulgularının gerçek önemini anlayabildiği şeklinde yorumlayarak, yani bulguların neden olduklarını anlayabilir.

Daha önce de belirtildiği gibi, yorumlama araştırma bulgularının daha geniş ve soyut anlamlarının aranmasıdır. Bu araştırma, araştırma bulgularını diğer bilinen bilgiler, teori veya ilkeler ışığında görmeyi içerir. Bu aramanın iki ana yönü var.

İlk husus, verilen bir çalışmanın sonuçlarını başkalarının sonuçlarına bağlayarak araştırmada sürekliliği sağlama çabasıdır. Araştırmacı, somut deneysel gözlemlerin altındaki soyut ilkeyi çözebilir veya kavrayabilir.

Bu soyut ortak payda ayırt edildi, araştırmacı, bulgularını farklı ortamlarda yapılan diğer çalışmalarla, detaylar bakımından farklı fakat aynı soyut ilkeyi bulgular düzeyinde yansıtarak bulmaya kolayca devam edebilir.

Araştırmacının, bulgusunun temelinde yatan soyut teorik prensibin tanınması temelinde yapabileceğini söylemeye gerek yok, olayların somut dünyası hakkında, bulgularının alanıyla oldukça ilgili olmayan çeşitli tahminlerde bulunabilirsiniz. Bu nedenle, tahminleri test etmek için yeni sorular tetiklenebilir ve anlaşılabilir bir şekilde, bu tür çalışmalar araştırmacının ilk çalışmasıyla bir ilişki kurabilir.

Biraz farklı bir anlamda, yorumlamanın mutlaka keşfedici deneysel araştırmaya geçişte yer alması gerekir. Eski araştırma kategorisindeki bulguların yorumlanması çoğu zaman bu konu için hipotezlere yol açmaktadır.

Bir keşif çalışmasının başlaması gereken bir hipotezi olmadığı için, böyle bir çalışmanın bulgularının veya sonuçlarının bir “post-postum” yorumuyla yorumlanması gerekir, çünkü genellikle tehlikeli sonuçlarla dolu tehlikeli bir oyundur. Böyle bir yorum, araştırmanın bulgularını benimseyecek (yani açıklayacak) bazı teori veya ilkelerin niteliğinde bir vaftiz babası aramasını içerir.

Bu arayış, araştırmacının bulgularına uyması için uygun bir teori bularak bulgularını haklı çıkarma yönünde bir alıştırma olduğu ortaya çıkar. Sonuç olarak oldukça sık sık çelişkili sonuçlar “tanrı babalarını” çeşitli teorilerde bulabilir.

Araştırma bulgularını rasyonelleştirmeye yönelik girişimleri içeren post-pozumum yorumlamanın bu yönü, devam ederken açıkça göz önünde bulundurulmalıdır. Ancak, bazı durumlarda, buna başka alternatif yoktur.

İkincisi, yorumlama açıklayıcı kavramların oluşturulmasına yol açar. Belirtildiği gibi, bulguların yorumlanması gözlemlerin veya bulguların neden olduğunu, ne olduklarını açıklama çabalarını içerir. Bu görevi yerine getirirken, teori merkezi bir öneme sahiptir.

Bir duyarlılaştırıcıdır ve bulguların altındaki altta yatan faktör ve süreçlere (açıklayıcı bazlar) bir rehberdir. Araştırmacının bir araştırma sırasındaki gözlemlerinin altında, ampirik dünya hakkındaki gözlemlerini açıklayabilecek bir dizi faktör ve süreç vardır. Teorik yorumlama bu faktörleri ortaya çıkarır.

Araştırmacının görevi, araştırması sırasında gözlemlediği ilişkileri, ona bu ilişkileri daha derinlemesine kavrayabilen ve çalışmasının problem alanında faaliyet gösteren bazı temel faktörlerin rolünü göstererek altta yatan süreçleri göstererek açıklamaktır.

Böylece, yorumlama iki yönlü bir amaca hizmet eder. Birincisi, bir çalışma sırasında neyin gözlemlendiğini açıklayan genel faktörlerin anlaşılmasını sağlar ve ikincisi daha sonra yapılacak araştırmalar için rehberlik edebilecek teorik bir anlayış sağlar.

Bu şekilde bilim, araştırmacının ilgilendiği ampirik dünyanın bir bölümünü oluşturan temel, süreçleri daha başarılı bir şekilde ayırmaya başlar.

Yorum, analizle ayrılmaz bir şekilde iç içe geçmiş durumdadır; ayrı veya ayrı bir işlemden ziyade, analizin özel bir yönü olarak daha doğru algılanması gerekir. Kapanışta, verilerin analizinde (yorumlanması da dahil olmak üzere) hepsinin özünün özünü belirten Prof. C. Wright Mills'i alıntılamak için hazırız.

Mills, “Yani keşfedeceksiniz ve tanımlayacaksınız, ne bulduğunuzu sipariş için türler ayarlayarak, öğeleri ismiyle ayırt ederek deneyime odaklanacak ve düzenleyeceksiniz. Bu düzen arayışı, kalıplar ve eğilimler aramanıza ve tipik ve nedensel olabilecek ilişkileri bulmanıza neden olacaktır. Kısaca, ne ile karşılaştığınızın veya neyi anlamaya çalıştığınızla ilgili olarak görünen bir şeyin görünür bir göstergesi olarak yorumlanabileceğinin anlamını arayacaksınız; onu esaslara indirgeyeceksin; o zaman dikkatlice ve sistematik bir şekilde bir çalışma modeli oluşturmak için bunları birbirinizle ilişkilendireceksiniz… ”

“Ancak her zaman tüm detaylar arasında, ana sürenin, toplumun belirli bir döneminde ortaya çıkan formlara ve eğilimlere işaret edebilecek göstergeler aramaya başlayacaksınız.” Bu da bir dizi yeni soruyu gündeme getirir ve sorun yapılabilir.

Yeni sorulardan bazıları, yeni araştırma girişimlerinin temelini ve eskileri değiştirecek ya da değiştirecek yeni teorilerin formülasyonunu oluşturur. Bu gerçekten, araştırmanın ne demek olduğunu. Entelektüel maceranın yeni ve daha geniş caddelerini açmaya hizmet eder ve kullanımında daha fazla bilgeliğin yanı sıra daha fazla bilgiliğe olan arayışı simüle eder.