Herhangi bir Endüstriyel Tahmincinin Gereksinimleri: Geçerlilik ve Güvenilirlik

Herhangi bir tahminci için iki önemli gereklilik, geçerlilik ve güvenilirliktir. Endüstriyel ortamda farklı türlerde veya türlerde geçerlilik türleri mevcuttur, ancak en çok tercih edilene tahminsel geçerlilik denir. Farklı güvenilirlik önlemleri de vardır. Güvenilirlik ve geçerliliğe ilişkin endişe, öngörücülerle sınırlı değildir, aynı zamanda kriterler için de geçerlidir.

Geçerlik:

Bir öngörücünün geçerliliği, genel olarak öngörücünün, ölçülmesi gereken ölçüsü ölçerek kullanıcının belirli hedeflerine ulaşma derecesi olarak tanımlanabilir. Dolayısıyla, söz konusu spesifik geçerlilik türü, kullanıcının her durumda özel amacına bağlıdır.

Tahmini Geçerlilik:

Kullanıcının amacı, çalışanların gelecekteki performansını diğer değişkenlerde (kriter) tahmin etmek için ölçüm aracını kullanmaktır. Tahmini geçerlilik, korelasyon ve regresyon yoluyla istatistiksel olarak belirlenir. Tahmini geçerliliğin önemli bir farklılığı, zaman harcayan sorunlardan biridir. Öngörücü puanları, bireyler üzerinde bir seferde (örneğin, işe alma zamanı) ve ölçüt puanları daha sonraki bir tarihte (örneğin altı ayın sonunda) elde edilir.

Sonuçta ortaya çıkan ilişki, gerçekte enstrümanın “öngörücü” gücünü temsil eder. Tahmini geçerlilik, seçim durumunu gerçekten kopyalayan tek tip olması nedeniyle seçimdeki en önemli geçerlilik türüdür. Kestirimci geçerliliği için bazen kullanılan bir diğer isim, izlem geçerliliğidir.

Eşzamanlı Geçerlilik:

Buradaki amaç, en azından teoride, bir ölçüt ölçütündeki çalışanların mevcut performansını öngörücü puanlardan tahmin etmek olmalıdır. Eş zamanlı geçerlilik, korelasyon ve regresyon teknikleri kullanılarak da belirlenir, ancak yordayıcı ve ölçüt puanlarının elde edilmesi arasında zaman gecikmesi yoktur. Tahminci-ilişki ilişkisini belirlemek için mevcut çalışanlardan bir örnek kullanılır ve daha sonra kalan iş sahiplerine tahminci puanları alınarak elde edilen regresyon uygulanabilir.

Başka bir deyişle, gelecekteki bir zamanda durumlarını değil, insanların mevcut durumunu tahmin etmekle ilgileniyoruz. Yüksek eşzamanlı geçerliliğin yüksek prediktif geçerliliği sağlamadığını belirtmek son derece önemlidir. Maalesef, eşzamanlı geçerliliği, endüstride öngörücü geçerliliğin yerine geçmekte çok sık kullanılmaktadır.

Yönetim, kestirimci yöntemin gerektirdiği zamanı beklemek istemeyebilir ve mevcut çalışanların iş başvurusunda bulunan temelde farklı bir işçi topluluğunu temsil edebileceğinin farkında olmayabilir. Halihazırda istihdam edilen işçiler, hem işe alım hem de süreklilik açısından taramayı sürdürmüşlerdir ve işe alınan fakir işçiler, gönüllü olarak veya istek üzerine terk etmiş olabilirler. Bu, eşzamanlı geçerliliklerin öngörücü geçerlilik durumuna genelleştirilmesinin gerekçelendirilmesini çok zorlaştırmaktadır.

İçerik Geçerliliği:

Doğrulayıcı, tahmininin belirli bir durum sınıfını temsil ettiğini varsaydığında, içerik geçerliliğine katılır. Ölçüm aleti tarafından kullanılması gereken bilgi türü, beceri, tutum veya performans hakkında özel bir fikri vardır ve aleti, içeriğinin dokunmak istediği şeyi temsil ettiği dereceye kadar geçerli görmektedir. İçerik geçerliliği, herhangi bir istatistiksel veya kantitatif anlamda genellikle ölçülemez.

Bunlardan biri, bir üniversite kursundaki final sınavları gibi başarı testi kullanıcıları arasında içerik geçerliliğinin en iyi şekilde kullanıldığını bulur. Bir final sınavının sadece içeriğinin geçerliliği olduğu düşünülebilir, ancak kalemler açısından, dersin içeriği açısından yeterince temsil edilmişse (örneklenmiş). Ders içeriğinin kapsamını temsil etmemiş olsaydı, kesinlikle final sınavı için uygun bir test olarak kabul edilemezdi - yani içerik geçerliliği olmazdı.

Yapı geçerliliği:

Bu tür bir geçerlilik ile kullanıcı, değerlendirilen kişilerin test performansına yansıdığı düşünülen bazı özellik veya niteliklere (yapıya) sahip olma derecesini anlamak ister. Genel prosedür, aynı yapıyı ölçmek için mantıklı görünen birkaç test cihazının uygulanmasını ve ardından bu önlemler arasındaki ilişkilerin izlenmesini içerir. Yapı geçerliliği, endüstriyel psikolog tarafından kayda değer ölçüde kullanılmamıştır; pragmatik durumlardan ziyade teorik olarak daha sık kullanılmaya meyillidir.

Sentetik Geçerlilik:

Biri sentetik geçerliliği “varsayılmış” olarak tahmin edebilir geçerliliği olarak kabul edebilir. Bir çok durumda endüstriyel ustaların çeşitli performans kriterleri ile prediktif bir ilişki olduğunu kanıtladığımızı bir testimiz olduğunu varsayalım. Ayrıca, küçük bir üretim tesisinin usta seçiminde bir test kullanmak istediğini, ancak eş zamanlı bir geçerlilik çalışması yapmak için tesiste çok az sayıda ustanın çalıştığını varsayalım. Bu tesis, diğer daha büyük tesislerde başarılı olduğu kanıtlandığı varsayımı üzerine herhangi bir resmi istatistiksel değerlendirme olmadan testi kullanmaya karar verebilir.

Bu prosedür sadece aşağıdaki durumlarda geçerli sayılabilir:

(1) Foreman'ın bu tesisteki işi, testin istatistiksel değerlendirmesinde yer alan ustabaşı mesleklerine benzer, ve

(2) Bu tesisteki ustabaşı başvuru sahipleri, daha büyük tesislerdeki ustabaşı işleri için başvuranlar olarak tipiktir (aynı popülasyondan gelmektedir). Sentetik geçerliliği, sadece öngörülen geçerliliğin yerine, olası sınırlamaların tam farkındalığı ile değiştirilmelidir.

Yüz Geçerliliği:

Bir testi tanımlamak için sıklıkla kullanılan başka bir geçerlilik türü, bir kullanıcının testine “doğru gözle bakma” testi ile ilgilenme derecesidir. İş başvuru sahipleri, almaları gereken öngörme araçlarının, başvurdukları işle çok az ya da hiç ilişkisi olmadığı ortaya çıktığında üzülürler. Örneğin, bir kişi bir makinist pozisyonu için insanları seçiyorsa ve bir aritmetik yetenek testi yordayıcı olarak kullanılıyorsa, test maddeleri elma satın almak gibi daha genel terimlerle ifade edilmek yerine mekanik sorunlara uygulanan sayılarla ilgilenmelidir. portakal.

Eğer başvuru sahibi, yordayıcının başvurduğu işle olan ilişkisini göremiyorsa, kişilik testlerinde sıklıkla olduğu gibi, test durumunda motivasyonda ciddi bir kayba uğrayabilir, buna karşın, zorlayıcı olabilir veya güvensiz hissediyorum. Bu, sadece seçim programına zarar vermekle kalmaz, aynı zamanda şirketin imajına zarar verebilir ve herhangi bir endüstriyel ortamda test görüntüsüne zarar verebilir. Yazarlar, sektördeki seçim araçlarının kullanıcıları tarafından alınan bazı kötü tanıtımların, testlerinin yüz geçerliliğine sahip olma ihtiyacını göz ardı eden kullanıcının olabileceğine dair bir tahminde bulunacaklardır.

Yaş Görev Süresi ve İş Tecrübesi ve Geçerlilik Üzerine Etkileri:

Çalışanların belirli bir işteki performanslarının incelenmesi, genellikle yaş ve deneyim ile ölçüt gibi değişkenler arasında kesin bir ilişki olduğunu gösterir. İş ne kadar karmaşık olursa, bu tür ilişkilerin o kadar fazla olması muhtemeldir. Birçok iş için, çalışanlar işlerinde yetkin olmadan önce önemli miktarda deneyim gereklidir. Bu tür değişkenler ve iş başarısı kriterleri arasındaki korelasyon seçimde ciddi bir problemdir. Dikkat, özellikle de bir eşdeğer geçerlilik prosedürü, herhangi bir tahminde bulunma cihazının faydasının kurulmasında bir araç olarak kullanılıyorsa gereklidir.

Örneğin, ölçüt ile işin süresi arasında yüksek bir korelasyon varsa, aynı anda yüksek bir geçerlilik katsayısı nasıl yorumlanmalı? Bu, öngörücünün, “ölçüt” ile ölçülen işçiler arasındaki yetenek farklılıklarını gerçekten yansıttığını mı, yoksa öncelikle işle ilgili deneyimden dolayı işçi farklılıklarını mı ifade ediyor? İkincisi ise, o zaman tahmincinin başaracağı tek şey uzun süren işçileri bu işçilerin daha yakın zamanda işe alınanlardan ayırmaktır.

Gözlenen geçerlilik, genel olarak seçim aracının öngörücü etkinliğinin fazla bir değeridir. Aslında, bir tahmincinin, iş performansının kendi belirleyicileri olabilecek yaş ve görev süresi gibi özelliklerle açık bir ilişki göstermediği açıkça belirtilmediği sürece, bu öngörücü ile elde edilen tüm eşzamanlı geçerliliğin yüksek derecede şüpheli olması gerekir.

Noktayı göstermek için, bir kriterin, bir tahmincinin ve çalışanların ölçütünde gösterilen beceri farklılıklarından büyük ölçüde sorumlu olan iş hakkı gibi bir kritere bağlı değişkenin olduğu durumu göz önünde bulundurun:

C + D = Tahminin gözlenen eşzamanlı geçerliliği

D = Tahmincinin muhasebeleştirdiği “bedelsiz” ölçüt varyansının miktarı

C = Tahmincinin muhasebeleştirdiği “görev süresi tarafından belirlenen” ölçüt varyansının miktarı

Gözlenen geçerlilik, genel olarak, ancak her zaman gerçek geçerliliğin gereğinden fazla abartılmasından dolayıdır, çünkü:

Belirleyici ile iş süresinin etkisinden tamamen arınmış olan kriter arasındaki korelasyonu temsil eden gerçek veya yansız eşzamanlı geçerliliği denklem tarafından verilmektedir.

Diyagramda gösterildiği gibi korelasyon (r doğru ) aslında, resimli olarak, istatistiklerde “kısmi” bir korelasyon katsayısı olarak bilinen şeyi temsil eder. İş sırasının etkilerinin kaldırılmasının ardından hem öngörücü puanları hem de mevcut çalışanların ölçüt puanları arasındaki yordayıcı ve ölçüt arasındaki ilişkiyi rapor eder. Görev süresinin eşzamanlı durumda hem kriter hem de belirleyiciden kaldırılması önemlidir.

Bu etkiler istatistiksel olarak kriterden çıkarılmadığı takdirde, iş performansından ziyade görev süresinin etkisini tahmin etmek, öngörücü geçerliliğe çok az ya da hiç bağlı kalmamaktır. İşe alım süresi yordayıcıdan kaldırılmazsa, gerçek anlamda yordayıcı geçerlilik durumu ile ilgili olarak kabul edilemeyecek bir geçerlilik katsayısı da alabiliriz.

Kesinlikle, eşzamanlı ayardaki ölçüt ve yordayıcıyla ilişkili değişkenlerin sorunları, bu validasyon yönteminde yer alan bazı ciddi kısıtlamaları göstermektedir. Bir seçim aracı oluştururken ve kullanırken kesin geçerlilik olarak bilinen geçerlilik türünün kesinlikle eşit bir alternatifi olmadığı açıkça ifade edilebilir.

Güvenilirlik:

Genel olarak, geçerlilik kavramı, bir ölçüm cihazı tarafından neyin ölçülmekte olduğu ile ilgilidir. Tahmin edicilerin ikinci ve belki de eşit derecede önemli bir özelliği, ölçülenin ne olduğuna bakılmaksızın, ölçütün tutarlılığını bilme ihtiyacıdır. Başka bir deyişle, herhangi bir ölçüm cihazının stabilite derecesini belirlememiz gerekir; Bir tahmin cihazından elde edilen ölçüm tutarlı olmalıdır. Herhangi bir ölçüm cihazının tutarlı veya istikrarlı olması ve gerektiğinde tekrar tekrar aynı puanları vermesi derecesi, bu test cihazının güvenilirliği olarak tanımlanır.

Geçerlilik gibi, güvenilirlik de genellikle korelasyon katsayısı ile ölçülür. Güvenilir ölçüm bir durumdan diğerine stabilite gerektirdiğinden, güvenilir enstrüman iki durumda bireylerin aynı puanları veya en azından benzer sıralamalarını üretmelidir. Korelasyonu hesaplayarak, bunun gerçekleştiği derecenin matematiksel bir ifadesini elde ederiz.

Bu nedenle güvenilir bir ölçüm cihazı, bireylerin tekrarlanan ölçümlerde aynı puanı (veya neredeyse aynı) aldıkları bir cihazdır. Korelasyon katsayısı, bir grup insan için aynı ölçüdeki iki uygulamadaki puanların benzerliğini ölçmek için kullanıldığında güvenilirlik katsayısı olarak adlandırılır.

Bir önlemin güvenilirliğini değerlendirebileceğiniz gerçek süreç birçok faktöre bağlıdır. Her biri ayrı avantaj ve dezavantajlara sahip olan üç ana alternatif “güvenilirlik” türü vardır. Her birini ayrıntılı olarak incelemeyi haklı çıkarmak için, temel mantıklarında yeterince farklıdırlar.

Cihaz güvenilirliğini elde etmek için üç teknik:

(1) Aynı test veya araç ile aynı kişiler üzerinde tekrarlanan önlemler,

(2) Ölçüm cihazının iki "eşdeğer" formu olan aynı kişilerde ölçüm yapılması ve

(3) Ölçüm cihazının iki veya daha fazla eşdeğer parçaya ayrılması ve bu “kısım” puanlarının birbiriyle ilişkilendirilmesi.

Her metodu göz önünde bulundurmadan önce, farklı koşullar altında düşünülebilecek olan belirli güvenilirlik veya ölçüm kararlılığı türlerini daha spesifik bir şekilde incelemeliyiz.

Bir kişinin puanını almak için herhangi bir ölçüm aracı kullandığımız zaman, alınan puanın çeşitli faktörlerin bir işlevi olduğunu varsayalım:

X i = X doğru + X hatası

Nerede

X i = Teste giren kişi için gözlemlenen puan

X true = Teste giren kişi için gerçek puan - bu gerçekten sahip olduğum testin ölçtüğü gerçek kalite miktarıdır.

X error = Teste giren kişi için hata puanı - bu kişinin aldığı puan, çeşitli şans veya zaman faktörlerinin çalışmasından etkilenir.

Tüm ölçüm cihazları ve ölçüm yöntemleri “hatasız” olsaydı, o zaman her zaman insanların gerçek puanlarını alırdık ve aynı kişi grubundaki iki ölçüm arasındaki korelasyon her zaman + 1.00 ya da mükemmel güvenilirlik olurdu (her hangi bir değişiklik olmadığı varsayılarak). Gerçek puanların olması beklenir). Maalesef, bu tür hatasız ölçümler hiçbir zaman tamamen mümkün değildir, çünkü çok çeşitli şeyler? Belirli bir anda performansa katkıda bulunun.

Bu nedenle, xı herhangi bir özel ölçüm için gerçek X'den daha büyük veya daha küçük olabilir ve ölçümler arasında hesaplanan korelasyonlar her zaman birlikten daha azdır. Herhangi bir ölçüm cihazında insanlar arasındaki performansın varyansını, test mi yoksa röportaj mı, öngörücü mi yoksa kriter mi olduğunu resimli olarak göstermemiz açısından, bu toplam varyans, gerçek varyans ve hata varyansının iki ana bileşenine bölünebilir.

Toplam varyans = gözlemlenen test puanlarının toplam değişkenliği

Gerçek varyans = insanların ölçülen karakteristik değerlerinin gerçek miktarları bakımından değişkenliği

Hata sapması = insanların hata puanlarının değişkenliği

Güvenilirlik, gerçek varyansın toplam varyansa oranı olarak tanımlanabilir veya

Gerçek puan farkının oranı arttıkça veya bunun tersine, ölçüm sürecinde mevcut olan hata farkının miktarı azaldıkça, ölçümün güvenilirliği de artar. Güvenilirliği belirlemek için üç ana prosedürü farklılaştıran kritik faktör, neyin hata varyansı olarak kabul edilebilecek ve neyin doğru veya sistematik varyans olarak kabul edileceğine karar verme sürecidir. Herhangi bir test için tek bir güvenilirlik yoktur. Aksine, güvenilirlik o andaki ihtiyaçlara bağlı olacaktır.

Örneğin, psikolog ölçüm süreciyle ilgili aşağıdaki soru türlerinden herhangi birini sorabilir:

1. Bu test ile insanları herhangi bir zamanda ne kadar doğru ölçebilirim?

2. Günümüzde bu testle alınan önlemler aynı zamanda gelecekte aynı zamanda bu insanları temsil edecek mi?

3. Bu testteki puanlar, bu kişilerin test tarafından örneklenen özellikteki gerçek yeteneğini ne kadar doğru olarak temsil edecek?

Üçü de meşru güvenilirlik sorularıdır. Bununla birlikte, her biri test puanlarındaki çeşitli hata çeşitliliği kaynaklarına biraz farklı vurgu yapmaktadır.

Bu hata varyasyon kaynakları, Thorndike ve Hagen (1963) tarafından şöyle ifade edilmiştir:

1. Belirli bir andaki teste bağlı olarak değişiklik

2. Bireyde zaman diliminden zaman dilimine değişiklik

3. Ölçülen kaliteyi temsil etmek için seçilen belirli görev örneklerinden dolayı değişiklik

Şimdi, her bir yöntemin her bir kaynağa nasıl davranacağını belirleyebilmemiz için hata kaynaklarını göz önünde bulundurarak her bir güvenilirlik yöntemini incelemeye devam edelim.

Test-tekrar test Yöntemi:

Stabiliteyi değerlendirmek için açık bir yöntem, aynı ölçüm cihazıyla aynı kişinin performansını iki kere ölçmekten ibarettir. Bu güvenilirlik türü 1 ve 2 numaralı varyasyonları hata olarak içerir. Böylece ortaya çıkan güvenilirlik, gerçek skorun zaman içindeki stabilitesini ölçen bir güvenilirliktir. Bireylerin aynı testte iki kez ölçülmesiyle oluşturulan test-tekrar test yöntemiyle ilgili çok sayıda sorun vardır.

Örneğin, yönetimler arasındaki zaman aralığı oldukça uzun değilse, bir bellek faktörünün değişkeni, insanların ikinci yönetime verdikleri yanıtları önyargılı kılar. Başka bir zorluk, seçilen görevler veya öğelerin belirli örneklemine bağlı olarak meydana gelen değişimin, güvenilirliğe katkıda bulunan sistematik varyans olarak değerlendirilmesidir.

Bu nedenle, tesadüfen, daha fazla cevabı bilen herhangi bir kişi, çünkü bu kişinin hobisi üzerine dokunan birkaç test maddesinin ikinci yönetimde de tercih edileceğini, çünkü aynı örnekte, yeni bir numuneden ziyade aynı maddelerin tercih edildiğini; Kullanılmış. Bu nedenle, her iki testte de varyasyon kaynağı 3'ün gerçek varyans olarak değerlendirilmesinden dolayı yüksek puan almalıdır.

Paralel Testler Yöntemi:

Hata kaynağı 3'ü gerçek varyans olarak görmekten kaçınmanın bir yolu, ölçüm cihazının tamamen karşılaştırılabilir iki veya “eşdeğer” formunu kullanmaktır. Bu iki form, mümkün olduğu kadar özdeş olmalıdır, ancak her bir formdaki belirli maddeler veya sorular, her birinin seçilen benzer bir numune örneğini temsil etmelerine rağmen aynı olmayacaktır. Bir form birbiri ardına hemen uygulanabilir veya bir varyasyon kaynağının 2 hata varyansı olarak dahil edilmesiyle ilgili olup olmamasına bağlı olarak aralıklı olarak uygulanabilir.

Aralıklı test kullanıldığında bu tür bir güvenilirlik, yapılabilecek en sağlam stabilite değerlendirmesini temsil eder. Bununla birlikte, bir ölçüm cihazının alternatif biçimlerini oluşturmak çoğu zaman imkansızdır veya en iyi ihtimalle son derece zordur.

Kişi, bir iş performansı ölçüsünün iki alternatif fakat eşdeğer formunu veya kişisel tarih formunun iki alternatif formunu nasıl oluşturur? Pek çok durumda önemli bir zorluk olmadan değil. Bu gerçekten karşılaştırılabilir bir ölçüm cihazının eksikliği, psikologların test-tekrar test ve paralel form prosedürlerinin yanı sıra güvenilirliği değerlendirmek için ek yöntemler aramasına da neden olmuştur.

Bölünmüş Test Yöntemi:

Üçüncü ana güvenilirlik yöntemi genellikle bir ölçüm cihazının iç tutarlılığının bir ölçüsü olarak adlandırılır. Genel enstrümanın farklı alt bölümlerinde, insanların birbirine göre ne derece puan aldıklarının bir göstergesidir. Bu yöntem muhtemelen en yaygın kullanılan güvenilirlik ölçme yöntemidir, çünkü yalnızca bir formun oluşturulmasını gerektirir ve bu formun tekrarlanan uygulamalarını gerektirmez.

Mekaniği çok basittir. En temel haliyle, iç tutarlılık yöntemi, paralel formların aynı testin iki yarısı olduğu paralel form prosedürüdür. Bu yarı testler mümkün olduğu kadar eşdeğer olacak şekilde seçilmiştir, ancak çoğu zaman test tek sayılı tüm öğeleri bir yarıya ve tüm çift sayılı öğeleri diğer yarıya koyarak basitçe iki yarıya bölünmüştür. Buna split yarısı tekniğinin tek biçimli sürümü denir.

Toplam testin eşdeğer yarımlara ayrılmasının, sadece o testi puanlarken yapılırken, uygulamanın uygulanmasında olmadığını hatırlamak önemlidir. İki alt testin her biri orijinal olduğu sürece sadece yarısı olduğundan, her biri toplam testin yarısı kadar büyük bir davranış örneğini temsil eder. Bu nedenle, yarımlar arasındaki korelasyonun (güvenilirliğin) tüm teste dayanan puanların güvenilirliğinin önemsiz olduğu görülüyor.

Testin tamamının güvenilirliğinin ne olduğunu tahmin etmek için Spearman-Brown Prophecy formülü aşağıdaki gibi uygulanabilir:

rtt = 2r ½½ / 1 + r ½½

rtt = toplam testin güvenilirliği (tahmin edilen)

r 1/2 1/2 = testin iki yarısı arasında gözlenen korelasyon.

Örneğin, yarımlar arasında gözlenen korelasyon 0, 40 ise, Kehanet Formülü tüm testin güvenilirliğini şu şekilde tahmin eder:

rtt = 2 (0.40) / 1 + 0. 40 = 0.80 / 1.40 = 0.57

Böylelikle yarı yarı yöntemi, tek bir test ve tek bir uygulama ile güvenilirliği tahmin etmek için bir yöntem sunar. Bununla birlikte, kullanımının bazı sakıncaları vardır. Birinde öncelikli olarak hız faktörlerini içeren bir test olduğunda (bazı basit büro testleri gibi), alternatif yarı prosedürü sahte bir şekilde yüksek sonuç verir.

Hız testleri genellikle kolay öğeleri içerdiğinden, yalnızca doğru ya da yanlış olup olmadıklarını belirleyen cevap verilip verilmediği sorusudur. Bu nedenle, örneğin tek bir esasa göre testi bölmek, her iki yarı için de neredeyse aynı puanlara yol açacaktır - dolayısıyla yüksek pozitif korelasyon.

Kuder-Richardson Yöntemi:

Yarma yönteminin bir başka versiyonu da güvenilirliği ölçmek için sıklıkla kullanılır. Varyans analizi olarak bilinen istatistiksel bir teknikle ilgili olarak, en sık görülen şekli Kuder-Richardson prosedürü olarak bilinir. Kuder-Richardson (KR) yöntemi ayrıca, her test maddesini temel olarak bir test olarak ele alan dahili bir tutarlılık güvenilirliğidir, böylece iki yarıya sahip olmak yerine n, n ölçüm aletindeki toplam madde sayısıdır. KR tekniği, test maddelerinin çiftleri arasındaki olası tüm korelasyonları hesaplamakla eşdeğerdir (n [n - l] / 2 gibi çiftler olacaktır), bunların ortalamasını almak ve Spearman-Brown kehaneti formülünü kullanarak sonucu ayarlamak

Nerede

r tt = toplam testin tahmini güvenilirliği

r ii = maddeler arasındaki ortalama korelasyon

K = madde çifti sayısı

Bölünmüş yarım formlar prosedürü gibi, Kuder-Richardson prosedürü de varyasyon kaynağını 2 görmezden gelir ve hız testleri için uygun değildir.

Tablo 2.4'de bir özet karşılaştırma verilmiştir. Bu tablo, çeşitli güvenilirlik yöntemlerini gösterir ve bunları hata varyansı olarak içerdikleri çeşitlilik türleri açısından karşılaştırır.