Testin Geçerliliği: 6 Çeşit

Aşağıdaki altı geçerlilik türü popüler olarak kullanımdadır, Yüz geçerliği, İçerik geçerliliği, Tahmini geçerlilik, Eşzamanlı, Yapı ve Faktör geçerliliği. Bunların dışında içerik, prediktif, eşzamanlı ve yapı geçerliği, psikoloji ve eğitim alanında kullanılan önemli olanlardır.

Bunlar aşağıda tartışılmaktadır:

Tip # 1. Yüz Geçerliliği:

Neyin ölçüleceğini ölçmek için testin göründüğü ölçüde Yüz Geçerliliği.

Yüz geçerliliği, bir testin geçerli görünüp görünmediğini, yani dış görünümden öğelerin istenen yönü ölçmek için görünüp görünmeyeceği anlamına gelir. Eğer bir test, test yazarının ölçmek istediğini ölçerse, testin geçerliliği olduğunu söyleriz. Dolayısıyla, yüz geçerliliği testin neyi ölçtüğünü değil, testin 'ölçmek için göründüğü' ifadesini ifade eder. Testin içeriği açıkça uygunsuz, alakasız görünmemelidir.

Örneğin, “Ek olarak beceri” ölçmek için yapılan bir test yalnızca ek öğeleri içermelidir. Bir kişi nesnelerden geçtiğinde ve tüm öğelerin ek olarak beceriyi ölçmekte göründüğünü hissettiğinde, testin yüz tarafından onaylandığı söylenebilir.

Her ne kadar bir testin geçerliliğini değerlendirmek için etkili bir yöntem olmasa da ve genellikle hala kullanılmadığı için testin onaylanmasında ilk adım olarak kullanılabilir. Test yüze doğrulandıktan sonra geçerlilik katsayısını hesaplamak için daha ileriye gidebiliriz.

Ayrıca, bu yöntem bir test yapıcısının amaca uygun test maddelerini revize etmesine yardımcı olur. Bir testin hızlı bir şekilde yapılması gerektiğinde veya bir teste acil olarak ihtiyaç duyulduğunda ve geçerliliği diğer etkin yöntemlerle belirlemek için zaman veya kapsam bulunmadığında, yüz geçerliliği belirlenebilir.

Bu tür geçerlilik yüz düzeyinde çalıştığı için yeterli değildir ve bu nedenle son çare olarak kullanılabilir.

Tip # 2. İçerik Geçerliliği:

İçerik Geçerliliği, test maddelerini öğretim hedefleriyle eşleştirme sürecidir.

İçerik geçerliliği, bir testin, özellikle bir başarı testinin yararlılığı için en önemli kriterdir. Ayrıca, Rasyonel Geçerliliği veya Mantıksal Geçerliliği veya Müfredat Geçerliliği veya İç Geçerliliği veya İç Geçerliliği olarak da adlandırılır.

İçerik geçerliliği, testin ölçmek istediği davranışları temsil eden unsurları içeren bir testin derecesini veya derecesini belirtir. Test maddelerinin tüm içeriğin ve öğretim hedeflerinin gerçek temsilcisinin gerçekliği ne kadardır? Testin içerik geçerliliği olarak adlandırılır.

İçerik geçerliliği, test maddelerinin uygunluğunu değerlendirerek tahmin edilir; yani test maddeleri ölçülecek olan özelliğin tüm içeriğini ve davranışsal alanlarını uygun şekilde kapsamalıdır. Konu konusu veya davranıştaki değişiklik hakkında fikir verir.

Bu şekilde, içerik geçerliliği, bir testin ölçeceğimiz davranışı temsil eden öğeleri içerme derecesini ifade eder. Testin öğeleri, tüm içerik alanının ilgili tüm özelliklerini ve hedeflerini doğru oranda içermelidir.

Testi yapmadan önce, test yapan, popüler olarak “Spesifikasyon Tablosu” olarak bilinen iki yönlü bir içerik ve amaç tablosu hazırlar.

Matematikte bir başarı testi olduğunu varsayalım. Cebir, Aritmetik, Geometri, Mensubiyet ve Trigonometri'den gelen öğeleri içermeli ve ayrıca bilgi, anlayış, beceri, uygulama vb gibi farklı davranış amaçlarını ölçmelidir. Dolayısıyla, farklı içerik alanına ve amaçlarına gereken ağırlığın verilmesi zorunludur.

Matematikte 'şartname tablosu' örneği aşağıdaki tabloda gösterilmiştir:

Tablo, ölçülecek öğrenme görevlerinin örneğini yansıtmaktadır. Test öğeleri belirtilen numuneye ne kadar yakınsa, tatmin edici içerik geçerliliğine sahip olma olasılığı o kadar artar. Bu nedenle, bir testteki öğelerin uzman bir ekip tarafından taranması arzu edilir. Tablodaki hücrelere çeşitli maddelerin yerleştirilmesinin uygun olup olmadığını ve Tablodaki tüm hücrelerin yeterli sayıda maddeye sahip olup olmadığını kontrol etmeleri gerekir.

Yeterlilik, müfredatı tasarlayan uzmanlar ekibine göre, farklı objektif içerik tablosuna verilen ağırlık bakımından değerlendirilmelidir.

İçerik geçerliliğini sağlamak için bazı genel noktalar aşağıda verilmiştir:

1. Test, standartların üstünde veya altında olmayan istenen öğrenci seviyesine hizmet etmelidir.

2. Dil, öğrenci seviyesine kadar olmalıdır.

3. Müfredatta bulunmayan hiçbir şey testlere dahil edilmemelidir.

4. Müfredatın her bölümüne gerekli ağırlık verilmelidir. Müfredatın daha önemli bölümlerinden daha fazla madde seçilmelidir.

Sınırlamalar:

1. İçeriğin farklı kısımlarına verilecek ağırlık özneldir.

2. Mükemmel bir objektif test oluşturmak zor.

3. İçeriğin geçerliliği, İstihbarat, Başarı, Tutum testleri ve bir dereceye kadar Kişilik testleri için yeterli veya yeterli değildir.

4. Farklı davranış değişikliklerine verilen ağırlık objektif değildir.

Tip # 3. Tahmini Geçerlilik:

Tahmini Geçerlilik sınavının öğrencilerin gelecekteki performansını ne ölçüde öngöreceği.

Tahmini geçerlilik, bir testin tahmin kapasitesi ile ilgilidir. Bir testin belirli bir alanda gelecekteki sonuçlarını tahmin etme veya tahmin etmedeki etkinliğini gösterir. Test kullanıcısı, bir bireyin gelecekteki performansını tahmin etmek ister. Test puanları gelecekteki davranışları veya performansları tahmin etmek için kullanılabilir ve bu nedenle öngörücü geçerlilik olarak adlandırılır.

Tahmini geçerliliği bulmak için test cihazı test puanlarını teknik olarak “Kriter” olarak bilinen testecinin sonraki performansı ile ilişkilendirir. Kriter, testin tahmin etmek veya ölçmek için tasarlandığı bağımsız, harici ve doğrudan bir ölçümdür. Bu nedenle, aynı zamanda “Kriterlere İlişkin Geçerlilik” olarak da bilinir.

Tahmini veya ampirik geçerlilik, Cureton (1965) tarafından test puanları ile gerçek ölçüt arasındaki korelasyon katsayısının bir tahmini olarak tanımlanmıştır.

Bir örnek, konsepti daha iyi açıklayabilir.

Örnek:

MBBS kurslarına kabul edilmek üzere aday seçmek üzere tıbbi giriş testi yapılır ve uygulanır. Adayların bu testte aldıkları puanlara dayanarak adayları kabul ediyoruz.

Bu kursu tamamladıktan sonra son MBBS sınavında belirirler. Final MBBS sınavının sonuçları kriterdir. Giriş testi ve final sınavı (ölçüt) puanları arasında korelasyon vardır. Yüksek korelasyon, yüksek prediktif geçerlilik anlamına gelir.

Diğer işe alım testleri veya Ziraat, Mühendislik, Bankacılık, Demiryolu vb. Giriş sınavları gibi benzer örnekler, yüksek yordayıcı geçerliliği olması gereken burada belirtilebilir.

İşe alım, sınıflandırma ve giriş sınavlarında kullanılan testlerin yüksek yordayıcı geçerliliği olması gerekir. Bu tür geçerliliğe, bazen değerlendirmemiz öncelikle ampirik ve istatistiksel olduğundan, “Ampirik geçerliliği” veya “İstatistiksel geçerliliği” denir.

Sınırlama:

Test sonuçlarımızın ilişkilendirileceği uygun bir kriter ölçüsü alırsak, testin öngörü geçerliliğini belirleyebiliriz. Ancak iyi bir kriter almak çok zor. Ayrıca, her türlü psikolojik test için ölçüt alamayabiliriz.

Tip # 4. Eşzamanlı Geçerlilik:

Test puanlarını bir başka kriter puanları seti ile ilişkilendiren Eşzamanlı Geçerlilik.

Eşzamanlı geçerlilik, test puanlarının ölçüt olarak bilinen önceden belirlenmiş veya kabul edilmiş performansa ne ölçüde karşılık geldiği anlamına gelir. Yeni inşa edilmiş bir testin geçerliliğini bilmek için, mevcut bazı bilgilerle ilişkilendirilir veya karşılaştırılır.

Böylece bir test aynı anda mevcut bazı bilgilere karşı doğrulanır. Yeni inşa edilmiş bir testten elde edilen puanlar önceden belirlenmiş test performansı ile ilişkilidir. Bir istihbarat testi hazırladığımızı varsayalım.

Bunu öğrenci grubuna uygularız. Stanford-Binet testi de aynı gruba uygulanır. Şimdi yeni yapılan testimizde test puanları ve Stanford-Binet Zeka Testinde öğrencilerin yaptıkları test puanları ilişkilendirildi. Korelasyon katsayısı yüksekse, istihbarat testimizin eş zamanlı geçerliliğinin yüksek olduğu söylenir.

'Eşzamanlı' teriminin sözlük anlamı 'var' ya da 'aynı anda yapılır'. Dolayısıyla “eşzamanlı geçerlilik” terimi, yeni testin verilmesinden kısa bir süre önce veya kısa bir süre sonra elde edilebilecek mevcut veya mevcut bilgi kaynağıyla (kriter) puanlarını ilişkilendirerek yeni bir testin onaylanma sürecini belirtmek için kullanılır.

Yeni inşa edilmiş bir başarı testinin eşzamanlı geçerliliğini tespit etmek için, puanları aynı öğrenciler tarafından son sınavlarında veya bir sonraki sınavda aldıkları puanlarla ilişkilendirilir. Böylece bir test aynı anda mevcut bazı bilgilere karşı doğrulanır. Bir ölçüt almak için uzun süre beklememiz gerekmiyor.

Prediktif geçerlilik, eski geçerlilikte geleceğin ölçüt ölçüsü almasını beklememiz anlamında eşzamanlı geçerliliğinden farklıdır. Ancak eş zamanlı geçerliliği kolaylaştırmak için daha uzun boşlukları beklememiz gerekmez.

Buradaki 'eşzamanlı' terimi, aşağıdaki özellikleri ifade eder:

1. Geçerliliği incelenen ve geçerliliği kanıtlanmış olan iki test - aynı içerik alanını belirli bir seviyede ve aynı amacı kapsamalıdır;

2. Her iki test için popülasyon aynı kalır ve iki test neredeyse benzer ortamlarda uygulanır; ve

3. Her iki testteki performans verileri neredeyse aynı anda elde edilebilir.

Bu geçerlilik türü “Dış Geçerlilik” veya “İşlevsel Geçerlilik” olarak da bilinir. Eşzamanlı geçerlilik, gelecekteki başarının öngörülmesinde değil, tanı için kullanılan testlerle ilgilidir.

Tip # 5. Yapı Geçerliliği:

Yapı Geçerliliği, bir teorik yapı veya psikolojik değişkeni ölçmek için testin ne kadarının söylenebileceğidir.

Bir yapı çoğunlukla psikolojiktir. Genellikle bir özellik veya zihinsel sürece atıfta bulunur. Yapı doğrulama, belirli bir testin test etmenin ölçmeyi amaçladığı psikolojik yapıları ne ölçüde ölçeceğini belirleme sürecidir.

Bir testin, operasyonel olarak tanımlanmayan soyut özellikleri veya nitelikleri ne ölçüde ölçtüğünü gösterir.

Gronlund ve Linn, “Yapı doğrulama, belki de test performansının bir ya da daha fazla psikolojik yapı olarak ne ölçüde yorumlanabileceğini belirleme süreci olarak tanımlanabilir” dedi.

Ebel ve Frisbie, “Yapı doğrulama, verilen testin gerçekten de test yapanların ölçmek için tasarladığı psikolojik yapıyı ölçtüğü görüşünü destekleme kanıtı toplama sürecidir.

Yapı geçerliliği “Psikolojik Geçerliliği” veya “Özellik Geçerliliği” veya “Mantıksal Geçerliliği” olarak da bilinir. Yapı geçerliliği, test puanlarının yapı olarak incelenmesi anlamına gelir. Bir testin ölçtüğü yapı veya psikolojik özellikleri inceler.

Testin kişilik özelliklerini veya test yapıcı tarafından tanımlanan zihinsel süreçleri ne ölçüde ölçtüğü testin yapı geçerliliği olarak bilinir.

Zeka, tutum, matematiksel yetenek, eleştirel düşünme, çalışma becerileri, kaygı, mantıksal akıl yürütme, okuduğunu anlama vb. Üzerinde testler yaparken yapı geçerliliği için gitmemiz gerekir. Örneğin, 'samimiyet testi' alın.

Bu tür testler yapılmadan önce, test yapıcı sorularla yüzleşir:

1. Samimiyet kavramının tanımı ne olmalıdır?

2. Samimi bir kişiden ne tür davranışlar beklenir?

3. Ne tür davranışlar samimiyet ile samimiyet arasında ayrım yapar?

Her yapının, bir öğrencinin davranışını tanımlamak ve tahmin etmek için üstesinden gelebilecek bir teorisi vardır.

Gronlund (1981), yapı geçerliliğini belirlemek için aşağıdaki üç adımı önerir:

(i) Test performansını hesaba katan varsayılan yapıları tanımlayın.

(ii) Test performansı ile ilgili hipotezleri her bir yapının altında yatan teoriden türetmek.

(iii) Hipotezleri mantıksal ve ampirik yollarla doğrulayın.

Yapı geçerliliğinin çıkarımsal olduğu not edilmelidir. Öncelikle, testin geçerliliğini belirtmek için diğer geçerlilik türleri yetersiz olduğunda kullanılır. Yapı geçerliliği genellikle çalışma alışkanlıkları, takdir, dürüstlük, duygusal istikrar, sempati vb.

Tip # 6. Faktoring Geçerliliği:

Faktoring Geçerliliği, farklı faktörlerin tüm test ile korelasyonunun ölçüsüdür.

Faktör geçerliliği, faktör analizi olarak bilinen istatistiksel bir teknikle belirlenir. Testi oluşturan etkenleri (yetenek olarak söz edilebilir) tanımlamak için karşılıklı korelasyon açıklama yöntemlerini kullanır.

Diğer bir deyişle, karşılıklı korelasyon yöntemleri ve diğer istatistiksel yöntemler, faktoring geçerliliğini tahmin etmek için kullanılır. Testin her bir faktörle olan korelasyonu, bu faktörlerin her birinin testin toplam performansına katkısı olan ağırlığı belirlemek için hesaplanır.

Bu bize faktör yüklerini anlatıyor. Farklı faktörlerin test ile bu ilişkiye faktoring geçerliliği denir. Guilford (1950), faktoring geçerliliğinin, bir test önleminin ne olduğuna dair en net açıklama olduğunu ve elbette diğer geçerlilik türleri yerine tercih edilmesi gerektiğini önerdi.