İş Seçiminde Yer Alan Sorunlar ve Prosedürler

Psikoloğun kullanabileceği temel seçim modellerinin incelemesine geçmeden önce, genel çoklu tahmin modeline kısa bir bakışla kendimizi ilgilendirmek gerekir. Bu model genellikle çoklu regresyon modeli olarak adlandırılır. Genel tahmin paradigmasında, insanların bir yordayıcı (x ekseni veya abscissa) ve ölçüt üzerindeki puanları ile tanımlanan veri noktalarına uyması için bir regresyon çizgisi geliştiririz. y ekseni veya koordinat).

Şekil 3.1 böyle bir durumu göstermektedir. Şekil 3.1'deki regresyon çizgisi düz bir çizgidir ve her noktadan çizgiye (y eksenine paralel ilerleyen) 'mesafeli mesafelerin toplamını mümkün olduğunca küçük olacak şekilde yerleştirilir. X ile y arasında doğrusal bir ilişki olduğunu varsaydığımız için en uygun düz çizgiyi kullanıyoruz.

Düz bir çizgi için temel formül

y = a + bx

Y = ölçüt üzerine öngörülen puan

a = regresyon çizgisinin y eksenini geçtiği noktayı belirten bir sabit

b = ∆y / ∆x ile temsil edilen çizginin eğimi veya x'teki karşılık gelen bir değişiklik için gözlemlenen y değişimi

x = tahmin edicide gözlemlenen puan

Böylece, temel regresyon çizgisi modeli, Şekil 3.2'de gösterildiği gibi görünür.

Şekil 3.2'de, regresyon çizgisinin y eksenini 2 değerinde geçtiğini unutmayın. Böylece a = 2 Ayrıca, x'deki her 2 birim artış için, y'de karşılık gelen 1 birim artış olduğunu unutmayın. Böylece ∆y / ∆x = 1/2 = 0.5 = b. Regresyon denklemi daha sonra olur

y = 2 + 0, 5x

Herhangi bir x değeri göz önüne alındığında, buna karşılık ay skorunu tahmin etmemizi sağlayan bir regresyon çizgisine sahibiz. Örneğin, x 8 ise, o zaman

y = 2 + 0, 5 (8)

= 2 + 4

= 6

Özetlemek gerekirse: Tek yordayıcı durumunda, gözlemlenen noktalara en uygun düz çizgiyi hesaplar; “en uygun” terimi, çizgi çevresinde gözlenen değerlerin kare sapmalarının minimum olacağı anlamına gelir.

Bu en uygun çizgiyi tanımlayan a ve b sabitlerini hesaplamak için gerekli formüllere “en küçük kareler” formülleri denir ve aşağıdaki gibidir:

B formülü, yordayıcı ile ölçüt arasındaki kovaryans ve yordayıcıdaki toplam varyasyon oranıdır. Kriter sapması ve kestirim varyansı eşit olduğunda, b = r ya da regresyon çizgisinin eğimi korelasyon katsayısına eşittir.

İki tahmin:

Eğer X1 öngörücüsü, kriter puanlarının başarılı bir şekilde tahmin edilmesine katkıda bulunabiliyorsa ve eğer X 2 öngörücü de, ölçüt puanlarının başarılı bir şekilde tahmin edilmesine katkıda bulunabiliyorsa, o zaman her iki öngörücüyü birlikte kullanmak, her ikisini de kullanmanın daha iyi bir genel tahmin için izin vermesi gerektiğini kabul etmek mantıklıdır. bireysel olarak kestirici. Bununla birlikte, iki öngörücünün (birleştirildiğinde) öngörülebilirliği iyileştirme derecesi, en önemlisi iki öngörücü arasındaki korelasyon olan birkaç faktöre bağlıdır.

Örneğin, iki öngörücünün her birinin esas olarak bir ölçüt ile korelasyon gösterdiği, ancak birbirleriyle korelasyon göstermediği durumu göz önünde bulundurun:

Açıkça, yordayıcı 1 ile birlikte yordayıcı 2 kullanılarak çok fazla sayıda ek ölçüt varyansı açıklanabilir. İki veya daha fazla yordayıcıyla bir ölçüt arasındaki birleşik ilişki, çoklu korelasyon olarak adlandırılır ve R sembolü vardır. R ”değeri, birkaç yordayıcı kullanılarak açıklanabilecek toplam ölçüt varyansı miktarını temsil eder. 1 ve 2 belirteçleri birbirleriyle korele olmadığında, kare çoklu korelasyon katsayısının bireysel kare korelasyon katsayılarının ilave bir işlevi olduğu gösterilebilir veya

R2 c . 12 = r 2 1c + r 2 2c (3.1)

Bu nedenle, (tahmincilerin karşılıklı korelasyonu) sıfır olduğunda, kare çoklu geçerlilik, kare bireysel geçerliliklerin toplamıdır.

İki prediktör birbirleriyle korele olduğunda, işler biraz daha karmaşık hale gelir. Her bir tahmincinin önemli bireysel geçerliliğine sahip olduğu ancak r 12'nin oldukça büyük olduğu bir durumu (aşağıdaki diyagramdaki gibi) düşünün.

Bu öngörücüler arasındaki karşılıklı korelasyon nedeniyle, şema yordayıcı 2 ile ölçüt arasındaki örtüşme miktarının iki kısma ayrılabileceğini göstermektedir: yordayıcı 2'ye özgü olan alan ve yordayıcı 1 ile paylaşılan alan. Bu durumda ikinci bir tahminci, yalnızca 1 tahmincisi kullanılarak yapılabilecek olandan daha fazla kriter varyansı hesaplamamıza izin verir, ancak 2 ile öngörülen kriter varyansının tümü yeni bir varyans değildir. Bu nedenle, birden fazla öngörücü hakkında genel bir kural belirtilebilir.

Diğer tüm şeyler eşit olduğunda, öngörücüler arasındaki korelasyon ne kadar yüksek olursa, her iki öngörücüyü birlikte kullanarak toplam tahmin de o kadar az iyileşir. Tabii ki, uç durum, tahmincilerin kusursuz bir şekilde ilişkilendirildiği durum olacaktır ve öngörücü 2'nin seçim bataryamıza eklenmesiyle hesaba katılacak başka bir ölçüt varyansına sahip olmayacağız.

Birbiriyle ilişkilendirilen iki öngörücü olması durumunda, R2'yi ayrı geçerliliklerin bir işlevi ve öngörücüler arasındaki formül 2 ile yordayıcı arasındaki korelasyonun büyüklüğü olarak ifade edebiliriz.

R2 c . 12 = r 2 1c + r 2 2c - 2r 12 r 1c r 2c / 1 - r 2 12 (3, 2)

r 12 = 0 ise, formül 3.2’nin

R2 c . 12 = r 2 1 c + r 2 2 c

bu formül 3.1'dir.

Öngörülen korelasyonun çoklu korelasyon katsayılarının büyüklüğü üzerindeki etkisinin daha açık bir gösterimi, Tablo 3.1'den elde edilebilir; burada R ve R2 değerlerinin örnekleri, 0.30, 0.50 ve 0.70 geçerliliğine sahip olan öngörücü çiftler için verilmiştir. varsayımsal koşullar altında 0.00, 0.30 ve 0.60 arası korelasyon. Şekil 3.3, Tablo 3.1'de verilen verileri kullanarak genel eğilimi göstermektedir. Psikoloğun ahlaki oldukça açıktır - birbiriyle yüksek derecede alakalı tahminler kullanmaktan kaçının.

Tahmin Denklemleri:

İki yordayıcı durumdaki yordam denklemi, bir yordayıcı modelinin bir uzantısıdır. Denklemin genel şekli

y = a + b 1 x 1 + b 2 x 2 (3, 3)

Bu, düz çizgi yerine düzlem için denklemdir. Geometriye aşina olan okuyucu için, Şekil 3.4, denklem 3.3'e karşılık gelen x 1, x 2 ve y değişkenleri arasındaki ilişkilerin üç boyutlu bir çizimini sunmaktadır. A, b sabitlerini hesaplamaya izin veren ve en uygun regresyon düzlemiyle sonuçlanacak formüller mevcuttur. Bu sabitler belirlendikten sonra, sonuçta ortaya çıkan denklem, yeni iş başvurusunda bulunan adayların kriter performans tahminlerini yapmak için kullanılabilir;

Örneklemek gerekirse, altı aylık bir sürenin sonunda iki testten elde edilen puanları ve kriter verilerini içeren belirli bir ayda X işine alınan 100 erkeğe ait veriler olduğunu varsayalım. Bu veriler değişkenler arasındaki ilişkileri en iyi şekilde tanımlayan a, b 1 ve bi değerlerini belirlemek için analiz edilebilir.

Aşağıdaki denklemin sonuç olduğunu varsayalım:

y = 2 + 0.5x 1 + 0.9x2 (3.4)

Bu denklem, herhangi bir yeni işe alım için en muhtemel kriter puanının test 1'deki puanının yarısı artı test 2 + 2'deki puanının onda birine eşit olacağını söylüyor. Bu nedenle, yeni bir adayın test 1'de 20 ve test 2'de 30 puan alması durumunda, işe alınma tarihinden itibaren altı ay sonunda öngörülen kriter performansı

= 2 + 0.5 (20) + 0.9 (30)

= 2 - 10 + 27

= 39

İki öngörücü modelin, k'nın iş başarısının çok sayıda potansiyel ön-diksiyonu olduğu bir k öngörücü modele genişletilmesi, kavramsal olarak zor değildir. Modelimiz forma genişler

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 +… + b k x k (3, 5)

Bununla birlikte, böyle bir denklemdeki tüm sabitlerin en küçük kareler değerlerini çözme için hesaplama prosedürleri, bir tane bilgisayar imkânı bulunmadıkça oldukça karmaşık hale gelir. Okuyucu ayrıca, önceki bütün tartışmalarda, doğrusal bir dünya varsayımı, yani değişken çiftleri arasındaki tüm ilişkilerin doğrusal olanlar olduğunu ima ettiğini hatırlatır. Bu varsayımdan kaçınmak için çoklu regresyon modelini değiştirmek mümkündür, ancak bu bu kitabın kapsamı dışındadır.

Moderatörler:

Seçim ve yerleştirme teorisindeki en önemli kavramlardan biri moderatör değişkeni kavramıdır. Bazen bir popülasyon kontrol değişkeni olarak adlandırılır, bir moderatör değişkeni, sistematik olarak değiştiğinde, iki veya daha fazla diğer değişken arasındaki ilişkinin büyüklüğü üzerinde bir etkiye sahip olan herhangi bir değişken olarak görülebilir.

Belki de bir moderatörün nasıl işleyebileceğine dair varsayımsal bir örnek (Şekil 3.15), seçim süreci üzerindeki etkisini göstermeye hizmet edecektir. Üst saçılma grafiği, öngörücü ile bir kriter arasında genel olarak 0, 50 geçerlilik göstermektedir. Bununla birlikte, dağılım grafiğinde temsil edilen “nüfus”, her iki cinsi de içerendir, yani, hem erkek hem de kadınlar geçerliliğin belirlenmesinde gruplandırılmıştır. En üst dağılım grafiğinin geçici olarak denetlenmesi bile (erkek ve kadınlar burada yapıldığı gibi farklı kodlanmışsa), erkekler için gözlemlenen puanların, kadınlar için gözlemlenenden farklı olduğunu gösterir.

Tam olarak nasıl farklı olduklarının daha net bir resmini elde etmek için, Şekil 3.15'teki iki alt dağılım grafiği, öngörücü-kriter ilişkilerini erkekler ve kadınlar için ayrı ayrı göstermektedir. Şimdi fark çarpıcı. Erkekler için yüksek pozitif bir ilişki gözlemledik - geçerliliği 0, 80. Öte yandan, kadınlar için, öngörücü ile ölçüt arasında hemen hemen hiçbir ilişki olmadığını görüyoruz. Kadınlar için geçerlilik 0, 05'tir.

Yukarıdaki örnekteki moderatör değişkeni elbette cinsiyet değişkenidir. Belirleyici ve ölçüt arasındaki ilişki, denetleyiciyi değiştirmeden büyük ölçüde etkilenir. “Tahmimin geçerliliği nedir” sorusu açıkça daha karmaşık hale gelir. Başlangıçta orta derecede saygın bir geçerlilik olarak görünen şey şimdi iki oldukça belirgin ve ayrı geçerliliğe dönüştü - biri çok yüksek diğeri çok düşük.

Bu son geçerliliklerin bir ismi koşullu geçerlilikler, yani, nüfusun kadınlardan oluştuğu veya nüfusun erkeklerden oluştuğu düşünüldüğünde öngörücünün geçerliliği olabilir. Moderatör değişkenlerinin ilginç bir özelliği, moderatörün yordayıcı veya kriter değişkeni ile doğrudan bir ilişkiye sahip olması gerekmemesidir (yani, rm ve rm = 0).

Moderatör örnekleri:

Bazı araştırmacı araştırmalarda moderatörlerin gerçek örnekleri bulundu. Örneğin Vroom (1960), yöneticilerin ve birinci basamak denetçilerin motivasyon derecesini ılımlı değişken olarak kullanan, oldukça belirgin moderatör etkileri buldu. Çalışılan tüm erkekler, küçük bir paket ve parselleri departmandan ve diğer perakende mağazalardan özel konutlara ulaştırma konusunda uzmanlaşmış, ulusal bir teslimat servis şirketinin Chicago ya da New York fabrikasında çalışanlardı. Moderatör kavramını en iyi gösteren çalışmanın verileri Tablo 3.4'de verilmiştir.

Araştırmada elde edilen çeşitli motivasyon endekslerinin bir bileşimini kullanarak, tüm denetçiler değerlendirilmiş motivasyon derecelerine göre üç gruba ayrıldı. Sözel olmayan muhakeme kabiliyetini test etmek için geçerliliği bu adamların dört farklı denetim derecesinin her biri için elde edildi.

Bu her motivasyon seviyesinde ayrı ayrı yapıldı. Tablo 3.4'ün gösterdiği gibi, test, görünüşe göre, sadece motivasyonu yüksek olan erkekler göz önüne alındığında, bir erkek tarafından amiri tarafından ne kadar yüksek derecelendirileceğini belirleyen oldukça geçerli bir belirleyiciydi. Motivasyon seviyesini sadece orta ya da düşük motivasyon seviyesine sahip gruplara taşıyarak sistematik olarak değiştirirsek, test ile ölçüt arasındaki ilişkide ilgili sistematik bir değişiklik görürüz. Çalışanın motivasyonu ne kadar düşük olursa, yordayıcının geçerliliği o kadar az, geçerliliği düşük motivasyon grupları için bile negatif olur.

Moderatörlerin diğer örnekleri, Dunnette ve Kirchner (1960) ve Ghiselli ve çalışma arkadaşları (1956, I960) tarafından yapılan çalışmalarda bulunabilir. Dunnette ve Kirchner’in çalışmaları, öncelikle her bir iş grubu içerisinde maksimum tahminde bulunma konusunda sorumlulukları bakımından benzer işlere gruplanan işle ilgili moderatörlerin belirlenmesine yöneliktir.

Ghiselli'nin yöntemi “değişkensiz” bir moderatör sistemi olarak adlandırılabilir, insanlar başarılarının ne kadar iyi tahmin edilebileceği temelinde, herhangi bir dış değişkene doğrudan bir referans olmadan kolayca gruplanabilir. Fredericksen ve Gilbert (I960), moderatör etkisinin zaman içinde tutarlı olabileceği dereceyi belirlemek için moderatörler üzerinde araştırmalar yaptı. 1954 çalışmasında tanımlanan bir moderatörün (Fredericksen ve Melville, 1954) hala bir I960 takibinde çalıştığını buldular.

Modern ve Geleneksel Seçim Teorisi:

Moderatör değişkeni kavramı belki de en iyi seçim ve yerleştirme vurgusundaki modem eğilimini gösterir. Geleneksel olarak, seçim ve validasyon, en basit şekilde güvenilir görünen bir kriter ve bu kriteri en iyi tahmin edebilecek bir tahmin belirleyerek en iyi çözülmüş olarak görülen problemler olmuştur.

Vurgu, neredeyse tamamen, çeşitli durumlarda elde edilen korelasyonu ekleyebilecek veya çıkarabilecek birçok ek değişkenleri keşfetmeye yönelik düşüncesiz veya hiç düşünmeyecek şekilde yüksek bir geçerliliğin kurulmasına dayanıyordu. Seçim metodolojisinin her zaman çok tipik göründüğü genel sloganı “İşe yararsa, kullan!” Sloganıydı.

Şüphesiz bu politika, endüstriyel psikolojideki oldukça farklı gelişmelerden sorumluydu. İlk olarak, muhtemelen psikologların sanayiye kabul edilme derecesine katkıda bulunmuştur. Yönetim, genellikle, gelişmiş seçim ile temsil edilen pozitif sonuçlara yöneliktir ve nasıl başarıldığı ile fazla ilgilenmez.

Bununla birlikte, ne yazık ki, bu oryantasyon muhtemelen öngörüdeki geçerliliğin son 50 yıl içerisinde (eğer varsa) önemli ölçüde artmadığı gerçeğinden de sorumludur - bu tür bir çalışmaya katılan psikologların çabaları konusunda oldukça rahatsız edici bir yorum.

Çok sayıda geçerlilik çalışmasına ilişkin 1955 tarihli bir incelemede, Ghiselli (1955) 0, 50 ya da daha iyi bir geçerlilik katsayısı almanın gerçekten olağandışı bir olay olduğunu belirtmiştir. Şekil 3.16, Ghiselli'nin farklı işler için değişen büyüklükteki değişkenlik katsayıları katsayıları tarafından sunulan frekans dağılımlarını göstermektedir. Bilgilendirici olarak istihbarat testlerini ve ölçüt olarak yeterlilik önlemlerini kullanan büro çalışanları için geçerliliklerin dağılımında, 0, 50'in üzerinde çok sayıda geçerlilik bulunduğunu unutmayın.

Moderatörlerdeki mevcut ilgi, seçime yönelik daha geniş ve biraz daha karmaşık bir yaklaşımı temsil etmektedir. Toops'un (1948) psikologlara, insanları (örneğin, çalışanları) sistematik olarak kişisel değişkenlere göre sistematik olarak sınıflandırmasıyla, bir kişinin tahminde bulunabilmesi olasılığını düşünmesi için bir temyiz başvurusu yapıldığı zamana kadar izlenebilir. Ek prosedürü olarak adlandırdığı sınıflandırma yöntemi, moderatörlerin öncüsüdür.

Dunnette'in Seçim Modeli:

Belki de seçim metodolojisine yönelik mevcut görüş en iyi şekilde Dunnette (1963) tarafından önerilen seçim modeliyle temsil edilebilir. Bu model, Şekil 3.17'de verilen şemada gösterilmiştir ve seçim durumunda var olan karmaşıklıkların ve ilişkilerin labirentine işaret etmek için tasarlanmıştır. Model, yalnızca seçimin dinamik yapısını ortaya koyma girişiminin ötesinde bir şey olarak görülebilir - ayrıca psikologların bu dinamiklerden faydalanmalarını ve öngörülebilirliği arttırmak için bunları en iyi avantaj için kullanmalarını sağlar.

Muhtemelen, modelin temsil ettiği bakış açısını, Dunnette'in (1963, s. 318) kullandığı tam tanım açısından anlayabilir:

Değiştirilmiş tahmin modelinin, yordayıcılar ve çeşitli yordayıcı kombinasyonları arasında meydana gelebilecek karmaşık etkileşimleri, bireylerin farklı gruplarını (veya türlerini), işle ilgili farklı davranışları ve bu davranışların kuruluşun amaçlarına göre sonuçlarını dikkate aldığına dikkat edin. . Model, tahmincilerin, bireylerin farklı altkümelerinin davranışlarını tahmin etmek için farklı olarak faydalı olma ihtimalini mümkün kılmaktadır.

Ayrıca, benzer iş davranışlarının, yordayıcılar ve bireyler arasındaki gruplar arasındaki oldukça farklı etkileşim kalıpları ile tahmin edilebileceğini ya da yordayıcılar üzerindeki aynı performans seviyesinin, farklı bireyler için büyük ölçüde farklı iş davranışı kalıplarına yol açabileceğini göstermektedir. Son olarak, model aynı veya benzer iş davranışlarının durumsal filtreden geçtikten sonra oldukça farklı organizasyonel sonuçlara yol açabileceği rahatsız edici gerçeği kabul eder.

Moderatörlerin farkındalığı ve Dunnette'in seçim modeli tarafından temsil edilen seçimdeki mevcut eğilim, hem seçim verimliliğinin artması hem de doğru tahmin dinamiklerini anlama derecesinde ilerleme ile sonuçlanmalıdır.

Bastırıcı Değişkenler:

Herhangi bir baskılama değişkeninden söz edilmeden seçim tartışması tamamlanmayacaktı. Bir anlamda, bir bastırıcı değişken, ölçüt değişkeniyle kendisi arasında bir ilişki olmasa da, belirli bir öngörücü-ölçüt ilişkisinin büyüklüğü üzerinde bir etkiye sahip olabilen bir değişken olan, 'ölçüt-ölçüt ilişkisinin büyüklüğü üzerinde bir etkiye sahip olabilen bir değişken olarak tanımlanır. ”

Bir bastırıcı değişkenin öngörmedeki dinamikleri en iyi şekilde kısmi bir korelasyon kavramı ve bununla ilgili ölçüsü, yarı-kısmi korelasyonu tekrar gözden geçirerek anlaşılabilir. Birinde iki kestirici ve burada gösterildiği gibi karşılıklı korelasyon gösteren bir kriter vardı. ölçüt ile r1c olan belirteç x arasındaki kısmi korelasyon . 2, x2'nin her ikisinden de etkilendikten sonra x 1 ve C arasındaki korelasyon olarak tanımlandı,

Diyelim ki korelasyonu hesaplamadan önce X2'nin etkilerini yalnızca ölçütten kaldırmak istediğimizi varsayın. Böyle bir korelasyon, yarı-kısmi veya kısmi bir korelasyon olarak adlandırılır. Örneğin, istihbarat testi puanları (tahmincimiz x 1 ) ve yazma eğitimi programının sonunda (yetenek) x 2 arasındaki nihai beceri seviyesi arasındaki korelasyon ile ilgilenebiliriz; x 2, tüm çalışanların başlangıçtaki beceri seviyesini temsil edebilir. eğitim kursuna başlamadan önce yazma hızları. Bu nedenle, istihbarat testimizin geçerliliğini hesaplamadan önce ilk beceri seviyesinin nihai performans üzerindeki etkilerini kaldırmak istiyoruz.

Yarı-kısmi ilişkimiz şimdi:

Bir süpresör değişkeni mekanizması, yukarıda (1) genel olarak belirtilmedikçe, x 2 değişkeni, sadece kritere olan (eğer varsa) kıstasla ilişkisine sahiptir ve (2) bir tanesi, etkilerini x 1 belirleyicisinden kaldırmakla ilgilenir.

Genel durum bu nedenle aşağıdaki gibi çizilebilir:

Kısmi veya yarı-kısmi korelasyonların değişkenler arasındaki basit korelasyondan daha büyük veya daha küçük mü olacağını kesin olarak tahmin edemiyoruz, çünkü hem paytörün hem de paydanın büyüklüğü partialling işleminden etkileniyor. Bunun tek zamanı, toplanan değişkenin, baskılayıcıda olduğu gibi, diğer iki değişkenden biriyle ilgili olduğu zaman değildir. Böyle bir durumda sadece payda daha sonra etkilenir (varyans kaldırılır) ve elde edilen yarı-kısmi korelasyon, değişkenler arasındaki basit parti-dışı korelasyondan daha büyüktür.

Çapraz doğrulama:

Çoğu çoklu tahmin seçim sisteminin bir özelliği, geliştirilmesinde tipik olarak, doğrulama amacıyla kullanılan çalışanların örnekleminde var olan şans varyasyonundan faydalanma eğiliminde olmasıdır. Bu, çoklu regresyon modelinde özellikle doğrudur, ancak çoklu kesme prosedürü için de geçerlidir. Çoklu regresyon modeli en küçük kareler özelliğine sahip olduğu için, yani, belirli bir örneğimizi öngörmedeki hataları bilinçli olarak en aza indirdiğimiz için, eğer şimdi denklemimizi yeni bir örneğe uygularsak (aynı popülasyondan) tahminimizi bulamayacağımız muhtemeldir. eskisi kadar verimli.

Bu nedenle, hesaplanan R2, tahmin sistemimizin gelecekteki geçerliliğinin ne kadarının aşırı olduğu konusunda bir tahmindir, çünkü denklemimizi tahmin amacıyla kullanmak otomatik olarak yeni çalışan örneklerine uygulamak anlamına gelir. R2'de beklenen bu düşüş, istatistikte büzülme problemi olarak bilinir ve en iyi şekilde Şekil 3.18 incelenerek gösterilebilir.

Şekil 3.18'de iki örnek bireyimiz var. Her biri, aynı popülasyondan alınmış veya aynı popülasyona ait rastgele bir örneği temsil eder. Örneğin, A örneği, tek sayılı aylarda X işi için tüm iş başvuru sahiplerini temsil edebilir ve B örneği, belirli bir yıl için çift sayılı aylarda tüm iş başvurularını temsil edebilir.

Her bir numunede çok sayıda başvuru sahibi olsa bile, iki numunenin dağılım grafikleri bakımından aynı olması çok olağandışı olacaktır. Saçılma alanlarının örnekleme hatası nedeniyle değişmesi beklenebileceğinden, yordayıcı ile ölçüt (geçerlilik) arasındaki korelasyonun, her numunede hesaplanan regresyon denklemi gibi biraz değişmesi de beklenebilir.

Örnek A'da hesaplanan regresyon denklemini aldığımızı ve örnek B'den gelen puanları tahmin etmek için kullandığımızı varsayalım. B regresyon çizgisini kullanabildiğimiz kadarıyla B örneğiyle A çizgisini kullanmanın en aza indirilmesinde açıkça iyi bir iş yapamadık. B çizgisi tanım gereği bu örnek için Σd 2'yi en aza indirir. Bu nedenle, diğer tüm hatlarda bununla ilişkili daha büyük bir hata olacaktır. Bu nedenle, R2 buna uygun olarak azaltılmalıdır.

Bu denklemi yeni bir örneklemde kullanırken beklenebilecek büzülme miktarını tahmin etmek için formüller vardır. Böyle bir formül

R2 8 = 1 - [(1 - R2) n-1 / n - k - 1]

Nerede

R2 = büzülmüş çoklu korelasyon karesi

R2 = validasyon örneğinden elde edilen çoklu korelasyon karesi

n = doğrulama örneğindeki kişi sayısı

k = regresyon denkleminde prediktör sayısı

Bununla birlikte, ikinci bir örnek alarak ve ne kadar iyi tahmin edeceğini görmeye çalışarak denklemi çapraz doğrulamak en iyisidir. Çok büyük bir düşüş olduğu ortaya çıkarsa, kişi denklemi gözden geçirmek isteyebilir (belki her iki örneği de bir grupta birleştirerek). Büyük büzülme, genellikle örnek boyutları küçük olduğunda ve / veya öngörücü sayısı, örnek boyutuna göre büyük olduğunda bulunur.

Mosier (1951) çalışmanın tasarımına ve sadece yeni bir örneğe genelleme konusunda mı yoksa kalıp tahmin denklemi ile ilgili daha geniş genellemeler isteniyorsa (örneğin, genel tahminler isteniyorsa) yapılabilecek bazı çapraz doğrulama türlerini tartışmıştır., farklı cinsiyetlere, farklı kriterlere vb. Birincisine geçerlilik genellemesi durumu denir; ikincisi, geçerlilik süresinin uzatılması durumudur. Tabii ki, ikinci durumda daha büyük daralma beklenir ve geçerlilik genellemesi için% 3.9 formülü geçerlidir.