Kanonik Korelasyon: İki Değişken Seti Arasındaki İlişki Analizi
Araştırmalarda sıklıkla iki değişken seti arasındaki ilişki merak edilir: Öğretim yöntemleri seti (aktif öğrenme, teknoloji kullanımı, geri bildirim sıklığı) ile öğrenci çıktıları seti (akademik başarı, motivasyon, tutum) arasında nasıl bir ilişki vardır? Bu tür çok değişkenli ilişki sorularını yanıtlamak için kanonik korelasyon analizi (canonical correlation analysis) kullanılır. Kothari'ye (2004) göre kanonik korelasyon, "iki değişken seti arasındaki ilişkiyi en kapsamlı biçimde ortaya koyan çok değişkenli bir tekniktir" ve çoklu regresyonun en genel hali olarak kabul edilir. Bu yazıda kanonik korelasyon analizinin temel kavramlarını, yorumlama adımlarını, varsayımlarını ve diğer tekniklerle ilişkisini kapsamlı biçimde ele alacağız.
Kanonik Korelasyon Analizi Nedir?
Kanonik korelasyon analizi, iki değişken seti arasındaki ilişkinin maksimum düzeyde ortaya konmasını sağlayan çok değişkenli bir istatistiksel tekniktir. Her setten birer doğrusal kombinasyon (kanonik değişken) oluşturulur ve bu iki doğrusal kombinasyon arasındaki korelasyon maksimize edilir (Cohen, Manion ve Morrison, 2007).
Kanonik korelasyonun temel özellikleri:
- İki değişken seti: Bir "bağımsız" (yordayıcı) set ve bir "bağımlı" (ölçüt) set olarak düşünülebilir; ancak matematiksel olarak iki set simetriktir.
- Doğrusal kombinasyonlar: Her setten birer doğrusal kombinasyon oluşturularak kanonik değişken çiftleri elde edilir.
- Maksimum korelasyon: İlk kanonik değişken çifti, iki set arasındaki korelasyonu maksimize eder; sonraki çiftler kalan korelasyonu yakalar.
- Birden fazla fonksiyon: Oluşturulabilecek kanonik fonksiyon sayısı, küçük setteki değişken sayısına eşittir.
Kanonik Değişkenler ve Kanonik Fonksiyonlar
Kanonik korelasyon analizinde iki değişken setinden doğrusal kombinasyonlar oluşturulur. Bu kombinasyonlar kanonik değişkenler (canonical variates) olarak adlandırılır (Kothari, 2004):
Set 1 kanonik değişkeni: U₁ = a₁X₁ + a₂X₂ + ... + aₚXₚ
Set 2 kanonik değişkeni: V₁ = b₁Y₁ + b₂Y₂ + ... + bqYq
Burada X₁...Xₚ birinci setteki değişkenleri, Y₁...Yq ikinci setteki değişkenleri, a₁...aₚ ve b₁...bq ise kanonik katsayıları temsil eder. U₁ ve V₁ çifti, birinci kanonik fonksiyonu oluşturur ve aralarındaki korelasyon (Rc₁) maksimize edilir.
İkinci kanonik fonksiyon (U₂, V₂), birinci fonksiyonla ilişkisiz (ortogonal) olarak kalan korelasyonu maksimize eder. Bu süreç, min(p, q) kadar kanonik fonksiyon oluşturulana kadar devam eder (Cohen ve ark., 2007).
Kanonik Korelasyon Katsayısı (Rc)
Her kanonik fonksiyon için hesaplanan kanonik korelasyon katsayısı (Rc), o fonksiyondaki kanonik değişken çifti arasındaki Pearson korelasyonudur. Rc² ise paylaşılan varyans oranını (örtüşme) gösterir. Birinci fonksiyonun Rc değeri daima en yüksektir; sonraki fonksiyonlarda azalır (Kothari, 2004).
Kanonik Katsayılar
Kanonik katsayılar, her değişkenin kanonik değişken oluşumundaki ağırlığını gösterir. İki tür katsayı raporlanır:
Standardize Kanonik Katsayılar
Standardize edilmiş değişkenler üzerinden hesaplanır ve değişkenlerin göreli katkısını karşılaştırmaya olanak tanır. Mutlak değeri büyük olan katsayılar, kanonik değişkenin oluşumuna daha fazla katkıda bulunan değişkenleri gösterir. Ancak çoklu doğrusal bağlantı varlığında katsayılar kararsız olabilir (Cohen ve ark., 2007).
Ham (Standardize Edilmemiş) Kanonik Katsayılar
Orijinal ölçek birimindeki katsayılardır. Yeni gözlemlerin kanonik skorlarını hesaplamak için kullanılır. Yorumlama açısından standardize katsayılar tercih edilir.
Kanonik Yükler (Structure Correlations)
Kanonik yükler, orijinal değişkenler ile kendi setlerindeki kanonik değişken arasındaki korelasyonlardır. Kanonik yükler, kanonik değişkenin ne anlama geldiğini yorumlamak için en güvenilir göstergedir (Kothari, 2004).
Kanonik yüklerin yorumlanması:
- Yükler -1 ile +1 arasında değer alır.
- Mutlak değeri 0.30 veya üzeri olan yükler genellikle anlamlı kabul edilir; ancak bazı araştırmacılar 0.40 eşiğini tercih eder.
- Yük değeri ne kadar yüksekse, o değişken kanonik değişkeni o kadar iyi temsil eder.
- Yükün işareti, değişkenin kanonik değişkenle ilişkisinin yönünü gösterir.
Kanonik katsayılar mı, kanonik yükler mi? Kanonik yükler, kanonik katsayılardan daha kararlıdır ve çoklu doğrusal bağlantıdan daha az etkilenir. Bu nedenle kanonik fonksiyonların yorumlanmasında kanonik yüklerin tercih edilmesi önerilir (Cohen ve ark., 2007).
Kanonik Çapraz Yükler (Cross-Loadings)
Kanonik çapraz yükler, orijinal değişkenler ile karşı setteki kanonik değişken arasındaki korelasyonlardır. Örneğin birinci setteki bir değişkenin ikinci setin kanonik değişkeniyle korelasyonu bir çapraz yüktür (Kothari, 2004).
Çapraz yüklerin önemi:
- Doğrudan setler arası ilişkiyi gösterir; kanonik yüklerden daha doğrudan bir yorumlama sağlar.
- Çapraz yük = kanonik yük × kanonik korelasyon (Rc) formülü ile hesaplanır.
- Bazı araştırmacılar, kanonik yükler yerine çapraz yüklerin yorumlanmasını tercih eder çünkü bunlar asıl amaç olan setler arası ilişkiyi doğrudan yansıtır.
Fazlalık Analizi (Redundancy Analysis)
Kanonik korelasyon katsayısı (Rc²) yalnızca kanonik değişkenler arasındaki paylaşılan varyansı gösterir; orijinal değişkenlerdeki varyansı doğrudan ifade etmez. Fazlalık analizi, bir setteki orijinal değişkenlerin varyansının ne kadarının karşı setin kanonik değişkeni tarafından açıklandığını belirler (Cohen ve ark., 2007).
Stewart-Love Fazlalık İndeksi
Fazlalık indeksi iki bileşenin çarpımıdır:
- Ortalama açıklanan varyans oranı: Kanonik değişkenin kendi setindeki değişkenlerin varyansını ortalama ne kadar açıkladığı (kanonik yüklerin karelerinin ortalaması).
- Kanonik korelasyon karesi (Rc²): Kanonik değişkenler arasındaki paylaşılan varyans.
Fazlalık = Ortalama açıklanan varyans × Rc²
Fazlalık analizi asimetrik bir ölçüdür: Set 1'in Set 2 tarafından açıklanan varyansı ile Set 2'nin Set 1 tarafından açıklanan varyansı farklı olabilir. Her iki yön için ayrı ayrı hesaplanmalıdır (Kothari, 2004).
Anlamlılık Testi
Kanonik korelasyon fonksiyonlarının istatistiksel anlamlılığı çeşitli testlerle değerlendirilir (Cohen ve ark., 2007):
Wilks' Lambda
Tüm kanonik fonksiyonların birlikte anlamlılığını test eder. Ardışık olarak her fonksiyon çıkarılarak kalan fonksiyonların anlamlılığı da test edilebilir. Wilks' Lambda ki-kare dağılımına dönüştürülerek p değeri elde edilir.
Pillai's Trace
Kanonik korelasyonların karelerinin toplamıdır. Varsayım ihlallerine karşı daha dayanıklı bir test istatistiğidir ve özellikle çok değişkenli normallik varsayımı ihlal edildiğinde tercih edilir.
Hotelling's Trace ve Roy's Largest Root
Hotelling's Trace tüm fonksiyonlara dayalıdır; Roy's Largest Root yalnızca birinci (en güçlü) fonksiyonu temel alır. Roy's testi en güçlü ancak en az dayanıklı (robust) testtir.
Anlamlı Fonksiyon Sayısının Belirlenmesi
Kanonik korelasyon analizinde oluşan fonksiyonların tamamı anlamlı olmayabilir. Anlamlı fonksiyon sayısını belirlemek için şu kriterler kullanılır (Kothari, 2004):
- İstatistiksel anlamlılık: Ardışık Wilks' Lambda testleri ile her fonksiyonun anlamlılığı kontrol edilir (p < .05).
- Pratik anlamlılık: Rc² değeri en az .10 (veya tercihen .20) olmalıdır; küçük Rc² değerleri istatistiksel olarak anlamlı olsa bile pratik açıdan önemsiz olabilir.
- Fazlalık indeksi: Anlamlı düzeyde fazlalık katkısı sağlamayan fonksiyonlar yorumlanmaz.
Yorumlama Adımları
Kanonik korelasyon analizi sonuçlarının sistematik yorumlama süreci şu şekildedir (Cohen ve ark., 2007; Kothari, 2004):
- Genel anlamlılık testi: Wilks' Lambda ile setler arası ilişkinin genel anlamlılığı kontrol edilir.
- Kanonik korelasyonlar ve Rc² değerleri: Her fonksiyonun gücü değerlendirilir.
- Anlamlı fonksiyonların belirlenmesi: Ardışık testler ve pratik anlamlılık kriterleri uygulanır.
- Kanonik yüklerin incelenmesi: Anlamlı fonksiyonlarda hangi değişkenlerin kanonik değişkene yüksek yük verdiği belirlenir.
- Çapraz yüklerin incelenmesi: Değişkenlerin karşı setteki kanonik değişkenle doğrudan ilişkisi değerlendirilir.
- Fazlalık analizi: Her setin karşı set tarafından açıklanan varyans oranı hesaplanır.
- Kanonik fonksiyonların adlandırılması: Yük kalıplarına dayalı olarak her fonksiyona anlamlı bir ad verilir.
Kanonik Korelasyonun Varsayımları
Kanonik korelasyon analizi aşağıdaki varsayımların karşılanmasını gerektirir (Kothari, 2004; Cohen ve ark., 2007):
- Doğrusallık: İki set arasındaki ilişkiler doğrusal olmalıdır. Kanonik korelasyon yalnızca doğrusal ilişkileri yakalar; eğrisel ilişkiler tespit edilemez. Saçılım grafikleri matrislerinde kontrol edilir.
- Çok değişkenli normallik: Her iki setteki değişkenlerin birlikte çok değişkenli normal dağılım göstermesi anlamlılık testlerinin geçerliliği için gereklidir. Mardia testi kullanılır.
- Set içi çoklu doğrusal bağlantı olmaması: Her set içindeki değişkenler arasında aşırı yüksek korelasyon olmamalıdır. Yüksek çoklu doğrusal bağlantı, kanonik katsayıları kararsız yapar ve yorumlamayı güçleştirir.
- Homojenlik (homosetadisite): Her setten oluşturulan kanonik değişkenlerin karşı setteki kanonik değişkenle ilişkisinde varyans homojen olmalıdır.
- Yeterli örneklem: Genel kural olarak toplam değişken sayısının en az 10-20 katı gözlem gerekir. Bazı kaynaklar minimum 50 gözlem ve değişken başına 10 gözlem önermektedir.
Diğer Tekniklerle İlişkisi
Kanonik korelasyon analizi, birçok çok değişkenli tekniğin en genel hali olarak görülebilir (Cohen ve ark., 2007):
Çoklu Regresyonla İlişkisi
Çoklu regresyon, kanonik korelasyonun özel bir durumudur. Bağımlı değişken setinde yalnızca bir değişken olduğunda kanonik korelasyon, çoklu regresyona indirgenir. Kanonik korelasyon katsayısı (Rc), çoklu korelasyon katsayısına (R) eşit olur.
MANOVA ile İlişkisi
MANOVA da kanonik korelasyonla matematiksel olarak ilişkilidir. MANOVA'da bağımsız değişken kategorik olduğunda, kukla değişkenlere dönüştürülerek kanonik korelasyon çerçevesinde ele alınabilir. MANOVA'daki diskriminant fonksiyonları aslında kanonik fonksiyonlardır.
Pearson Korelasyonla İlişkisi
Her iki sette yalnızca bir değişken olduğunda kanonik korelasyon, basit Pearson korelasyonuna indirgenir. Bu açıdan kanonik korelasyon, korelasyon kavramının en genel çok değişkenli uzantısıdır.
İlişki Hiyerarşisi
| Teknik | Set 1 Değişken Sayısı | Set 2 Değişken Sayısı | Kanonik Korelasyonun Özel Durumu mu? |
|---|---|---|---|
| Pearson korelasyon | 1 | 1 | Evet |
| Çoklu regresyon | ≥2 | 1 | Evet |
| MANOVA | Kategorik (kukla) | ≥2 | Evet (dönüştürülmüş) |
| Kanonik korelasyon | ≥2 | ≥2 | En genel form |
Eğitim Araştırmasından Örnek
Bir eğitim araştırmasında öğretim yöntemleri seti (aktif öğrenme kullanımı, teknoloji entegrasyonu, bireysel geri bildirim sıklığı, işbirlikli öğrenme uygulamaları) ile öğrenci çıktıları seti (akademik başarı, derse yönelik tutum, öğrenme motivasyonu, eleştirel düşünme becerisi) arasındaki ilişki incelenmiştir. 250 öğretmen-sınıf çifti üzerinde yapılan kanonik korelasyon analizi sonucunda dört kanonik fonksiyon elde edilmiştir (Kothari, 2004).
Birinci kanonik fonksiyon (Rc₁ = .72, Rc₁² = .52) istatistiksel olarak anlamlı bulunmuştur, Wilks' Λ = .38, χ²(16) = 235.42, p < .001. İkinci fonksiyon (Rc₂ = .41, Rc₂² = .17) da anlamlıdır, Λ = .78, χ²(9) = 59.87, p < .001. Üçüncü ve dördüncü fonksiyonlar anlamlı bulunmamıştır.
Birinci kanonik fonksiyonda yordayıcı setteki en yüksek yükler aktif öğrenme (.85) ve teknoloji entegrasyonu (.71); ölçüt setteki en yüksek yükler akademik başarı (.79) ve eleştirel düşünme (.74) olarak belirlenmiştir. Bu fonksiyon "yenilikçi öğretim — üst düzey öğrenme" olarak adlandırılmıştır. İkinci fonksiyonda bireysel geri bildirim (.82) ve öğrenme motivasyonu (.76) en yüksek yükleri vermiş ve "bireyselleştirilmiş destek — içsel motivasyon" olarak adlandırılmıştır.
SPSS ve R'da Uygulama
SPSS'te Kanonik Korelasyon
SPSS menü arayüzünde doğrudan bir kanonik korelasyon seçeneği bulunmamaktadır. Analiz, SPSS syntax aracılığıyla gerçekleştirilir. MANOVA komutu kanonik korelasyon çıktıları üretebilir (Cohen ve ark., 2007):
- SPSS syntax editörü açılır.
- MANOVA komutu ile iki değişken seti tanımlanır.
- /DISCRIM komutunda kanonik yükler, standardize katsayılar ve anlamlılık testleri istenir.
- Alternatif olarak CANCORR makrosu kullanılabilir.
R'da Kanonik Korelasyon
R programlama dilinde kanonik korelasyon analizi için birden fazla seçenek mevcuttur:
- cancor() fonksiyonu: Temel R'da bulunan bu fonksiyon kanonik korelasyonları ve kanonik katsayıları hesaplar.
- CCA paketi: Daha kapsamlı çıktılar sunar; düzenli (regularized) kanonik korelasyon imkânı sağlar.
- yacca paketi: Kanonik yükler, çapraz yükler, fazlalık analizi ve anlamlılık testleri dahil kapsamlı çıktı üretir.
- candisc paketi: Kanonik diskriminant analizi ve görselleştirme araçları sunar.
APA Formatında Raporlama
Kanonik korelasyon analizi sonuçları APA formatında şu şekilde raporlanır:
Örnek: "Öğretim yöntemleri seti ile öğrenci çıktıları seti arasındaki ilişki kanonik korelasyon analizi ile incelenmiştir. Analiz sonucunda dört kanonik fonksiyon elde edilmiş; tam model tüm fonksiyonlar birlikte istatistiksel olarak anlamlı bulunmuştur, Wilks' Λ = .38, F(16, 741.52) = 14.87, p < .001. Modelin toplam açıklanan varyansı (1 - Λ) .62'dir. İlk iki fonksiyon anlamlı olup sırasıyla varyansın %52 ve %17'sini açıklamıştır. Birinci fonksiyonda aktif öğrenme (rs = .85) ve teknoloji entegrasyonu (rs = .71) yordayıcı set yüklerini; akademik başarı (rs = .79) ve eleştirel düşünme (rs = .74) ölçüt set yüklerini oluşturmuştur."
Raporlamada Verilmesi Gereken Bilgiler
- Tam model anlamlılık testi (Wilks' Lambda veya Pillai's Trace)
- Her kanonik fonksiyonun Rc ve Rc² değerleri
- Anlamlı fonksiyonlar için kanonik yükler (structure correlations)
- Fazlalık analizi sonuçları
- Kanonik fonksiyonların yorumu ve adlandırılması
- Standardize kanonik katsayılar (istenirse)
Kanonik Korelasyonun Güçlü ve Zayıf Yönleri
Güçlü Yönler
- Kapsamlılık: İki değişken seti arasındaki ilişkiyi en genel düzeyde inceler; birçok tekniğin özel bir durumu olarak görülebilir.
- Tip I hata kontrolü: Çok sayıda ayrı korelasyon veya regresyon analizi yerine tek bir kapsamlı analiz yaparak alfa şişmesini önler.
- Değişkenler arası ilişkileri dikkate alma: Set içi ve setler arası ilişkileri bütünsel olarak ele alır.
- Esneklik: Hem sürekli hem de (kukla kodlama ile) kategorik değişkenlerle çalışabilir.
Zayıf Yönler
- Yorumlama güçlüğü: Kanonik değişkenler yapay oluşumlar olduğundan doğrudan anlamlandırılması zordur.
- Yalnızca doğrusal ilişkiler: Eğrisel ilişkileri yakalayamaz.
- Örneklem büyüklüğü gereksinimi: Güvenilir sonuçlar için büyük örneklem gerektirir.
- Kanonik korelasyonun yanıltıcılığı: Yüksek Rc, orijinal değişkenlerin varyansının büyük bölümünün açıklandığı anlamına gelmez; fazlalık analizi şarttır.
- Çoklu doğrusal bağlantı duyarlılığı: Set içi yüksek korelasyonlar katsayıları kararsız yapar (Cohen ve ark., 2007).
Sonuç ve Değerlendirme
Kanonik korelasyon analizi, iki değişken seti arasındaki ilişkiyi en kapsamlı biçimde ortaya koyan güçlü bir çok değişkenli tekniktir. Çoklu regresyon, MANOVA ve Pearson korelasyonun en genel hali olarak, araştırmacılara karmaşık çok değişkenli ilişki yapılarını tek bir analitik çerçevede inceleme imkânı sunar. Kanonik yükler ve çapraz yükler yorumlama için tercih edilmeli, fazlalık analizi ile pratik anlamlılık değerlendirilmelidir. Doğrusallık, çok değişkenli normallik ve yeterli örneklem büyüklüğü varsayımlarının kontrol edilmesi, güvenilir sonuçlar elde etmenin ön koşuludur. Araştırmacılar, kanonik korelasyonun keşifsel doğasını göz önünde bulundurarak sonuçlarını kuramsal çerçeveyle desteklemeli ve uygulanabilir öneriler geliştirmelidir (Kothari, 2004; Cohen ve ark., 2007).
Kaynaklar
Yorumlar (0)
Yorum yapmak için giriş yapmalısınız.
