Kategorik Veri İlişki Katsayıları: Phi, Cramer's V ve Lambda
Kategorik (nominal veya ordinal) değişkenler arasındaki ilişkiyi incelemek, sosyal bilimler, eğitim ve sağlık araştırmalarında sıkça karşılaşılan bir ihtiyaçtır. Ki-kare bağımsızlık testi, iki kategorik değişken arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını belirler; ancak bu ilişkinin gücünü (strength) veya yönünü göstermez. Kothari (2004), ki-kare testinin yalnızca bir başlangıç noktası olduğunu ve anlamlı çıkan bir ki-kare sonucunun mutlaka ilişkinin gücünü belirleyen bir ilişki katsayısı ile desteklenmesi gerektiğini vurgular. Bu yazıda, kategorik veriler için kullanılan temel ilişki katsayılarını, formüllerini, yorumlama biçimlerini ve hangi koşullarda hangisinin tercih edileceğini kapsamlı biçimde ele alacağız.
Ki-Kare Testi Neden Tek Başına Yetmez?
Ki-kare (χ²) test istatistiği, örneklem büyüklüğüne doğrudan bağımlıdır. Aynı ilişki yapısına sahip iki veri seti düşünün: Birinde N = 100, diğerinde N = 10.000 olsun. Büyük örneklemdeki ki-kare değeri, küçük örnekleminkine göre çok daha yüksek olacaktır; ancak ilişkinin gücü aynı olabilir. Cohen, Manion ve Morrison (2007), bu durumun araştırmacıları yanıltabileceğini belirtir: İstatistiksel anlamlılık, pratik anlamlılık (meaningful significance) ile karıştırılmamalıdır.
İlişki katsayıları bu sorunu çözer: Ki-kare değerini örneklem büyüklüğüne ve tablo boyutuna göre standartlaştırarak 0 ile 1 arasında (veya bazıları için -1 ile +1 arasında) değişen bir etki büyüklüğü ölçüsü sunar.
Phi Katsayısı (φ)
Phi katsayısı, 2×2 çapraz tablolar için tasarlanmış en temel ilişki ölçüsüdür. İki dikotom (ikili) değişken arasındaki ilişkinin gücünü ve yönünü gösterir.
Formül
φ = √(χ² / N)
Burada χ² = ki-kare test istatistiği, N = toplam örneklem büyüklüğü
Alternatif olarak, 2×2 tablonun hücre frekanslarından doğrudan hesaplanabilir:
φ = (ad - bc) / √[(a+b)(c+d)(a+c)(b+d)]
Burada a, b, c, d tablonun dört hücresindeki frekanslar
Özellikleri ve Yorumlama
- Aralık: -1 ile +1 arasında değer alır (yalnızca 2×2 tablolarda)
- Yön: İşareti ilişkinin yönünü gösterir (pozitif veya negatif)
- Büyüklük: |φ| = 0.10 küçük, 0.30 orta, 0.50 büyük etki (Cohen'in ölçütleri)
- Pearson r ile ilişkisi: 2×2 tablolarda phi katsayısı, Pearson korelasyon katsayısına eşittir
Kothari (2004), phi katsayısının basitliği ve doğrudan yorumlanabilirliği nedeniyle 2×2 tablolarda en çok tercih edilen ölçü olduğunu belirtir. Ancak daha büyük tablolarda (3×2, 4×3 gibi) phi değeri 1'i aşabilir ve bu nedenle kullanılmamalıdır.
Cramer's V
Cramer's V, phi katsayısının her boyuttaki çapraz tablolara genelleştirilmiş halidir. 2×2'den büyük tablolarda ilişki gücünü ölçmek için standart ölçüdür.
Formül
V = √[χ² / (N × (k-1))]
Burada k = min(satır sayısı, sütun sayısı); yani tablonun daha küçük boyutu
Özellikleri ve Yorumlama
- Aralık: 0 ile 1 arasında değer alır (yön bilgisi vermez)
- 2×2 tabloda: Phi katsayısının mutlak değerine eşittir
- Büyüklük yorumlama: Tablo boyutuna göre değişir. Serbestlik derecesi 1 olan tablolarda (2×2): V = 0.10 küçük, 0.30 orta, 0.50 büyük. Serbestlik derecesi 2 olan tablolarda (3×2 veya 2×3): V = 0.07 küçük, 0.21 orta, 0.35 büyük. Serbestlik derecesi 3 ve üzeri tablolarda eşik değerleri daha da düşer
Cohen, Manion ve Morrison (2007), Cramer's V'nin evrensel uygulanabilirliği nedeniyle kategorik ilişki raporlamada en yaygın kullanılan ölçü olduğunu belirtir. Özellikle farklı boyutlardaki tabloların karşılaştırılmasında standart bir ölçü olarak tercih edilir.
Kontenjans Katsayısı (C)
Kontenjans katsayısı (Pearson's contingency coefficient), ki-kare değerine dayalı bir diğer ilişki ölçüsüdür:
C = √[χ² / (χ² + N)]
Özellikleri
- Aralık: 0 ile 1 arasında; ancak teorik üst sınır tablonun boyutuna bağlıdır ve hiçbir zaman 1'e ulaşamaz
- 2×2 tabloda: Maksimum değer √(1/2) ≈ 0.707
- 3×3 tabloda: Maksimum değer √(2/3) ≈ 0.816
- Sınırlılık: Farklı boyutlardaki tabloların C değerleri doğrudan karşılaştırılamaz çünkü üst sınırları farklıdır
Kothari (2004), bu sınırlılık nedeniyle kontenjans katsayısının Cramer's V'ye kıyasla daha az tercih edildiğini belirtir. Ancak bazı eski ders kitaplarında ve belirli disiplinlerde hâlâ yaygın biçimde kullanılmaktadır.
Yule's Q
Yule's Q, 2×2 tablolarda ordinal düzeyde iki değişken arasındaki ilişkiyi ölçen bir katsayıdır. Özellikle epidemiyoloji ve sosyal bilimlerde odds oranı (OR) ile doğrudan ilişkili olması nedeniyle kullanılır.
Q = (ad - bc) / (ad + bc)
Burada a, b, c, d tablonun dört hücresindeki frekanslar
Özellikleri
- Aralık: -1 ile +1 arasında
- Yön: Pozitif değer pozitif ilişki, negatif değer negatif ilişki gösterir
- Odds oranı ile ilişki: Q = (OR - 1) / (OR + 1)
- Sınırlılık: Yalnızca 2×2 tablolarda kullanılabilir; daha büyük tablolar için uygun değildir
Cohen, Manion ve Morrison (2007), Yule's Q'nun phi katsayısına göre genellikle daha yüksek değerler verdiğini ve bu nedenle iki ölçünün doğrudan karşılaştırılmaması gerektiğini belirtir.
Goodman-Kruskal Gamma (γ)
Gamma katsayısı, iki ordinal değişken arasındaki ilişkiyi ölçer. Uyumlu (concordant) ve uyumsuz (discordant) çift sayılarına dayanır.
γ = (Nc - Nd) / (Nc + Nd)
Burada Nc = uyumlu çift sayısı, Nd = uyumsuz çift sayısı
Özellikleri
- Aralık: -1 ile +1 arasında
- Yön: Pozitif değer: bir değişken arttıkça diğeri de artar; negatif değer: biri arttıkça diğeri azalır
- Simetrik: Hangi değişkenin bağımsız, hangisinin bağımlı olduğu fark etmez
- Bağlı çiftleri (ties) yok sayar: Bu nedenle diğer ordinal ölçülere kıyasla genellikle daha yüksek değerler verir
Kothari (2004), gamma katsayısının bağlı çiftleri göz ardı etmesinin, özellikle çok sayıda bağlı çift olduğunda (az sayıda kategori ile) ilişki gücünü abartabileceğini belirtir.
Somers' d
Somers' d, gamma katsayısının asimetrik bir versiyonudur. Bağımlı değişkendeki bağlı çiftleri dikkate alır ancak bağımsız değişkendeki bağlı çiftleri göz ardı eder.
d(Y|X) = (Nc - Nd) / (Nc + Nd + T_Y)
Burada T_Y = bağımlı değişkende (Y) bağlı olan çift sayısı
Özellikleri
- Aralık: -1 ile +1 arasında
- Asimetrik: d(Y|X) ≠ d(X|Y); hangi değişkenin bağımlı olduğu önemlidir
- PRE yorumu: Bağımsız değişkeni bilerek bağımlı değişkeni tahmin etmedeki oransal hata azalması
- Gamma ile ilişki: Gamma, Somers' d'nin simetrik versiyonu olarak düşünülebilir
Lambda (λ) Katsayısı
Lambda, nominal değişkenler için bir PRE (Proportional Reduction in Error - Oransal Hata Azaltma) ölçüsüdür. Bir değişkeni bilmenin, diğer değişkeni tahmin etmedeki hatayı ne kadar azalttığını gösterir.
λ = (E₁ - E₂) / E₁
Burada E₁ = bağımsız değişkeni bilmeden yapılan tahmin hatası, E₂ = bağımsız değişkeni bilerek yapılan tahmin hatası
Özellikleri
- Aralık: 0 ile 1 arasında
- Asimetrik: λ(Y|X) ≠ λ(X|Y); simetrik bir versiyonu da mevcuttur
- PRE yorumu: λ = 0.35 ise, bağımsız değişkeni bilmek tahmin hatasını %35 azaltır
- Sınırlılık: Marjinal dağılımlar çok çarpık olduğunda 0 değeri alabilir (ilişki olmasına rağmen)
Cohen, Manion ve Morrison (2007), lambda'nın PRE yorumunun pratik açıdan çok değerli olduğunu ancak 0 alma probleminin farkında olunması gerektiğini belirtir. Bu sorun, bir değişkenin modal kategorisi tüm alt gruplarda aynı olduğunda ortaya çıkar.
Kendall'ın Tau-b ve Tau-c Katsayıları
Tau-b (τ_b)
Tau-b, kare tablolarda (satır sayısı = sütun sayısı) iki ordinal değişken arasındaki ilişkiyi ölçer. Hem bağımlı hem de bağımsız değişkendeki bağlı çiftleri dikkate alır.
τ_b = (Nc - Nd) / √[(Nc + Nd + T_X)(Nc + Nd + T_Y)]
Tau-c (τ_c / Stuart's Tau-c)
Tau-c, dikdörtgen tablolarda (satır sayısı ≠ sütun sayısı) kullanılmak üzere tasarlanmıştır. Kare olmayan tablolarda tau-b'nin 1 veya -1 değerine ulaşamaması sorununu düzeltir.
τ_c = 2m(Nc - Nd) / [N²(m-1)]
Burada m = min(satır sayısı, sütun sayısı)
Tüm Ölçülerin Karşılaştırma Tablosu
| Ölçü | Tablo Boyutu | Ölçüm Düzeyi | Aralık | Simetri | PRE Yorumu |
|---|---|---|---|---|---|
| Phi (φ) | 2×2 | Nominal/Dikotom | -1 ile +1 | Simetrik | Hayır |
| Cramer's V | Her boyut | Nominal | 0 ile 1 | Simetrik | Hayır |
| Kontenjans C | Her boyut | Nominal | 0 ile <1 | Simetrik | Hayır |
| Yule's Q | 2×2 | Ordinal | -1 ile +1 | Simetrik | Hayır |
| Gamma (γ) | Her boyut | Ordinal | -1 ile +1 | Simetrik | Evet (kısmen) |
| Somers' d | Her boyut | Ordinal | -1 ile +1 | Asimetrik | Evet |
| Lambda (λ) | Her boyut | Nominal | 0 ile 1 | Asimetrik | Evet |
| Tau-b (τ_b) | Kare tablolar | Ordinal | -1 ile +1 | Simetrik | Hayır |
| Tau-c (τ_c) | Dikdörtgen tablolar | Ordinal | -1 ile +1 | Simetrik | Hayır |
SPSS Çıktısı Yorumlama
SPSS'te ki-kare analizi yaptığınızda, Analyze > Descriptive Statistics > Crosstabs yolunu izlersiniz. İlişki katsayılarını elde etmek için Statistics butonuna tıklayarak ilgili ölçüleri seçersiniz:
- Nominal veriler için: Phi and Cramer's V, Lambda, Contingency Coefficient kutucuklarını işaretleyin
- Ordinal veriler için: Gamma, Somers' d, Kendall's tau-b, Kendall's tau-c kutucuklarını işaretleyin
SPSS çıktısında Symmetric Measures tablosu ilişki katsayılarını, Directional Measures tablosu ise asimetrik ölçüleri (lambda, Somers' d) gösterir. Her ölçü için değer (Value), asimptotik standart hata (Asymp. Std. Error), yaklaşık T değeri (Approx. T) ve anlamlılık düzeyi (Approx. Sig.) raporlanır.
Hangi Ölçüyü Ne Zaman Kullanmalı?
Doğru ilişki katsayısını seçmek için şu karar akışını izleyebilirsiniz:
- Değişkenlerin ölçüm düzeyi nedir? Her iki değişken de nominal ise: Phi (2×2) veya Cramer's V (daha büyük tablolar). En az bir değişken ordinal ise: Gamma, Tau-b/c veya Somers' d
- Tablo boyutu nedir? 2×2 tablo: Phi veya Yule's Q. Kare tablo (3×3, 4×4): Tau-b veya Gamma. Dikdörtgen tablo: Cramer's V (nominal) veya Tau-c (ordinal)
- Yön bilgisi gerekli mi? Yön önemliyse: Phi (2×2), Gamma, Tau-b/c, Somers' d. Yön önemli değilse: Cramer's V, Kontenjans C, Lambda
- PRE yorumu isteniyor mu? Evet ise: Lambda (nominal), Somers' d (ordinal)
- Asimetrik ilişki mi? Bir değişken bağımsız, diğeri bağımlı ise: Lambda, Somers' d
APA Formatında Raporlama
Kategorik ilişki katsayılarının APA formatında raporlanmasında şu unsurlar yer almalıdır:
- Ki-kare test istatistiği, serbestlik derecesi ve anlamlılık düzeyi
- Seçilen ilişki katsayısı ve değeri
- Etki büyüklüğü yorumu
2×2 tablo örneği: "Cinsiyet ile sigara içme durumu arasında anlamlı bir ilişki bulunmuştur, χ²(1, N = 250) = 8.45, p = .004, φ = .18. Phi katsayısı, iki değişken arasında küçük-orta düzeyde bir ilişki olduğunu göstermektedir."
Daha büyük tablo örneği: "Eğitim düzeyi ile iş memnuniyeti arasında anlamlı bir ilişki saptanmıştır, χ²(6, N = 500) = 24.32, p < .001, Cramer's V = .16. Bu değer, orta düzeyde bir ilişkiye işaret etmektedir."
Ordinal değişkenler örneği: "Gelir düzeyi ile yaşam memnuniyeti arasında pozitif yönde anlamlı bir ilişki bulunmuştur, γ = .42, p < .001. Bu sonuç, gelir düzeyi arttıkça yaşam memnuniyetinin de artma eğiliminde olduğunu göstermektedir."
Pratik Örnekler
Örnek 1: Phi Katsayısı
Bir araştırmacı, 200 üniversite öğrencisinde cinsiyet (kadın/erkek) ile yurt dışı deneyimi (var/yok) arasındaki ilişkiyi inceliyor. Ki-kare testi: χ²(1) = 5.12, p = .024. Phi katsayısı: φ = .16. Yorumlama: Cinsiyet ile yurt dışı deneyimi arasında istatistiksel olarak anlamlı ancak küçük düzeyde bir ilişki vardır.
Örnek 2: Cramer's V
Bölüm (fen, sosyal, sağlık) ile öğrenme stili (görsel, işitsel, kinestetik) arasındaki ilişki 450 öğrenci üzerinde inceleniyor. Ki-kare testi: χ²(4) = 18.76, p < .001. Cramer's V = .14. Yorumlama: Bölüm ile öğrenme stili arasında anlamlı ancak küçük-orta düzeyde bir ilişki bulunmaktadır.
Örnek 3: Lambda
Mezuniyet alanı (4 kategori) ile istihdam sektörü (3 kategori) arasındaki ilişkide λ(istihdam|mezuniyet) = 0.28. Yorumlama: Bir kişinin mezuniyet alanını bilmek, istihdam sektörünü tahmin etmedeki hatayı %28 oranında azaltmaktadır.
Sonuç
Kategorik değişkenler arası ilişki katsayıları, ki-kare testinin ötesinde ilişkinin gücünü, yönünü ve pratik anlamlılığını değerlendirmek için vazgeçilmez araçlardır. Kothari'nin (2004) vurguladığı gibi, istatistiksel anlamlılık ile pratik anlamlılık birbirinden farklı kavramlardır ve etki büyüklüğü ölçüleri bu ayrımı yapabilmemizi sağlar. Phi katsayısı 2×2 tablolarda, Cramer's V her boyuttaki nominal tablolarda, gamma ve tau katsayıları ordinal veriler için, lambda ise PRE yorumu gerektiren durumlarda tercih edilmelidir. Cohen, Manion ve Morrison'un (2007) belirttiği gibi, doğru katsayının seçimi değişkenlerin ölçüm düzeyine, tablo boyutuna, simetri/asimetri ihtiyacına ve yorumlama amacına bağlıdır. Araştırmacıların bu zengin ölçü repertuarını bilmesi ve araştırma bağlamına uygun olanı seçmesi, bulgularının daha bilgilendirici ve doğru yorumlanmasını sağlayacaktır.
Kaynaklar
Yorumlar (0)
Yorum yapmak için giriş yapmalısınız.
