Kategorik Veri İlişki Katsayıları: Phi, Cramer's V, Lambda Rehberi

Kategorik (nominal veya ordinal) değişkenler arasındaki ilişkiyi incelemek, sosyal bilimler, eğitim ve sağlık araştırmalarında sıkça karşılaşılan bir ihtiyaçtır. Ki-kare bağımsızlık testi, iki kategorik değişken arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını belirler; ancak bu ilişkinin gücünü (strength) veya yönünü göstermez. Kothari (2004), ki-kare testinin yalnızca bir başlangıç noktası olduğunu ve anlamlı çıkan bir ki-kare sonucunun mutlaka ilişkinin gücünü belirleyen bir ilişki katsayısı ile desteklenmesi gerektiğini vurgular. Bu yazıda, kategorik veriler için kullanılan temel ilişki katsayılarını, formüllerini, yorumlama biçimlerini ve hangi koşullarda hangisinin tercih edileceğini kapsamlı biçimde ele alacağız.

Ki-Kare Testi Neden Tek Başına Yetmez?

Ki-kare (χ²) test istatistiği, örneklem büyüklüğüne doğrudan bağımlıdır. Aynı ilişki yapısına sahip iki veri seti düşünün: Birinde N = 100, diğerinde N = 10.000 olsun. Büyük örneklemdeki ki-kare değeri, küçük örnekleminkine göre çok daha yüksek olacaktır; ancak ilişkinin gücü aynı olabilir. Cohen, Manion ve Morrison (2007), bu durumun araştırmacıları yanıltabileceğini belirtir: İstatistiksel anlamlılık, pratik anlamlılık (meaningful significance) ile karıştırılmamalıdır.

İlişki katsayıları bu sorunu çözer: Ki-kare değerini örneklem büyüklüğüne ve tablo boyutuna göre standartlaştırarak 0 ile 1 arasında (veya bazıları için -1 ile +1 arasında) değişen bir etki büyüklüğü ölçüsü sunar.

Phi Katsayısı (φ)

Phi katsayısı, 2×2 çapraz tablolar için tasarlanmış en temel ilişki ölçüsüdür. İki dikotom (ikili) değişken arasındaki ilişkinin gücünü ve yönünü gösterir.

Formül

φ = √(χ² / N)
Burada χ² = ki-kare test istatistiği, N = toplam örneklem büyüklüğü

Alternatif olarak, 2×2 tablonun hücre frekanslarından doğrudan hesaplanabilir:

φ = (ad - bc) / √[(a+b)(c+d)(a+c)(b+d)]
Burada a, b, c, d tablonun dört hücresindeki frekanslar

Özellikleri ve Yorumlama

Aralık: -1 ile +1 arasında değer alır (yalnızca 2×2 tablolarda)
Yön: İşareti ilişkinin yönünü gösterir (pozitif veya negatif)
Büyüklük: |φ| = 0.10 küçük, 0.30 orta, 0.50 büyük etki (Cohen'in ölçütleri)
Pearson r ile ilişkisi: 2×2 tablolarda phi katsayısı, Pearson korelasyon katsayısına eşittir

Kothari (2004), phi katsayısının basitliği ve doğrudan yorumlanabilirliği nedeniyle 2×2 tablolarda en çok tercih edilen ölçü olduğunu belirtir. Ancak daha büyük tablolarda (3×2, 4×3 gibi) phi değeri 1'i aşabilir ve bu nedenle kullanılmamalıdır.

Cramer's V

Cramer's V, phi katsayısının her boyuttaki çapraz tablolara genelleştirilmiş halidir. 2×2'den büyük tablolarda ilişki gücünü ölçmek için standart ölçüdür.

Formül

V = √[χ² / (N × (k-1))]
Burada k = min(satır sayısı, sütun sayısı); yani tablonun daha küçük boyutu

Özellikleri ve Yorumlama

Aralık: 0 ile 1 arasında değer alır (yön bilgisi vermez)
2×2 tabloda: Phi katsayısının mutlak değerine eşittir
Büyüklük yorumlama: Tablo boyutuna göre değişir. Serbestlik derecesi 1 olan tablolarda (2×2): V = 0.10 küçük, 0.30 orta, 0.50 büyük. Serbestlik derecesi 2 olan tablolarda (3×2 veya 2×3): V = 0.07 küçük, 0.21 orta, 0.35 büyük. Serbestlik derecesi 3 ve üzeri tablolarda eşik değerleri daha da düşer

Cohen, Manion ve Morrison (2007), Cramer's V'nin evrensel uygulanabilirliği nedeniyle kategorik ilişki raporlamada en yaygın kullanılan ölçü olduğunu belirtir. Özellikle farklı boyutlardaki tabloların karşılaştırılmasında standart bir ölçü olarak tercih edilir.

Kontenjans Katsayısı (C)

Kontenjans katsayısı (Pearson's contingency coefficient), ki-kare değerine dayalı bir diğer ilişki ölçüsüdür:

C = √[χ² / (χ² + N)]

Özellikleri

Aralık: 0 ile 1 arasında; ancak teorik üst sınır tablonun boyutuna bağlıdır ve hiçbir zaman 1'e ulaşamaz
2×2 tabloda: Maksimum değer √(1/2) ≈ 0.707
3×3 tabloda: Maksimum değer √(2/3) ≈ 0.816
Sınırlılık: Farklı boyutlardaki tabloların C değerleri doğrudan karşılaştırılamaz çünkü üst sınırları farklıdır

Kothari (2004), bu sınırlılık nedeniyle kontenjans katsayısının Cramer's V'ye kıyasla daha az tercih edildiğini belirtir. Ancak bazı eski ders kitaplarında ve belirli disiplinlerde hâlâ yaygın biçimde kullanılmaktadır.

Yule's Q

Yule's Q, 2×2 tablolarda ordinal düzeyde iki değişken arasındaki ilişkiyi ölçen bir katsayıdır. Özellikle epidemiyoloji ve sosyal bilimlerde odds oranı (OR) ile doğrudan ilişkili olması nedeniyle kullanılır.

Q = (ad - bc) / (ad + bc)
Burada a, b, c, d tablonun dört hücresindeki frekanslar

Özellikleri

Aralık: -1 ile +1 arasında
Yön: Pozitif değer pozitif ilişki, negatif değer negatif ilişki gösterir
Odds oranı ile ilişki: Q = (OR - 1) / (OR + 1)
Sınırlılık: Yalnızca 2×2 tablolarda kullanılabilir; daha büyük tablolar için uygun değildir

Cohen, Manion ve Morrison (2007), Yule's Q'nun phi katsayısına göre genellikle daha yüksek değerler verdiğini ve bu nedenle iki ölçünün doğrudan karşılaştırılmaması gerektiğini belirtir.

Goodman-Kruskal Gamma (γ)

Gamma katsayısı, iki ordinal değişken arasındaki ilişkiyi ölçer. Uyumlu (concordant) ve uyumsuz (discordant) çift sayılarına dayanır.

γ = (Nc - Nd) / (Nc + Nd)
Burada Nc = uyumlu çift sayısı, Nd = uyumsuz çift sayısı

Özellikleri

Aralık: -1 ile +1 arasında
Yön: Pozitif değer: bir değişken arttıkça diğeri de artar; negatif değer: biri arttıkça diğeri azalır
Simetrik: Hangi değişkenin bağımsız, hangisinin bağımlı olduğu fark etmez
Bağlı çiftleri (ties) yok sayar: Bu nedenle diğer ordinal ölçülere kıyasla genellikle daha yüksek değerler verir

Kothari (2004), gamma katsayısının bağlı çiftleri göz ardı etmesinin, özellikle çok sayıda bağlı çift olduğunda (az sayıda kategori ile) ilişki gücünü abartabileceğini belirtir.

Somers' d

Somers' d, gamma katsayısının asimetrik bir versiyonudur. Bağımlı değişkendeki bağlı çiftleri dikkate alır ancak bağımsız değişkendeki bağlı çiftleri göz ardı eder.

d(Y|X) = (Nc - Nd) / (Nc + Nd + T_Y)
Burada T_Y = bağımlı değişkende (Y) bağlı olan çift sayısı

Özellikleri

Aralık: -1 ile +1 arasında
Asimetrik: d(Y|X) ≠ d(X|Y); hangi değişkenin bağımlı olduğu önemlidir
PRE yorumu: Bağımsız değişkeni bilerek bağımlı değişkeni tahmin etmedeki oransal hata azalması
Gamma ile ilişki: Gamma, Somers' d'nin simetrik versiyonu olarak düşünülebilir

Lambda (λ) Katsayısı

Lambda, nominal değişkenler için bir PRE (Proportional Reduction in Error - Oransal Hata Azaltma) ölçüsüdür. Bir değişkeni bilmenin, diğer değişkeni tahmin etmedeki hatayı ne kadar azalttığını gösterir.

λ = (E₁ - E₂) / E₁
Burada E₁ = bağımsız değişkeni bilmeden yapılan tahmin hatası, E₂ = bağımsız değişkeni bilerek yapılan tahmin hatası

Özellikleri

Aralık: 0 ile 1 arasında
Asimetrik: λ(Y|X) ≠ λ(X|Y); simetrik bir versiyonu da mevcuttur
PRE yorumu: λ = 0.35 ise, bağımsız değişkeni bilmek tahmin hatasını %35 azaltır
Sınırlılık: Marjinal dağılımlar çok çarpık olduğunda 0 değeri alabilir (ilişki olmasına rağmen)

Cohen, Manion ve Morrison (2007), lambda'nın PRE yorumunun pratik açıdan çok değerli olduğunu ancak 0 alma probleminin farkında olunması gerektiğini belirtir. Bu sorun, bir değişkenin modal kategorisi tüm alt gruplarda aynı olduğunda ortaya çıkar.

Kendall'ın Tau-b ve Tau-c Katsayıları

Tau-b (τ_b)

Tau-b, kare tablolarda (satır sayısı = sütun sayısı) iki ordinal değişken arasındaki ilişkiyi ölçer. Hem bağımlı hem de bağımsız değişkendeki bağlı çiftleri dikkate alır.

τ_b = (Nc - Nd) / √[(Nc + Nd + T_X)(Nc + Nd + T_Y)]

Tau-c (τ_c / Stuart's Tau-c)

Tau-c, dikdörtgen tablolarda (satır sayısı ≠ sütun sayısı) kullanılmak üzere tasarlanmıştır. Kare olmayan tablolarda tau-b'nin 1 veya -1 değerine ulaşamaması sorununu düzeltir.

τ_c = 2m(Nc - Nd) / [N²(m-1)]
Burada m = min(satır sayısı, sütun sayısı)

Tüm Ölçülerin Karşılaştırma Tablosu

Ölçü	Tablo Boyutu	Ölçüm Düzeyi	Aralık	Simetri	PRE Yorumu
Phi (φ)	2×2	Nominal/Dikotom	-1 ile +1	Simetrik	Hayır
Cramer's V	Her boyut	Nominal	0 ile 1	Simetrik	Hayır
Kontenjans C	Her boyut	Nominal	0 ile <1	Simetrik	Hayır
Yule's Q	2×2	Ordinal	-1 ile +1	Simetrik	Hayır
Gamma (γ)	Her boyut	Ordinal	-1 ile +1	Simetrik	Evet (kısmen)
Somers' d	Her boyut	Ordinal	-1 ile +1	Asimetrik	Evet
Lambda (λ)	Her boyut	Nominal	0 ile 1	Asimetrik	Evet
Tau-b (τ_b)	Kare tablolar	Ordinal	-1 ile +1	Simetrik	Hayır
Tau-c (τ_c)	Dikdörtgen tablolar	Ordinal	-1 ile +1	Simetrik	Hayır

SPSS Çıktısı Yorumlama

SPSS'te ki-kare analizi yaptığınızda, Analyze > Descriptive Statistics > Crosstabs yolunu izlersiniz. İlişki katsayılarını elde etmek için Statistics butonuna tıklayarak ilgili ölçüleri seçersiniz:

Nominal veriler için: Phi and Cramer's V, Lambda, Contingency Coefficient kutucuklarını işaretleyin
Ordinal veriler için: Gamma, Somers' d, Kendall's tau-b, Kendall's tau-c kutucuklarını işaretleyin

SPSS çıktısında Symmetric Measures tablosu ilişki katsayılarını, Directional Measures tablosu ise asimetrik ölçüleri (lambda, Somers' d) gösterir. Her ölçü için değer (Value), asimptotik standart hata (Asymp. Std. Error), yaklaşık T değeri (Approx. T) ve anlamlılık düzeyi (Approx. Sig.) raporlanır.

Hangi Ölçüyü Ne Zaman Kullanmalı?

Doğru ilişki katsayısını seçmek için şu karar akışını izleyebilirsiniz:

Değişkenlerin ölçüm düzeyi nedir? Her iki değişken de nominal ise: Phi (2×2) veya Cramer's V (daha büyük tablolar). En az bir değişken ordinal ise: Gamma, Tau-b/c veya Somers' d
Tablo boyutu nedir? 2×2 tablo: Phi veya Yule's Q. Kare tablo (3×3, 4×4): Tau-b veya Gamma. Dikdörtgen tablo: Cramer's V (nominal) veya Tau-c (ordinal)
Yön bilgisi gerekli mi? Yön önemliyse: Phi (2×2), Gamma, Tau-b/c, Somers' d. Yön önemli değilse: Cramer's V, Kontenjans C, Lambda
PRE yorumu isteniyor mu? Evet ise: Lambda (nominal), Somers' d (ordinal)
Asimetrik ilişki mi? Bir değişken bağımsız, diğeri bağımlı ise: Lambda, Somers' d

APA Formatında Raporlama

Kategorik ilişki katsayılarının APA formatında raporlanmasında şu unsurlar yer almalıdır:

Ki-kare test istatistiği, serbestlik derecesi ve anlamlılık düzeyi
Seçilen ilişki katsayısı ve değeri
Etki büyüklüğü yorumu

2×2 tablo örneği: "Cinsiyet ile sigara içme durumu arasında anlamlı bir ilişki bulunmuştur, χ²(1, N = 250) = 8.45, p = .004, φ = .18. Phi katsayısı, iki değişken arasında küçük-orta düzeyde bir ilişki olduğunu göstermektedir."

Daha büyük tablo örneği: "Eğitim düzeyi ile iş memnuniyeti arasında anlamlı bir ilişki saptanmıştır, χ²(6, N = 500) = 24.32, p < .001, Cramer's V = .16. Bu değer, orta düzeyde bir ilişkiye işaret etmektedir."

Ordinal değişkenler örneği: "Gelir düzeyi ile yaşam memnuniyeti arasında pozitif yönde anlamlı bir ilişki bulunmuştur, γ = .42, p < .001. Bu sonuç, gelir düzeyi arttıkça yaşam memnuniyetinin de artma eğiliminde olduğunu göstermektedir."

Pratik Örnekler

Örnek 1: Phi Katsayısı

Bir araştırmacı, 200 üniversite öğrencisinde cinsiyet (kadın/erkek) ile yurt dışı deneyimi (var/yok) arasındaki ilişkiyi inceliyor. Ki-kare testi: χ²(1) = 5.12, p = .024. Phi katsayısı: φ = .16. Yorumlama: Cinsiyet ile yurt dışı deneyimi arasında istatistiksel olarak anlamlı ancak küçük düzeyde bir ilişki vardır.

Örnek 2: Cramer's V

Bölüm (fen, sosyal, sağlık) ile öğrenme stili (görsel, işitsel, kinestetik) arasındaki ilişki 450 öğrenci üzerinde inceleniyor. Ki-kare testi: χ²(4) = 18.76, p < .001. Cramer's V = .14. Yorumlama: Bölüm ile öğrenme stili arasında anlamlı ancak küçük-orta düzeyde bir ilişki bulunmaktadır.

Örnek 3: Lambda

Mezuniyet alanı (4 kategori) ile istihdam sektörü (3 kategori) arasındaki ilişkide λ(istihdam|mezuniyet) = 0.28. Yorumlama: Bir kişinin mezuniyet alanını bilmek, istihdam sektörünü tahmin etmedeki hatayı %28 oranında azaltmaktadır.

Sonuç

Kategorik değişkenler arası ilişki katsayıları, ki-kare testinin ötesinde ilişkinin gücünü, yönünü ve pratik anlamlılığını değerlendirmek için vazgeçilmez araçlardır. Kothari'nin (2004) vurguladığı gibi, istatistiksel anlamlılık ile pratik anlamlılık birbirinden farklı kavramlardır ve etki büyüklüğü ölçüleri bu ayrımı yapabilmemizi sağlar. Phi katsayısı 2×2 tablolarda, Cramer's V her boyuttaki nominal tablolarda, gamma ve tau katsayıları ordinal veriler için, lambda ise PRE yorumu gerektiren durumlarda tercih edilmelidir. Cohen, Manion ve Morrison'un (2007) belirttiği gibi, doğru katsayının seçimi değişkenlerin ölçüm düzeyine, tablo boyutuna, simetri/asimetri ihtiyacına ve yorumlama amacına bağlıdır. Araştırmacıların bu zengin ölçü repertuarını bilmesi ve araştırma bağlamına uygun olanı seçmesi, bulgularının daha bilgilendirici ve doğru yorumlanmasını sağlayacaktır.

Kategorik Veri İlişki Katsayıları: Phi, Cramer's V ve Lambda

Ki-Kare Testi Neden Tek Başına Yetmez?

Phi Katsayısı (φ)

Formül

Özellikleri ve Yorumlama

Cramer's V

Formül

Özellikleri ve Yorumlama

Kontenjans Katsayısı (C)

Özellikleri

Yule's Q

Özellikleri

Goodman-Kruskal Gamma (γ)

Özellikleri

Somers' d

Özellikleri

Lambda (λ) Katsayısı

Özellikleri

Kendall'ın Tau-b ve Tau-c Katsayıları

Tau-b (τ_b)

Tau-c (τ_c / Stuart's Tau-c)

Tüm Ölçülerin Karşılaştırma Tablosu

SPSS Çıktısı Yorumlama

Hangi Ölçüyü Ne Zaman Kullanmalı?

APA Formatında Raporlama

Pratik Örnekler

Örnek 1: Phi Katsayısı

Örnek 2: Cramer's V

Örnek 3: Lambda

Sonuç

Kaynaklar

Yorumlar (0)