Araştırma Yöntemleri

Kategorik Veri İlişki Katsayıları: Phi, Cramer's V ve Lambda

PNPeda Network·12 Şubat 2026·0 görüntülenme·
Kategorik Veri İlişki Katsayıları: Phi, Cramer's V ve Lambda

Kategorik (nominal veya ordinal) değişkenler arasındaki ilişkiyi incelemek, sosyal bilimler, eğitim ve sağlık araştırmalarında sıkça karşılaşılan bir ihtiyaçtır. Ki-kare bağımsızlık testi, iki kategorik değişken arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını belirler; ancak bu ilişkinin gücünü (strength) veya yönünü göstermez. Kothari (2004), ki-kare testinin yalnızca bir başlangıç noktası olduğunu ve anlamlı çıkan bir ki-kare sonucunun mutlaka ilişkinin gücünü belirleyen bir ilişki katsayısı ile desteklenmesi gerektiğini vurgular. Bu yazıda, kategorik veriler için kullanılan temel ilişki katsayılarını, formüllerini, yorumlama biçimlerini ve hangi koşullarda hangisinin tercih edileceğini kapsamlı biçimde ele alacağız.

Ki-Kare Testi Neden Tek Başına Yetmez?

Ki-kare (χ²) test istatistiği, örneklem büyüklüğüne doğrudan bağımlıdır. Aynı ilişki yapısına sahip iki veri seti düşünün: Birinde N = 100, diğerinde N = 10.000 olsun. Büyük örneklemdeki ki-kare değeri, küçük örnekleminkine göre çok daha yüksek olacaktır; ancak ilişkinin gücü aynı olabilir. Cohen, Manion ve Morrison (2007), bu durumun araştırmacıları yanıltabileceğini belirtir: İstatistiksel anlamlılık, pratik anlamlılık (meaningful significance) ile karıştırılmamalıdır.

İlişki katsayıları bu sorunu çözer: Ki-kare değerini örneklem büyüklüğüne ve tablo boyutuna göre standartlaştırarak 0 ile 1 arasında (veya bazıları için -1 ile +1 arasında) değişen bir etki büyüklüğü ölçüsü sunar.

Phi Katsayısı (φ)

Phi katsayısı, 2×2 çapraz tablolar için tasarlanmış en temel ilişki ölçüsüdür. İki dikotom (ikili) değişken arasındaki ilişkinin gücünü ve yönünü gösterir.

Formül

φ = √(χ² / N)
Burada χ² = ki-kare test istatistiği, N = toplam örneklem büyüklüğü

Alternatif olarak, 2×2 tablonun hücre frekanslarından doğrudan hesaplanabilir:

φ = (ad - bc) / √[(a+b)(c+d)(a+c)(b+d)]
Burada a, b, c, d tablonun dört hücresindeki frekanslar

Özellikleri ve Yorumlama

  • Aralık: -1 ile +1 arasında değer alır (yalnızca 2×2 tablolarda)
  • Yön: İşareti ilişkinin yönünü gösterir (pozitif veya negatif)
  • Büyüklük: |φ| = 0.10 küçük, 0.30 orta, 0.50 büyük etki (Cohen'in ölçütleri)
  • Pearson r ile ilişkisi: 2×2 tablolarda phi katsayısı, Pearson korelasyon katsayısına eşittir

Kothari (2004), phi katsayısının basitliği ve doğrudan yorumlanabilirliği nedeniyle 2×2 tablolarda en çok tercih edilen ölçü olduğunu belirtir. Ancak daha büyük tablolarda (3×2, 4×3 gibi) phi değeri 1'i aşabilir ve bu nedenle kullanılmamalıdır.

Cramer's V

Cramer's V, phi katsayısının her boyuttaki çapraz tablolara genelleştirilmiş halidir. 2×2'den büyük tablolarda ilişki gücünü ölçmek için standart ölçüdür.

Formül

V = √[χ² / (N × (k-1))]
Burada k = min(satır sayısı, sütun sayısı); yani tablonun daha küçük boyutu

Özellikleri ve Yorumlama

  • Aralık: 0 ile 1 arasında değer alır (yön bilgisi vermez)
  • 2×2 tabloda: Phi katsayısının mutlak değerine eşittir
  • Büyüklük yorumlama: Tablo boyutuna göre değişir. Serbestlik derecesi 1 olan tablolarda (2×2): V = 0.10 küçük, 0.30 orta, 0.50 büyük. Serbestlik derecesi 2 olan tablolarda (3×2 veya 2×3): V = 0.07 küçük, 0.21 orta, 0.35 büyük. Serbestlik derecesi 3 ve üzeri tablolarda eşik değerleri daha da düşer

Cohen, Manion ve Morrison (2007), Cramer's V'nin evrensel uygulanabilirliği nedeniyle kategorik ilişki raporlamada en yaygın kullanılan ölçü olduğunu belirtir. Özellikle farklı boyutlardaki tabloların karşılaştırılmasında standart bir ölçü olarak tercih edilir.

Kontenjans Katsayısı (C)

Kontenjans katsayısı (Pearson's contingency coefficient), ki-kare değerine dayalı bir diğer ilişki ölçüsüdür:

C = √[χ² / (χ² + N)]

Özellikleri

  • Aralık: 0 ile 1 arasında; ancak teorik üst sınır tablonun boyutuna bağlıdır ve hiçbir zaman 1'e ulaşamaz
  • 2×2 tabloda: Maksimum değer √(1/2) ≈ 0.707
  • 3×3 tabloda: Maksimum değer √(2/3) ≈ 0.816
  • Sınırlılık: Farklı boyutlardaki tabloların C değerleri doğrudan karşılaştırılamaz çünkü üst sınırları farklıdır

Kothari (2004), bu sınırlılık nedeniyle kontenjans katsayısının Cramer's V'ye kıyasla daha az tercih edildiğini belirtir. Ancak bazı eski ders kitaplarında ve belirli disiplinlerde hâlâ yaygın biçimde kullanılmaktadır.

Yule's Q

Yule's Q, 2×2 tablolarda ordinal düzeyde iki değişken arasındaki ilişkiyi ölçen bir katsayıdır. Özellikle epidemiyoloji ve sosyal bilimlerde odds oranı (OR) ile doğrudan ilişkili olması nedeniyle kullanılır.

Q = (ad - bc) / (ad + bc)
Burada a, b, c, d tablonun dört hücresindeki frekanslar

Özellikleri

  • Aralık: -1 ile +1 arasında
  • Yön: Pozitif değer pozitif ilişki, negatif değer negatif ilişki gösterir
  • Odds oranı ile ilişki: Q = (OR - 1) / (OR + 1)
  • Sınırlılık: Yalnızca 2×2 tablolarda kullanılabilir; daha büyük tablolar için uygun değildir

Cohen, Manion ve Morrison (2007), Yule's Q'nun phi katsayısına göre genellikle daha yüksek değerler verdiğini ve bu nedenle iki ölçünün doğrudan karşılaştırılmaması gerektiğini belirtir.

Goodman-Kruskal Gamma (γ)

Gamma katsayısı, iki ordinal değişken arasındaki ilişkiyi ölçer. Uyumlu (concordant) ve uyumsuz (discordant) çift sayılarına dayanır.

γ = (Nc - Nd) / (Nc + Nd)
Burada Nc = uyumlu çift sayısı, Nd = uyumsuz çift sayısı

Özellikleri

  • Aralık: -1 ile +1 arasında
  • Yön: Pozitif değer: bir değişken arttıkça diğeri de artar; negatif değer: biri arttıkça diğeri azalır
  • Simetrik: Hangi değişkenin bağımsız, hangisinin bağımlı olduğu fark etmez
  • Bağlı çiftleri (ties) yok sayar: Bu nedenle diğer ordinal ölçülere kıyasla genellikle daha yüksek değerler verir

Kothari (2004), gamma katsayısının bağlı çiftleri göz ardı etmesinin, özellikle çok sayıda bağlı çift olduğunda (az sayıda kategori ile) ilişki gücünü abartabileceğini belirtir.

Somers' d

Somers' d, gamma katsayısının asimetrik bir versiyonudur. Bağımlı değişkendeki bağlı çiftleri dikkate alır ancak bağımsız değişkendeki bağlı çiftleri göz ardı eder.

d(Y|X) = (Nc - Nd) / (Nc + Nd + T_Y)
Burada T_Y = bağımlı değişkende (Y) bağlı olan çift sayısı

Özellikleri

  • Aralık: -1 ile +1 arasında
  • Asimetrik: d(Y|X) ≠ d(X|Y); hangi değişkenin bağımlı olduğu önemlidir
  • PRE yorumu: Bağımsız değişkeni bilerek bağımlı değişkeni tahmin etmedeki oransal hata azalması
  • Gamma ile ilişki: Gamma, Somers' d'nin simetrik versiyonu olarak düşünülebilir

Lambda (λ) Katsayısı

Lambda, nominal değişkenler için bir PRE (Proportional Reduction in Error - Oransal Hata Azaltma) ölçüsüdür. Bir değişkeni bilmenin, diğer değişkeni tahmin etmedeki hatayı ne kadar azalttığını gösterir.

λ = (E₁ - E₂) / E₁
Burada E₁ = bağımsız değişkeni bilmeden yapılan tahmin hatası, E₂ = bağımsız değişkeni bilerek yapılan tahmin hatası

Özellikleri

  • Aralık: 0 ile 1 arasında
  • Asimetrik: λ(Y|X) ≠ λ(X|Y); simetrik bir versiyonu da mevcuttur
  • PRE yorumu: λ = 0.35 ise, bağımsız değişkeni bilmek tahmin hatasını %35 azaltır
  • Sınırlılık: Marjinal dağılımlar çok çarpık olduğunda 0 değeri alabilir (ilişki olmasına rağmen)

Cohen, Manion ve Morrison (2007), lambda'nın PRE yorumunun pratik açıdan çok değerli olduğunu ancak 0 alma probleminin farkında olunması gerektiğini belirtir. Bu sorun, bir değişkenin modal kategorisi tüm alt gruplarda aynı olduğunda ortaya çıkar.

Kendall'ın Tau-b ve Tau-c Katsayıları

Tau-b (τ_b)

Tau-b, kare tablolarda (satır sayısı = sütun sayısı) iki ordinal değişken arasındaki ilişkiyi ölçer. Hem bağımlı hem de bağımsız değişkendeki bağlı çiftleri dikkate alır.

τ_b = (Nc - Nd) / √[(Nc + Nd + T_X)(Nc + Nd + T_Y)]

Tau-c (τ_c / Stuart's Tau-c)

Tau-c, dikdörtgen tablolarda (satır sayısı ≠ sütun sayısı) kullanılmak üzere tasarlanmıştır. Kare olmayan tablolarda tau-b'nin 1 veya -1 değerine ulaşamaması sorununu düzeltir.

τ_c = 2m(Nc - Nd) / [N²(m-1)]
Burada m = min(satır sayısı, sütun sayısı)

Tüm Ölçülerin Karşılaştırma Tablosu

ÖlçüTablo BoyutuÖlçüm DüzeyiAralıkSimetriPRE Yorumu
Phi (φ)2×2Nominal/Dikotom-1 ile +1SimetrikHayır
Cramer's VHer boyutNominal0 ile 1SimetrikHayır
Kontenjans CHer boyutNominal0 ile <1SimetrikHayır
Yule's Q2×2Ordinal-1 ile +1SimetrikHayır
Gamma (γ)Her boyutOrdinal-1 ile +1SimetrikEvet (kısmen)
Somers' dHer boyutOrdinal-1 ile +1AsimetrikEvet
Lambda (λ)Her boyutNominal0 ile 1AsimetrikEvet
Tau-b (τ_b)Kare tablolarOrdinal-1 ile +1SimetrikHayır
Tau-c (τ_c)Dikdörtgen tablolarOrdinal-1 ile +1SimetrikHayır

SPSS Çıktısı Yorumlama

SPSS'te ki-kare analizi yaptığınızda, Analyze > Descriptive Statistics > Crosstabs yolunu izlersiniz. İlişki katsayılarını elde etmek için Statistics butonuna tıklayarak ilgili ölçüleri seçersiniz:

  • Nominal veriler için: Phi and Cramer's V, Lambda, Contingency Coefficient kutucuklarını işaretleyin
  • Ordinal veriler için: Gamma, Somers' d, Kendall's tau-b, Kendall's tau-c kutucuklarını işaretleyin

SPSS çıktısında Symmetric Measures tablosu ilişki katsayılarını, Directional Measures tablosu ise asimetrik ölçüleri (lambda, Somers' d) gösterir. Her ölçü için değer (Value), asimptotik standart hata (Asymp. Std. Error), yaklaşık T değeri (Approx. T) ve anlamlılık düzeyi (Approx. Sig.) raporlanır.

Hangi Ölçüyü Ne Zaman Kullanmalı?

Doğru ilişki katsayısını seçmek için şu karar akışını izleyebilirsiniz:

  1. Değişkenlerin ölçüm düzeyi nedir? Her iki değişken de nominal ise: Phi (2×2) veya Cramer's V (daha büyük tablolar). En az bir değişken ordinal ise: Gamma, Tau-b/c veya Somers' d
  2. Tablo boyutu nedir? 2×2 tablo: Phi veya Yule's Q. Kare tablo (3×3, 4×4): Tau-b veya Gamma. Dikdörtgen tablo: Cramer's V (nominal) veya Tau-c (ordinal)
  3. Yön bilgisi gerekli mi? Yön önemliyse: Phi (2×2), Gamma, Tau-b/c, Somers' d. Yön önemli değilse: Cramer's V, Kontenjans C, Lambda
  4. PRE yorumu isteniyor mu? Evet ise: Lambda (nominal), Somers' d (ordinal)
  5. Asimetrik ilişki mi? Bir değişken bağımsız, diğeri bağımlı ise: Lambda, Somers' d

APA Formatında Raporlama

Kategorik ilişki katsayılarının APA formatında raporlanmasında şu unsurlar yer almalıdır:

  1. Ki-kare test istatistiği, serbestlik derecesi ve anlamlılık düzeyi
  2. Seçilen ilişki katsayısı ve değeri
  3. Etki büyüklüğü yorumu

2×2 tablo örneği: "Cinsiyet ile sigara içme durumu arasında anlamlı bir ilişki bulunmuştur, χ²(1, N = 250) = 8.45, p = .004, φ = .18. Phi katsayısı, iki değişken arasında küçük-orta düzeyde bir ilişki olduğunu göstermektedir."

Daha büyük tablo örneği: "Eğitim düzeyi ile iş memnuniyeti arasında anlamlı bir ilişki saptanmıştır, χ²(6, N = 500) = 24.32, p < .001, Cramer's V = .16. Bu değer, orta düzeyde bir ilişkiye işaret etmektedir."

Ordinal değişkenler örneği: "Gelir düzeyi ile yaşam memnuniyeti arasında pozitif yönde anlamlı bir ilişki bulunmuştur, γ = .42, p < .001. Bu sonuç, gelir düzeyi arttıkça yaşam memnuniyetinin de artma eğiliminde olduğunu göstermektedir."

Pratik Örnekler

Örnek 1: Phi Katsayısı

Bir araştırmacı, 200 üniversite öğrencisinde cinsiyet (kadın/erkek) ile yurt dışı deneyimi (var/yok) arasındaki ilişkiyi inceliyor. Ki-kare testi: χ²(1) = 5.12, p = .024. Phi katsayısı: φ = .16. Yorumlama: Cinsiyet ile yurt dışı deneyimi arasında istatistiksel olarak anlamlı ancak küçük düzeyde bir ilişki vardır.

Örnek 2: Cramer's V

Bölüm (fen, sosyal, sağlık) ile öğrenme stili (görsel, işitsel, kinestetik) arasındaki ilişki 450 öğrenci üzerinde inceleniyor. Ki-kare testi: χ²(4) = 18.76, p < .001. Cramer's V = .14. Yorumlama: Bölüm ile öğrenme stili arasında anlamlı ancak küçük-orta düzeyde bir ilişki bulunmaktadır.

Örnek 3: Lambda

Mezuniyet alanı (4 kategori) ile istihdam sektörü (3 kategori) arasındaki ilişkide λ(istihdam|mezuniyet) = 0.28. Yorumlama: Bir kişinin mezuniyet alanını bilmek, istihdam sektörünü tahmin etmedeki hatayı %28 oranında azaltmaktadır.

Sonuç

Kategorik değişkenler arası ilişki katsayıları, ki-kare testinin ötesinde ilişkinin gücünü, yönünü ve pratik anlamlılığını değerlendirmek için vazgeçilmez araçlardır. Kothari'nin (2004) vurguladığı gibi, istatistiksel anlamlılık ile pratik anlamlılık birbirinden farklı kavramlardır ve etki büyüklüğü ölçüleri bu ayrımı yapabilmemizi sağlar. Phi katsayısı 2×2 tablolarda, Cramer's V her boyuttaki nominal tablolarda, gamma ve tau katsayıları ordinal veriler için, lambda ise PRE yorumu gerektiren durumlarda tercih edilmelidir. Cohen, Manion ve Morrison'un (2007) belirttiği gibi, doğru katsayının seçimi değişkenlerin ölçüm düzeyine, tablo boyutuna, simetri/asimetri ihtiyacına ve yorumlama amacına bağlıdır. Araştırmacıların bu zengin ölçü repertuarını bilmesi ve araştırma bağlamına uygun olanı seçmesi, bulgularının daha bilgilendirici ve doğru yorumlanmasını sağlayacaktır.

Kaynaklar

Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach (5th ed.). Cengage Learning.Kothari, C. R. (2004). Research methodology: Methods and techniques (2nd ed.). New Age International.Creswell, J. W. (2009). Research design: Qualitative, quantitative, and mixed methods approaches (3rd ed.). SAGE.Bhome, S. M., Jha, J. K., et al. (2013). Research methodology. Himalaya Publishing House.

Yorumlar (0)

Yorum yapmak için giriş yapmalısınız.