Ki-Kare (χ²) Testi: Kategorik Verilerin İstatistiksel Analizi
Kategorik (sınıflamalı) verilerle çalışırken en sık başvurulan istatistiksel test olan ki-kare (χ²) testi, gözlenen frekansların beklenen frekanslara uygunluğunu değerlendirir. Bu yazıda, ki-kare testinin iki temel türünü, uygulama koşullarını, etki büyüklüğü hesaplamalarını ve pratik örnekleri detaylı olarak ele alacağız.
Ki-Kare Testi Nedir?
Ki-kare testi, kategorik (nominal veya ordinal) veriler arasındaki ilişkiyi veya dağılım uygunluğunu test etmek için kullanılan parametrik olmayan bir istatistiksel testtir. İki temel türü vardır:
- Ki-kare uyum iyiliği testi (Goodness-of-fit): Tek bir değişkenin gözlenen dağılımının beklenen bir dağılıma uyup uymadığını test eder
- Ki-kare bağımsızlık testi (Test of independence): İki kategorik değişken arasında ilişki olup olmadığını test eder
Ki-Kare Uyum İyiliği Testi
Bu test, bir değişkenin gözlenen frekans dağılımının teorik veya beklenen bir dağılıma uyup uymadığını değerlendirir.
Örnek Uygulama
Bir üniversitede 200 öğrencinin fakülte tercihlerinin eşit dağılım gösterip göstermediğini test etmek istiyorsunuz. Dört fakülte varsa, eşit dağılım varsayımında her fakültede 50 öğrenci beklenir. Gözlenen frekanslar (65, 55, 45, 35) ile beklenen frekanslar (50, 50, 50, 50) karşılaştırılır.
Ki-kare formülü: χ² = Σ [(O - E)² / E]
Burada O gözlenen frekans, E beklenen frekanstır. Serbestlik derecesi sd = k - 1 olarak hesaplanır (k: kategori sayısı).
Ki-Kare Bağımsızlık Testi
Bu test, iki kategorik değişkenin birbirinden bağımsız olup olmadığını çapraz tablo (contingency table) kullanarak değerlendirir.
Çapraz Tablo (Kontenjans Tablosu)
Çapraz tablo, iki kategorik değişkenin frekans dağılımını satır ve sütunlar halinde düzenler. Örneğin, cinsiyet (kadın/erkek) ve eğitim tercihini (yüz yüze/uzaktan) gösteren bir 2x2 tablo:
| Yüz yüze | Uzaktan | Toplam | |
|---|---|---|---|
| Kadın | 40 | 60 | 100 |
| Erkek | 55 | 45 | 100 |
| Toplam | 95 | 105 | 200 |
Beklenen Frekansların Hesaplanması
Her hücrenin beklenen frekansı şu formülle hesaplanır:
E = (Satır toplamı × Sütun toplamı) / Genel toplam
Örneğin, Kadın-Yüz yüze hücresinin beklenen frekansı: (100 × 95) / 200 = 47.5
Serbestlik Derecesi
Bağımsızlık testinde serbestlik derecesi: sd = (satır sayısı - 1) × (sütun sayısı - 1)
2x2 tablo için sd = (2-1)(2-1) = 1 olur.
Ki-Kare Testinin Varsayımları
- Bağımsız gözlemler: Her bir gözlem yalnızca bir kategoriye ait olmalıdır
- Yeterli beklenen frekans: Tüm hücrelerdeki beklenen frekansların 5'ten büyük olması gerekir. 2x2 tablolarda en az 5 olmalıdır
- Rastgele örnekleme: Veriler rastgele seçilmiş olmalıdır
- Yeterli örneklem büyüklüğü: Genel olarak toplam N en az 20 olmalıdır
Beklenen Frekans Kuralının İhlali
Beklenen frekanslar 5'ten küçük olduğunda şu çözüm yolları düşünülmelidir:
- Kategorileri birleştirmek (mantıklıysa)
- Daha büyük örneklem toplamak
- Fisher kesin testini kullanmak (2x2 tablolar için)
Fisher Kesin Testi
Fisher kesin testi (Fisher's exact test), özellikle küçük örneklemlerde ve beklenen frekansların düşük olduğu 2x2 tablolarda ki-kare testine alternatif olarak kullanılır. Ki-kare testinin aksine, bu test bir yaklaşım değil, kesin olasılıkları hesaplar. Beklenen frekansların herhangi birinin 5'in altında olduğu durumlarda Fisher kesin testi tercih edilmelidir.
Etki Büyüklüğü: Cramér's V
Ki-kare testi istatistiksel anlamlılığı gösterir ancak ilişkinin gücü hakkında bilgi vermez. Bunun için Cramér's V etki büyüklüğü kullanılır:
V = √(χ² / (N × (k - 1)))
Burada k, satır veya sütun sayısının küçük olanıdır. V değeri 0 ile 1 arasında değer alır:
- V = .10: Küçük etki
- V = .30: Orta etki
- V = .50: Büyük etki
2x2 tablolarda Cramér's V, phi (φ) katsayısına eşittir.
Yates Düzeltmesi
2x2 tablolarda, özellikle küçük örneklemlerde, ki-kare değeri abartılabilir. Yates süreklilik düzeltmesi bu sorunu gidermek için |O - E| değerinden 0.5 çıkarır. Ancak modern istatistik yazılımları genellikle bu düzeltmeyi otomatik olarak uygular ve bazı araştırmacılar düzeltmenin gereksiz yere muhafazakar sonuçlar verdiğini öne sürer.
APA Raporlama Formatı
Ki-kare test sonuçlarını şu şekilde raporlayabilirsiniz:
Cinsiyet ile eğitim tercihi arasında istatistiksel olarak anlamlı bir ilişki bulunmuştur, χ²(1, N = 200) = 4.51, p = .034, V = .15. Erkek öğrenciler yüz yüze eğitimi daha fazla tercih ederken, kadın öğrenciler uzaktan eğitimi daha fazla tercih etmiştir.
Sonuç
Ki-kare testi, kategorik verilerle çalışan araştırmacılar için temel bir istatistiksel araçtır. Uyum iyiliği veya bağımsızlık testlerini doğru koşullarda kullanmak, beklenen frekans varsayımlarını kontrol etmek ve mutlaka etki büyüklüğü raporlamak, güvenilir ve eksiksiz bir analiz için vazgeçilmez adımlardır.
Yorumlar (0)
Yorum yapmak için giriş yapmalısınız.
