Çapraz Tablolar ve Kategori İlişki Analizi
Sosyal bilimler araştırmalarında kategorik değişkenler arasındaki ilişkilerin incelenmesi büyük önem taşır. Çapraz tablolar (contingency tables), iki veya daha fazla kategorik değişkenin birlikte dağılımını gösteren temel analiz araçlarıdır. Bu yazıda çapraz tabloların oluşturulmasını, Ki-kare testini ve ilişkisel ölçüleri ayrıntılı şekilde ele alacağız.
Çapraz Tablo Nedir?
Çapraz tablo, iki kategorik değişkenin olası tüm kombinasyonlarındaki gözlem sayılarını gösteren bir matristir. Satırlar bir değişkenin kategorilerini, sütunlar diğer değişkenin kategorilerini temsil eder. Her hücredeki sayı, ilgili kombinasyondaki gözlem sayısını (frekansı) gösterir.
Örneğin, cinsiyet (kadın/erkek) ve oy tercihi (Parti A/Parti B/Parti C) arasındaki ilişkiyi incelemek istediğimizde 2×3 boyutunda bir çapraz tablo oluştururuz. Bu tabloda 6 hücre bulunur ve her hücre ilgili kombinasyondaki kişi sayısını gösterir.
Satır ve Sütun Yüzdeleri
Ham frekanslar yanıltıcı olabilir çünkü satır veya sütun toplamları farklı olabilir. Bu nedenle yüzdeler hesaplanır:
- Satır yüzdesi: Her satırdaki frekansların o satırın toplamına oranıdır. Bağımsız değişken satırlarda ise satır yüzdesi kullanılır
- Sütun yüzdesi: Her sütundaki frekansların o sütunun toplamına oranıdır. Bağımsız değişken sütunlarda ise sütun yüzdesi kullanılır
- Toplam yüzde: Her hücrenin genel toplama oranıdır
Ki-Kare Bağımsızlık Testi
Ki-kare (χ²) bağımsızlık testi, iki kategorik değişken arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını test eder. Test, gözlenen frekansları (O) ile bağımsızlık varsayımı altındaki beklenen frekansları (E) karşılaştırır.
Beklenen Frekansların Hesaplanması
Her hücre için beklenen frekans şu formülle hesaplanır:
E = (Satır Toplamı × Sütun Toplamı) / Genel Toplam
Ki-Kare İstatistiği
Ki-kare istatistiği şu formülle hesaplanır:
χ² = Σ [(O - E)² / E]
Serbestlik derecesi: df = (satır sayısı - 1) × (sütun sayısı - 1)
Ki-Kare Testinin Varsayımları
- Gözlemler birbirinden bağımsız olmalıdır
- Her katılımcı yalnızca bir hücrede yer almalıdır
- Beklenen frekansların %80'i 5'ten büyük olmalıdır
- Hiçbir beklenen frekans 1'den küçük olmamalıdır
- 2×2 tablolarda beklenen frekanslar küçükse Fisher's Exact Test kullanılmalıdır
İlişki Gücü Ölçüleri
Ki-kare testi yalnızca ilişkinin anlamlı olup olmadığını söyler, gücünü belirtmez. İlişkinin büyüklüğünü ölçmek için ek katsayılar kullanılır:
Phi (φ) Katsayısı
Yalnızca 2×2 tablolar için kullanılır. Formül: φ = √(χ²/N). Değeri 0 ile 1 arasında değişir. 0 ilişki yok, 1 ise mükemmel ilişki demektir. Phi katsayısı aslında iki ikili (dichotomous) değişken arasındaki Pearson korelasyon katsayısına eşittir.
Cramér's V Katsayısı
2×2'den büyük tablolar için genelleştirilmiş Phi katsayısıdır. Formül: V = √(χ²/(N × (k-1))), burada k, satır ve sütun sayısından küçük olanıdır. Cohen'in ölçütlerine göre:
- V = 0.10: Küçük etki
- V = 0.30: Orta etki
- V = 0.50: Büyük etki
Kontenjans Katsayısı (C)
Ki-kare temelli bir ilişki ölçüsüdür: C = √(χ²/(χ²+N)). Değeri 0 ile 1 arasında değişir ancak hiçbir zaman 1'e ulaşamaz. Bu nedenle Cramér's V genellikle tercih edilir.
Odds Oranı ve Göreli Risk
Odds Oranı (Odds Ratio)
2×2 tablolarda kullanılır ve bir olayın bir grupta diğer gruba göre kaç kat daha olası olduğunu gösterir. Değeri 1 ise ilişki yoktur, 1'den büyükse pozitif ilişki, 1'den küçükse negatif ilişki vardır. Özellikle vaka-kontrol çalışmalarında yaygın kullanılır.
Göreli Risk (Relative Risk)
Bir grubun belirli bir sonuçla karşılaşma olasılığının diğer gruba oranıdır. Prospektif (ileriye dönük) çalışmalarda kullanılır. Örneğin, sigara içenlerin akciğer kanseri riskinin içmeyenlere göre 15 kat fazla olması, göreli riskin 15 olduğu anlamına gelir.
Sosyal Araştırmadan Örnekler
Çapraz tablolar sosyal bilimlerde sıklıkla kullanılır:
- Oy verme davranışı: Cinsiyet, yaş grubu veya eğitim düzeyi ile parti tercihi arasındaki ilişki
- Sağlık davranışları: Sosyoekonomik düzey ile sağlık taraması yaptırma arasındaki ilişki
- Eğitim çıktıları: Okul türü ile üniversiteye yerleşme arasındaki ilişki
- Suç araştırmaları: Demografik özellikler ile suç mağduriyeti arasındaki ilişki
Çapraz tablo analizi, kategorik verilerle çalışan araştırmacılar için vazgeçilmez bir araçtır. Ki-kare testi ile anlamlılık, Cramér's V ile etki büyüklüğü değerlendirilerek kapsamlı bir ilişki analizi gerçekleştirilir.
Yorumlar (0)
Yorum yapmak için giriş yapmalısınız.
