Hangi İstatistiksel Testi Seçmeliyim? Karar Ağacı ve Rehber
İstatistiksel analiz, nicel araştırmanın en kritik aşamalarından biridir ve doğru istatistiksel testin seçimi, araştırma bulgularının geçerliğini doğrudan etkiler. Jackson (2015), istatistiksel test seçiminde yanlış karar vermenin araştırma sonuçlarını temelden geçersiz kılabileceğini vurgular. Bu yazıda, araştırma sorunuza, veri türünüze ve örneklem özelliklerinize uygun istatistiksel testi seçmeniz için sistematik bir karar ağacı yaklaşımı sunacağız.
Karar Ağacı Yaklaşımı: Dört Temel Soru
Doğru istatistiksel testi seçmek için sırasıyla şu dört temel soruyu yanıtlamanız gerekir:
- Araştırma sorunuzun türü nedir? (Fark mı arıyorsunuz, ilişki mi, yordama mı?)
- Değişkenlerinizin ölçme düzeyi nedir? (Nominal, ordinal, aralık, oran)
- Kaç grubunuz veya değişkeniniz var? (İki grup, ikiden fazla grup, çok değişkenli)
- Gruplar bağımsız mı yoksa ilişkili mi? (Bağımsız örneklem, tekrarlı ölçüm)
Kothari'ye (2004) göre bu sorulara sistematik biçimde yanıt vermek, istatistiksel test seçiminde keyfi kararları önler ve araştırmanın metodolojik tutarlılığını güvence altına alır.
Ölçme Düzeyleri ve Test Seçimi
İstatistiksel test seçiminde ilk adım, değişkenlerinizin ölçme düzeyini belirlemektir:
| Ölçme Düzeyi | Özellikler | Örnekler | Uygun Test Ailesi |
|---|---|---|---|
| Nominal | Kategorik, sıralama yok | Cinsiyet, meslek, kan grubu | Ki-kare, Fisher kesin testi |
| Ordinal | Kategorik, sıralama var, eşit aralık yok | Likert maddesi, eğitim düzeyi | Non-parametrik testler (Mann-Whitney, Kruskal-Wallis) |
| Aralık | Eşit aralıklı, gerçek sıfır yok | Sıcaklık (°C), IQ puanı, ölçek toplam puanı | Parametrik testler (t-testi, ANOVA, Pearson r) |
| Oran | Eşit aralıklı, gerçek sıfır var | Boy, kilo, gelir, yaş | Parametrik testler |
Tartışmalı Konu: Likert tipi ölçeklerin (toplamda) aralık düzeyinde mi yoksa ordinal düzeyinde mi olduğu tartışmalıdır. Jackson (2015), tek bir Likert maddesi ordinal iken, birden fazla maddenin toplamının veya ortalamasının aralık düzeyinde kabul edilebileceğini ve parametrik testlere uygun olduğunu belirtir. Ancak bu kabul araştırmacının gerekçelendirmesi gereken bir karardır.
Parametrik Testler: Genel Bakış
Parametrik testler, verilerin belirli varsayımları karşıladığı durumlarda kullanılır. Bu testler genellikle daha güçlüdür (istatistiksel güç yüksektir) ancak varsayımların karşılanmaması sonuçları geçersiz kılabilir.
Parametrik Testlerin Varsayımları
- Normallik: Bağımlı değişken normal dağılım göstermelidir (Shapiro-Wilk testi, histogram, Q-Q plot ile kontrol edilir)
- Varyans homojenliği: Gruplar arası varyanslar eşit olmalıdır (Levene testi ile kontrol edilir)
- Bağımsızlık: Gözlemler birbirinden bağımsız olmalıdır (araştırma tasarımı ile sağlanır)
- Aralık veya oran düzeyinde ölçüm: Bağımlı değişken en az aralık düzeyinde ölçülmelidir
Temel Parametrik Testler
| Test | Amaç | Grup/Değişken Sayısı | Örnek |
|---|---|---|---|
| Bağımsız örneklem t-testi | İki bağımsız grubun ortalamalarını karşılaştırma | 2 bağımsız grup, 1 bağımlı değişken | Erkek ve kadın öğrencilerin matematik puanı |
| Eşleştirilmiş örneklem t-testi | Aynı grubun iki farklı zamandaki ortalamalarını karşılaştırma | 1 grup, 2 ölçüm (ön-test/son-test) | Eğitim öncesi ve sonrası tutum puanları |
| Tek yönlü ANOVA | İkiden fazla bağımsız grubun ortalamalarını karşılaştırma | 3+ bağımsız grup, 1 bağımlı değişken | Üç farklı öğretim yönteminin başarıya etkisi |
| Tekrarlı ölçümlerde ANOVA | Aynı grubun ikiden fazla zamandaki ortalamalarını karşılaştırma | 1 grup, 3+ ölçüm | Tedavinin 1., 3. ve 6. aydaki etkisi |
| İki yönlü ANOVA | İki bağımsız değişkenin ve etkileşimlerinin bağımlı değişken üzerindeki etkisi | 2 bağımsız değişken, 1 bağımlı değişken | Cinsiyet ve öğretim yöntemi etkileşimi |
| Pearson korelasyonu | İki sürekli değişken arasındaki doğrusal ilişkiyi ölçme | 2 sürekli değişken | Çalışma süresi ile sınav puanı ilişkisi |
| Basit doğrusal regresyon | Bir bağımsız değişkenin bağımlı değişkeni yordama gücü | 1 yordayıcı, 1 bağımlı | Öz-yeterliğin başarıyı yordaması |
| Çoklu regresyon | Birden fazla bağımsız değişkenin bağımlı değişkeni yordama gücü | 2+ yordayıcı, 1 bağımlı | Motivasyon, tutum ve kaygının başarıyı yordaması |
Non-Parametrik Testler: Parametrik Alternatifleri
Non-parametrik testler, parametrik test varsayımları karşılanmadığında veya veriler ordinal/nominal düzeyde olduğunda kullanılır. Kothari (2004), non-parametrik testlerin "dağılımdan bağımsız" (distribution-free) testler olarak adlandırıldığını ve normallik varsayımı gerektirmediğini belirtir.
| Parametrik Test | Non-Parametrik Alternatifi | Ne Zaman Kullanılır |
|---|---|---|
| Bağımsız örneklem t-testi | Mann-Whitney U testi | İki bağımsız grup, ordinal veri veya normallik sağlanmıyor |
| Eşleştirilmiş örneklem t-testi | Wilcoxon işaretli sıralar testi | Aynı grubun iki ölçümü, ordinal veri veya normallik sağlanmıyor |
| Tek yönlü ANOVA | Kruskal-Wallis H testi | 3+ bağımsız grup, ordinal veri veya normallik sağlanmıyor |
| Tekrarlı ölçümlerde ANOVA | Friedman testi | Aynı grubun 3+ ölçümü, ordinal veri veya normallik sağlanmıyor |
| Pearson korelasyonu | Spearman sıra korelasyonu | İki ordinal değişken veya normallik sağlanmıyor |
| - | Ki-kare bağımsızlık testi | İki kategorik (nominal) değişken arasındaki ilişki |
| - | Fisher kesin testi | Ki-kare varsayımları karşılanmıyor (beklenen frekans < 5) |
Kapsamlı Karar Tablosu
Cohen, Manion ve Morrison (2007), araştırma sorusu türüne göre sistematik bir test seçim yaklaşımı önermektedir. Aşağıdaki tablo, araştırma sorunuzun türüne göre uygun istatistiksel testi belirlemenize yardımcı olacaktır:
| Araştırma Sorusu Türü | Bağımsız Değişken | Bağımlı Değişken | Önerilen Test |
|---|---|---|---|
| İki grup arasında fark var mı? (bağımsız) | Kategorik (2 düzey) | Sürekli (normal) | Bağımsız t-testi |
| İki grup arasında fark var mı? (bağımsız) | Kategorik (2 düzey) | Ordinal veya normal değil | Mann-Whitney U |
| Ön-test ve son-test arasında fark var mı? | Zaman (2 düzey, ilişkili) | Sürekli (normal) | Eşleştirilmiş t-testi |
| Ön-test ve son-test arasında fark var mı? | Zaman (2 düzey, ilişkili) | Ordinal veya normal değil | Wilcoxon |
| Üç veya daha fazla grup arasında fark var mı? | Kategorik (3+ düzey) | Sürekli (normal) | Tek yönlü ANOVA |
| Üç veya daha fazla grup arasında fark var mı? | Kategorik (3+ düzey) | Ordinal veya normal değil | Kruskal-Wallis |
| İki değişken arasında ilişki var mı? | Sürekli | Sürekli | Pearson r |
| İki değişken arasında ilişki var mı? | Ordinal | Ordinal | Spearman rho |
| İki kategorik değişken arasında ilişki var mı? | Kategorik | Kategorik | Ki-kare |
| Bir değişken diğerini yordayabiliyor mu? | Sürekli (1 yordayıcı) | Sürekli | Basit regresyon |
| Birden fazla değişken bağımlı değişkeni yordayabiliyor mu? | Sürekli (2+ yordayıcı) | Sürekli | Çoklu regresyon |
| İki bağımsız değişkenin etkileşim etkisi var mı? | Kategorik (2 bağımsız değişken) | Sürekli | İki yönlü ANOVA |
Varsayımları Kontrol Etme
Jackson (2015), parametrik test varsayımlarının kontrol edilmesinin araştırma sürecinin zorunlu bir adımı olduğunu vurgular. Varsayımlar karşılanmıyorsa ya non-parametrik alternatif kullanılmalı ya da veri dönüştürme yoluna gidilmelidir.
Normallik Kontrolü
- Shapiro-Wilk testi: Küçük örneklemlerde (n < 50) tercih edilir; p > .05 ise normallik varsayımı karşılanır
- Kolmogorov-Smirnov testi: Büyük örneklemlerde kullanılır; ancak çok hassastır, büyük örneklemlerde neredeyse her zaman anlamlı çıkar
- Çarpıklık ve basıklık: -1 ile +1 arasında ise kabul edilebilir (bazı kaynaklarda -2 ile +2)
- Histogram ve Q-Q plot: Görsel inceleme, istatistiksel testlere ek olarak değerlendirilmelidir
Varyans Homojenliği Kontrolü
- Levene testi: p > .05 ise varyanslar homojendir; en yaygın kullanılan testtir
- Eşit olmayan varyanslar durumunda: Welch t-testi veya Welch ANOVA kullanılabilir
Etki Büyüklüğü Ölçüleri
İstatistiksel anlamlılık (p değeri) tek başına yeterli değildir; etki büyüklüğü (effect size) de raporlanmalıdır. Jackson (2015), etki büyüklüğünün "pratik anlamlılığı" ifade ettiğini ve p değerinin örneklem büyüklüğüne bağlı olarak yanıltıcı olabileceğini belirtir.
| Test | Etki Büyüklüğü Ölçüsü | Küçük | Orta | Büyük |
|---|---|---|---|---|
| t-testi | Cohen's d | 0.20 | 0.50 | 0.80 |
| ANOVA | Eta-kare (η²) | 0.01 | 0.06 | 0.14 |
| Korelasyon | r (korelasyon katsayısı) | 0.10 | 0.30 | 0.50 |
| Regresyon | R² (belirlilik katsayısı) | 0.02 | 0.13 | 0.26 |
| Ki-kare | Cramér's V | 0.10 | 0.30 | 0.50 |
| Mann-Whitney U | r = Z / √N | 0.10 | 0.30 | 0.50 |
Yazılım Önerileri
Kothari (2004) ve Cohen, Manion ve Morrison (2007), istatistiksel analiz için çeşitli yazılımların kullanılabileceğini belirtir:
- SPSS (IBM): Sosyal bilimler araştırmalarında en yaygın kullanılan yazılım; kullanıcı dostu arayüz, menü tabanlı analiz
- R (açık kaynak): Ücretsiz, güçlü ve esnek; paket ekosistemi zengin, ancak öğrenme eğrisi yüksek
- JASP (açık kaynak): Bayesci ve frekansçı analiz desteği; SPSS benzeri arayüz, ücretsiz
- Jamovi (açık kaynak): R tabanlı, kullanıcı dostu arayüz; temel analizler için ideal
- G*Power: İstatistiksel güç analizi ve örneklem büyüklüğü hesaplama için uzmanlaşmış yazılım
- Excel: Temel betimsel istatistikler ve basit testler için kullanılabilir; ancak ileri analizler için yetersizdir
Sık Yapılan Hatalar
- Varsayım kontrolü yapmamak: Normallik ve varyans homojenliği kontrol edilmeden parametrik test uygulamak
- Çoklu karşılaştırma düzeltmesi yapmamak: ANOVA sonrası çoklu karşılaştırmalarda Bonferroni veya Tukey düzeltmesi uygulanmalıdır
- Yalnızca p değeri raporlamak: Etki büyüklüğü ve güven aralıkları da mutlaka raporlanmalıdır
- Ordinal verilere parametrik test uygulamak: Tek bir Likert maddesi ordinaldir; parametrik test için gerekçe sunulmalıdır
- Küçük örneklemle çok değişkenli analiz yapmak: Regresyon için kural olarak her yordayıcı başına en az 10-15 katılımcı önerilir
- Korelasyonu nedensellik olarak yorumlamak: Korelasyon, nedensel ilişki anlamına gelmez; bu en yaygın istatistiksel yorum hatasıdır
- Anlamlı çıkmayan sonuçları "başarısızlık" olarak görmek: p > .05 sonuçları da önemli bulgulardır ve raporlanmalıdır
Jackson'ın (2015) Altın Kuralı: İstatistiksel test seçimi, veri toplandıktan sonra değil, araştırma tasarımı aşamasında yapılmalıdır. Araştırma sorunuzu formüle ederken hangi testi kullanacağınızı bilmeniz, veri toplama sürecinizi de doğru biçimde yönlendirecektir.
Sonuç
Doğru istatistiksel testi seçmek, araştırma bulgularının geçerliği ve güvenirliği açısından kritik öneme sahiptir. Karar ağacı yaklaşımı, araştırma sorusunun türü, ölçme düzeyi, grup sayısı ve örneklem ilişkisi gibi temel soruları sistematik biçimde yanıtlayarak doğru teste ulaşmanızı sağlar. Varsayımları kontrol etmek, etki büyüklüğü raporlamak ve bulguları doğru yorumlamak, istatistiksel analizin kalitesini belirleyen temel unsurlardır. Jackson'ın (2015), Kothari'nin (2004) ve Cohen, Manion ve Morrison'un (2007) vurguladığı gibi, istatistiksel yetkinlik yalnızca teknik bir beceri değil, araştırma sürecinin bütünlüğünü koruyan bir sorumluluktur.
Kaynaklar
Yorumlar (0)
Yorum yapmak için giriş yapmalısınız.
