Hangi İstatistiksel Testi Seçmeliyim? Karar Ağacı ve Kapsamlı Rehber

İstatistiksel analiz, nicel araştırmanın en kritik aşamalarından biridir ve doğru istatistiksel testin seçimi, araştırma bulgularının geçerliğini doğrudan etkiler. Jackson (2015), istatistiksel test seçiminde yanlış karar vermenin araştırma sonuçlarını temelden geçersiz kılabileceğini vurgular. Bu yazıda, araştırma sorunuza, veri türünüze ve örneklem özelliklerinize uygun istatistiksel testi seçmeniz için sistematik bir karar ağacı yaklaşımı sunacağız.

Karar Ağacı Yaklaşımı: Dört Temel Soru

Doğru istatistiksel testi seçmek için sırasıyla şu dört temel soruyu yanıtlamanız gerekir:

Araştırma sorunuzun türü nedir? (Fark mı arıyorsunuz, ilişki mi, yordama mı?)
Değişkenlerinizin ölçme düzeyi nedir? (Nominal, ordinal, aralık, oran)
Kaç grubunuz veya değişkeniniz var? (İki grup, ikiden fazla grup, çok değişkenli)
Gruplar bağımsız mı yoksa ilişkili mi? (Bağımsız örneklem, tekrarlı ölçüm)

Kothari'ye (2004) göre bu sorulara sistematik biçimde yanıt vermek, istatistiksel test seçiminde keyfi kararları önler ve araştırmanın metodolojik tutarlılığını güvence altına alır.

Ölçme Düzeyleri ve Test Seçimi

İstatistiksel test seçiminde ilk adım, değişkenlerinizin ölçme düzeyini belirlemektir:

Ölçme Düzeyi	Özellikler	Örnekler	Uygun Test Ailesi
Nominal	Kategorik, sıralama yok	Cinsiyet, meslek, kan grubu	Ki-kare, Fisher kesin testi
Ordinal	Kategorik, sıralama var, eşit aralık yok	Likert maddesi, eğitim düzeyi	Non-parametrik testler (Mann-Whitney, Kruskal-Wallis)
Aralık	Eşit aralıklı, gerçek sıfır yok	Sıcaklık (°C), IQ puanı, ölçek toplam puanı	Parametrik testler (t-testi, ANOVA, Pearson r)
Oran	Eşit aralıklı, gerçek sıfır var	Boy, kilo, gelir, yaş	Parametrik testler

Tartışmalı Konu: Likert tipi ölçeklerin (toplamda) aralık düzeyinde mi yoksa ordinal düzeyinde mi olduğu tartışmalıdır. Jackson (2015), tek bir Likert maddesi ordinal iken, birden fazla maddenin toplamının veya ortalamasının aralık düzeyinde kabul edilebileceğini ve parametrik testlere uygun olduğunu belirtir. Ancak bu kabul araştırmacının gerekçelendirmesi gereken bir karardır.

Parametrik Testler: Genel Bakış

Parametrik testler, verilerin belirli varsayımları karşıladığı durumlarda kullanılır. Bu testler genellikle daha güçlüdür (istatistiksel güç yüksektir) ancak varsayımların karşılanmaması sonuçları geçersiz kılabilir.

Parametrik Testlerin Varsayımları

Normallik: Bağımlı değişken normal dağılım göstermelidir (Shapiro-Wilk testi, histogram, Q-Q plot ile kontrol edilir)
Varyans homojenliği: Gruplar arası varyanslar eşit olmalıdır (Levene testi ile kontrol edilir)
Bağımsızlık: Gözlemler birbirinden bağımsız olmalıdır (araştırma tasarımı ile sağlanır)
Aralık veya oran düzeyinde ölçüm: Bağımlı değişken en az aralık düzeyinde ölçülmelidir

Temel Parametrik Testler

Test	Amaç	Grup/Değişken Sayısı	Örnek
Bağımsız örneklem t-testi	İki bağımsız grubun ortalamalarını karşılaştırma	2 bağımsız grup, 1 bağımlı değişken	Erkek ve kadın öğrencilerin matematik puanı
Eşleştirilmiş örneklem t-testi	Aynı grubun iki farklı zamandaki ortalamalarını karşılaştırma	1 grup, 2 ölçüm (ön-test/son-test)	Eğitim öncesi ve sonrası tutum puanları
Tek yönlü ANOVA	İkiden fazla bağımsız grubun ortalamalarını karşılaştırma	3+ bağımsız grup, 1 bağımlı değişken	Üç farklı öğretim yönteminin başarıya etkisi
Tekrarlı ölçümlerde ANOVA	Aynı grubun ikiden fazla zamandaki ortalamalarını karşılaştırma	1 grup, 3+ ölçüm	Tedavinin 1., 3. ve 6. aydaki etkisi
İki yönlü ANOVA	İki bağımsız değişkenin ve etkileşimlerinin bağımlı değişken üzerindeki etkisi	2 bağımsız değişken, 1 bağımlı değişken	Cinsiyet ve öğretim yöntemi etkileşimi
Pearson korelasyonu	İki sürekli değişken arasındaki doğrusal ilişkiyi ölçme	2 sürekli değişken	Çalışma süresi ile sınav puanı ilişkisi
Basit doğrusal regresyon	Bir bağımsız değişkenin bağımlı değişkeni yordama gücü	1 yordayıcı, 1 bağımlı	Öz-yeterliğin başarıyı yordaması
Çoklu regresyon	Birden fazla bağımsız değişkenin bağımlı değişkeni yordama gücü	2+ yordayıcı, 1 bağımlı	Motivasyon, tutum ve kaygının başarıyı yordaması

Non-Parametrik Testler: Parametrik Alternatifleri

Non-parametrik testler, parametrik test varsayımları karşılanmadığında veya veriler ordinal/nominal düzeyde olduğunda kullanılır. Kothari (2004), non-parametrik testlerin "dağılımdan bağımsız" (distribution-free) testler olarak adlandırıldığını ve normallik varsayımı gerektirmediğini belirtir.

Parametrik Test	Non-Parametrik Alternatifi	Ne Zaman Kullanılır
Bağımsız örneklem t-testi	Mann-Whitney U testi	İki bağımsız grup, ordinal veri veya normallik sağlanmıyor
Eşleştirilmiş örneklem t-testi	Wilcoxon işaretli sıralar testi	Aynı grubun iki ölçümü, ordinal veri veya normallik sağlanmıyor
Tek yönlü ANOVA	Kruskal-Wallis H testi	3+ bağımsız grup, ordinal veri veya normallik sağlanmıyor
Tekrarlı ölçümlerde ANOVA	Friedman testi	Aynı grubun 3+ ölçümü, ordinal veri veya normallik sağlanmıyor
Pearson korelasyonu	Spearman sıra korelasyonu	İki ordinal değişken veya normallik sağlanmıyor
-	Ki-kare bağımsızlık testi	İki kategorik (nominal) değişken arasındaki ilişki
-	Fisher kesin testi	Ki-kare varsayımları karşılanmıyor (beklenen frekans < 5)

Kapsamlı Karar Tablosu

Cohen, Manion ve Morrison (2007), araştırma sorusu türüne göre sistematik bir test seçim yaklaşımı önermektedir. Aşağıdaki tablo, araştırma sorunuzun türüne göre uygun istatistiksel testi belirlemenize yardımcı olacaktır:

Araştırma Sorusu Türü	Bağımsız Değişken	Bağımlı Değişken	Önerilen Test
İki grup arasında fark var mı? (bağımsız)	Kategorik (2 düzey)	Sürekli (normal)	Bağımsız t-testi
İki grup arasında fark var mı? (bağımsız)	Kategorik (2 düzey)	Ordinal veya normal değil	Mann-Whitney U
Ön-test ve son-test arasında fark var mı?	Zaman (2 düzey, ilişkili)	Sürekli (normal)	Eşleştirilmiş t-testi
Ön-test ve son-test arasında fark var mı?	Zaman (2 düzey, ilişkili)	Ordinal veya normal değil	Wilcoxon
Üç veya daha fazla grup arasında fark var mı?	Kategorik (3+ düzey)	Sürekli (normal)	Tek yönlü ANOVA
Üç veya daha fazla grup arasında fark var mı?	Kategorik (3+ düzey)	Ordinal veya normal değil	Kruskal-Wallis
İki değişken arasında ilişki var mı?	Sürekli	Sürekli	Pearson r
İki değişken arasında ilişki var mı?	Ordinal	Ordinal	Spearman rho
İki kategorik değişken arasında ilişki var mı?	Kategorik	Kategorik	Ki-kare
Bir değişken diğerini yordayabiliyor mu?	Sürekli (1 yordayıcı)	Sürekli	Basit regresyon
Birden fazla değişken bağımlı değişkeni yordayabiliyor mu?	Sürekli (2+ yordayıcı)	Sürekli	Çoklu regresyon
İki bağımsız değişkenin etkileşim etkisi var mı?	Kategorik (2 bağımsız değişken)	Sürekli	İki yönlü ANOVA

Varsayımları Kontrol Etme

Jackson (2015), parametrik test varsayımlarının kontrol edilmesinin araştırma sürecinin zorunlu bir adımı olduğunu vurgular. Varsayımlar karşılanmıyorsa ya non-parametrik alternatif kullanılmalı ya da veri dönüştürme yoluna gidilmelidir.

Normallik Kontrolü

Shapiro-Wilk testi: Küçük örneklemlerde (n < 50) tercih edilir; p > .05 ise normallik varsayımı karşılanır
Kolmogorov-Smirnov testi: Büyük örneklemlerde kullanılır; ancak çok hassastır, büyük örneklemlerde neredeyse her zaman anlamlı çıkar
Çarpıklık ve basıklık: -1 ile +1 arasında ise kabul edilebilir (bazı kaynaklarda -2 ile +2)
Histogram ve Q-Q plot: Görsel inceleme, istatistiksel testlere ek olarak değerlendirilmelidir

Varyans Homojenliği Kontrolü

Levene testi: p > .05 ise varyanslar homojendir; en yaygın kullanılan testtir
Eşit olmayan varyanslar durumunda: Welch t-testi veya Welch ANOVA kullanılabilir

Etki Büyüklüğü Ölçüleri

İstatistiksel anlamlılık (p değeri) tek başına yeterli değildir; etki büyüklüğü (effect size) de raporlanmalıdır. Jackson (2015), etki büyüklüğünün "pratik anlamlılığı" ifade ettiğini ve p değerinin örneklem büyüklüğüne bağlı olarak yanıltıcı olabileceğini belirtir.

Test	Etki Büyüklüğü Ölçüsü	Küçük	Orta	Büyük
t-testi	Cohen's d	0.20	0.50	0.80
ANOVA	Eta-kare (η²)	0.01	0.06	0.14
Korelasyon	r (korelasyon katsayısı)	0.10	0.30	0.50
Regresyon	R² (belirlilik katsayısı)	0.02	0.13	0.26
Ki-kare	Cramér's V	0.10	0.30	0.50
Mann-Whitney U	r = Z / √N	0.10	0.30	0.50

Yazılım Önerileri

Kothari (2004) ve Cohen, Manion ve Morrison (2007), istatistiksel analiz için çeşitli yazılımların kullanılabileceğini belirtir:

SPSS (IBM): Sosyal bilimler araştırmalarında en yaygın kullanılan yazılım; kullanıcı dostu arayüz, menü tabanlı analiz
R (açık kaynak): Ücretsiz, güçlü ve esnek; paket ekosistemi zengin, ancak öğrenme eğrisi yüksek
JASP (açık kaynak): Bayesci ve frekansçı analiz desteği; SPSS benzeri arayüz, ücretsiz
Jamovi (açık kaynak): R tabanlı, kullanıcı dostu arayüz; temel analizler için ideal
G*Power: İstatistiksel güç analizi ve örneklem büyüklüğü hesaplama için uzmanlaşmış yazılım
Excel: Temel betimsel istatistikler ve basit testler için kullanılabilir; ancak ileri analizler için yetersizdir

Sık Yapılan Hatalar

Varsayım kontrolü yapmamak: Normallik ve varyans homojenliği kontrol edilmeden parametrik test uygulamak
Çoklu karşılaştırma düzeltmesi yapmamak: ANOVA sonrası çoklu karşılaştırmalarda Bonferroni veya Tukey düzeltmesi uygulanmalıdır
Yalnızca p değeri raporlamak: Etki büyüklüğü ve güven aralıkları da mutlaka raporlanmalıdır
Ordinal verilere parametrik test uygulamak: Tek bir Likert maddesi ordinaldir; parametrik test için gerekçe sunulmalıdır
Küçük örneklemle çok değişkenli analiz yapmak: Regresyon için kural olarak her yordayıcı başına en az 10-15 katılımcı önerilir
Korelasyonu nedensellik olarak yorumlamak: Korelasyon, nedensel ilişki anlamına gelmez; bu en yaygın istatistiksel yorum hatasıdır
Anlamlı çıkmayan sonuçları "başarısızlık" olarak görmek: p > .05 sonuçları da önemli bulgulardır ve raporlanmalıdır

Jackson'ın (2015) Altın Kuralı: İstatistiksel test seçimi, veri toplandıktan sonra değil, araştırma tasarımı aşamasında yapılmalıdır. Araştırma sorunuzu formüle ederken hangi testi kullanacağınızı bilmeniz, veri toplama sürecinizi de doğru biçimde yönlendirecektir.

Sonuç

Doğru istatistiksel testi seçmek, araştırma bulgularının geçerliği ve güvenirliği açısından kritik öneme sahiptir. Karar ağacı yaklaşımı, araştırma sorusunun türü, ölçme düzeyi, grup sayısı ve örneklem ilişkisi gibi temel soruları sistematik biçimde yanıtlayarak doğru teste ulaşmanızı sağlar. Varsayımları kontrol etmek, etki büyüklüğü raporlamak ve bulguları doğru yorumlamak, istatistiksel analizin kalitesini belirleyen temel unsurlardır. Jackson'ın (2015), Kothari'nin (2004) ve Cohen, Manion ve Morrison'un (2007) vurguladığı gibi, istatistiksel yetkinlik yalnızca teknik bir beceri değil, araştırma sürecinin bütünlüğünü koruyan bir sorumluluktur.

Hangi İstatistiksel Testi Seçmeliyim? Karar Ağacı ve Rehber