Araştırma Yöntemleri

Parametrik vs Non-parametrik Testler: Kapsamlı Karşılaştırma

PNPeda Network·14 Şubat 2026·0 görüntülenme·
Parametrik vs Non-parametrik Testler: Kapsamlı Karşılaştırma

İstatistiksel analiz sürecinde en sık karşılaşılan kararlardan biri, parametrik mi yoksa non-parametrik test mi kullanılması gerektiğidir. Bu karar, verilerin doğasına, dağılım özelliklerine ve ölçek düzeyine bağlıdır. Yanlış test seçimi, Tip I veya Tip II hata olasılığını artırarak araştırma sonuçlarının güvenilirliğini ciddi biçimde tehdit eder. Bu yazıda, her iki test grubunu varsayımlar, güç, uygulama koşulları ve pratik örnekler üzerinden kapsamlı biçimde karşılaştıracağız.

Temel Tanımlar

Parametrik Testler

Verilerin belirli bir olasılık dağılımından (genellikle normal dağılım) geldiğini varsayan istatistiksel testlerdir. Popülasyon parametrelerini (ortalama, varyans) tahmin etmeye ve test etmeye yöneliktir. Verilerden en fazla bilgiyi çıkarmak için güçlü istatistiksel teknikler kullanır.

Non-parametrik Testler

Verilerin belirli bir dağılıma uymasını varsaymayan (distribution-free) istatistiksel testlerdir. Sıralama verileri, nominal veriler veya parametrik varsayımları karşılamayan sürekli veriler için uygundur. Daha az varsayım gerektirir ancak karşılığında daha düşük istatistiksel güce sahiptir.

Varsayımlar Karşılaştırması

VarsayımParametrik TestlerNon-parametrik Testler
DağılımNormal dağılım varsayılırDağılım varsayımı yoktur
Ölçek düzeyiAralık (interval) veya oran (ratio) ölçeğiSıralama (ordinal) veya nominal ölçek yeterlidir
Varyans homojenliğiGruplar arası varyanslar eşit olmalıdırGenellikle gerekli değildir
Örneklem büyüklüğüYeterli büyüklükte (genellikle N ≥ 30)Küçük örneklemlerde de uygulanabilir
BağımsızlıkGözlemler birbirinden bağımsızGözlemler birbirinden bağımsız
Uç değerlerUç değerlerden etkilenirSıra tabanlı olduğu için uç değerlere dayanıklıdır

Önemli Not: Parametrik testlerin varsayımları aslında test istatistiğinin dağılımıyla ilgilidir. Merkezi limit teoremine göre, yeterince büyük örneklemlerde (N ≥ 30-50) örneklem ortalamasının dağılımı normalliğe yaklaşır. Bu nedenle büyük örneklemlerde normallik varsayımının ihlali daha az sorunludur.

Parametrik ve Non-parametrik Test Eşleştirmeleri

Her parametrik testin genellikle bir veya birden fazla non-parametrik karşılığı vardır:

AmaçParametrik TestNon-parametrik Karşılığı
İki bağımsız grubun karşılaştırılmasıBağımsız örneklem t-testiMann-Whitney U testi
İki bağımlı grubun karşılaştırılmasıBağımlı örneklem t-testiWilcoxon işaretli sıralar testi
Üç+ bağımsız grubun karşılaştırılmasıTek yönlü ANOVAKruskal-Wallis H testi
Üç+ bağımlı grubun karşılaştırılmasıTekrarlı ölçümler ANOVAFriedman testi
İki değişken arası ilişkiPearson korelasyonuSpearman sıra korelasyonu
Kategori bağımsızlığı-Ki-kare (χ²) testi
İki oran karşılaştırmasıZ testi (oranlar)Fisher kesin testi

İstatistiksel Güç Karşılaştırması

İstatistiksel güç, gerçekte var olan bir etkiyi tespit edebilme olasılığıdır (1 - β). Parametrik ve non-parametrik testler güç açısından önemli farklılıklar gösterir:

BoyutParametrik TestlerNon-parametrik Testler
Güç düzeyiYüksek (varsayımlar karşılandığında)Düşük-orta (%90-95 oranında parametriğin gücüne sahip)
Bilgi kullanımıVerideki tüm sayısal bilgiyi kullanırVerileri sıralara dönüştürür, bir miktar bilgi kaybı olur
Küçük örneklemGüç düşer, varsayımlar test edilemezDüşük güç ama varsayım ihlali riski az
Büyük örneklemEn yüksek güçGüç artar, parametriğe yaklaşır
Varsayım ihlali durumundaGüç dramatik biçimde düşerStabil kalır

Güç Kaybının Pratik Anlamı

Non-parametrik testlerin güç kaybı pratikte ne anlama gelir? Örneğin, bağımsız örneklem t-testi ile anlamlı çıkacak bir fark için 64 kişilik örneklem yeterliyken, Mann-Whitney U testi için aynı gücü elde etmek için yaklaşık 67-68 kişi gerekebilir. Bu fark, çoğu araştırmada ihmal edilebilir düzeydedir. Ancak çok küçük etki büyüklüklerinde ve sınırlı örneklemlerde bu güç farkı önemli hale gelebilir.

Normallik Testi: Karar Süreci

Parametrik veya non-parametrik test tercihinde ilk adım, verilerin normallik varsayımını karşılayıp karşılamadığını değerlendirmektir:

Normallik Değerlendirme Yöntemleri

  1. Görsel inceleme: Histogram, Q-Q grafiği, kutu grafiği (box plot)
  2. Çarpıklık ve basıklık katsayıları: |Çarpıklık| < 1.0 ve |Basıklık| < 3.0 ise kabul edilebilir (bazı kaynaklar ±2 sınırını kullanır)
  3. Shapiro-Wilk testi: Küçük örneklemler için en güçlü normallik testi (N < 50)
  4. Kolmogorov-Smirnov testi: Büyük örneklemler için (N ≥ 50), ancak Shapiro-Wilk genellikle tercih edilir

Normallik Karar Akışı

DurumKararGerekçe
Normal dağılım + büyük örneklemParametrik testTüm varsayımlar karşılanıyor, en yüksek güç
Normal dağılım + küçük örneklemParametrik test (dikkatli)Varsayımlar karşılanıyor, ancak güç analizi yapılmalı
Normal olmayan dağılım + büyük örneklem (N > 30)Parametrik test kabul edilebilirMerkezi limit teoremi sayesinde ortalama dağılımı normalleşir
Normal olmayan dağılım + küçük örneklemNon-parametrik testVarsayım ihlali, merkezi limit teoremi yetersiz
Sıralama (ordinal) verisiNon-parametrik testÖlçek düzeyi parametrik test için yetersiz
Aşırı uç değerler mevcutNon-parametrik testUç değerler parametrik test sonuçlarını bozar

Yaygın Testlerin Detaylı Karşılaştırması

t-testi vs Mann-Whitney U Testi

Boyutt-testiMann-Whitney U
Ne karşılaştırır?İki grubun ortalamalarınıİki grubun sıra ortalamalarını (medyanlarını)
VarsayımlarNormallik, varyans homojenliği, aralık ölçeğiSıralama ölçeği yeterli, dağılım varsayımı yok
Uç değerlere duyarlılıkYüksekDüşük
Raporlamat(sd) = değer, p = değer, d = etki büyüklüğüU = değer, z = değer, p = değer, r = etki büyüklüğü
SPSS menüsüAnalyze > Compare Means > Independent Samples T TestAnalyze > Nonparametric Tests > 2 Independent Samples

ANOVA vs Kruskal-Wallis Testi

BoyutTek Yönlü ANOVAKruskal-Wallis H
Ne karşılaştırır?Üç veya daha fazla grubun ortalamalarınıÜç veya daha fazla grubun sıra ortalamalarını
VarsayımlarNormallik, varyans homojenliği, aralık ölçeğiSıralama ölçeği yeterli
Post-hoc testlerTukey, Scheffe, BonferroniDunn testi, Mann-Whitney U (Bonferroni düzeltmeli)
Etki büyüklüğüη² (eta-kare)η² = H / (N-1)

Pearson vs Spearman Korelasyonu

BoyutPearson (r)Spearman (ρ)
İlişki türüDoğrusal (linear) ilişkiMonoton (sıralı) ilişki
ÖlçekAralık veya oranSıralama veya daha üstü
DağılımHer iki değişken normal dağılmalı (iki değişkenli normallik)Dağılım varsayımı yok
Uç değerlerÇok hassasDayanıklı
YorumlamaDoğrusal ilişkinin gücü ve yönüSıralı ilişkinin gücü ve yönü

Sık Yapılan Hatalar

  • Otomatik olarak non-parametrik tercih etmek: "Verilerim normal dağılmıyor" diyerek her zaman non-parametrik test kullanmak yanlıştır. Büyük örneklemlerde parametrik testler sağlam (robust) davranır
  • Normallik testine aşırı güvenmek: Shapiro-Wilk testi büyük örneklemlerde çok küçük sapmaları bile anlamlı bulur. Görsel inceleme ve çarpıklık/basıklık değerleri de göz önüne alınmalıdır
  • Likert ölçeği tartışmasını görmezden gelmek: Tek bir Likert maddesi sıralama düzeyindedir ancak toplam puan (yeterli madde sayısıyla) aralık ölçeği olarak değerlendirilebilir
  • Parametrik testin her zaman daha iyi olduğunu sanmak: Varsayımlar ciddi biçimde ihlal edildiğinde parametrik testler yanlış sonuçlar verebilir
  • Hem parametrik hem non-parametrik uygulayıp işine geleni raporlamak: Bu "p-hacking" olarak bilinen etik dışı bir uygulamadır
  • Etki büyüklüğü raporlamamak: Her iki test grubu için de etki büyüklüğü mutlaka raporlanmalıdır

Pratik Karar Rehberi

  1. Ölçek düzeyini belirleyin: Nominal veya ordinal ise non-parametrik; aralık veya oran ise bir sonraki adıma geçin
  2. Örneklem büyüklüğünü değerlendirin: N < 15-20 ise genellikle non-parametrik tercih edin
  3. Normalliği kontrol edin: Shapiro-Wilk, histogram, Q-Q grafiği ve çarpıklık/basıklık katsayılarını birlikte değerlendirin
  4. Varyans homojenliğini test edin: Levene testi ile kontrol edin
  5. Uç değerleri inceleyin: Kutu grafiğinde aşırı uç değerler varsa non-parametrik düşünün
  6. Karar verin ve gerekçeleyin: Test seçiminizi neden yaptığınızı makalenizde açıkça belirtin

Sonuç

Parametrik ve non-parametrik testler arasındaki seçim, basit bir "evet veya hayır" kararı değildir. Verilerinizin doğasını, örneklem büyüklüğünüzü, dağılım özelliklerini ve araştırma sorunuzu bütüncül biçimde değerlendirerek bilinçli bir karar vermelisiniz. Parametrik testler varsayımlar karşılandığında daha güçlüdür; ancak non-parametrik testler bu varsayımlar ihlal edildiğinde güvenilir bir alternatif sunar. İyi bir araştırmacı, her iki test grubunun mantığını, varsayımlarını ve sınırlılıklarını bilir ve test seçimini şeffaf biçimde gerekçelendirir.

Yorumlar (0)

Yorum yapmak için giriş yapmalısınız.