Araştırma Yöntemleri

Korelasyon Katsayıları Karşılaştırması: Pearson, Spearman, Kendall ve Diğerleri

PNPeda Network·13 Şubat 2026·0 görüntülenme·
Korelasyon Katsayıları Karşılaştırması: Pearson, Spearman, Kendall ve Diğerleri

Korelasyon analizi, iki değişken arasındaki ilişkinin yönünü ve gücünü ölçen temel istatistiksel tekniklerden biridir. Ancak farklı veri türleri ve dağılım özellikleri için farklı korelasyon katsayıları geliştirilmiştir. Araştırmacıların doğru korelasyon katsayısını seçmesi, analiz sonuçlarının geçerliliği açısından kritik öneme sahiptir. Jackson'a (2015) göre korelasyon katsayısı seçimi, değişkenlerin ölçek düzeyine, dağılım özelliklerine ve ilişkinin doğasına bağlıdır. Cohen, Manion ve Morrison (2007), eğitim araştırmalarında farklı korelasyon katsayılarının uygun kullanımının sıklıkla ihmal edildiğini ve bu durumun hatalı sonuçlara yol açabildiğini vurgular. Kothari (2004), her korelasyon katsayısının belirli varsayımlara dayandığını ve bu varsayımların ihlalinin katsayının yorumunu geçersiz kılabileceğini belirtir. Bu yazıda, en yaygın korelasyon katsayılarını karşılaştırmalı olarak inceleyecek, her birinin kullanım koşullarını ve seçim kriterlerini detaylı biçimde ele alacağız.

Pearson Çarpım-Moment Korelasyonu (r)

Pearson korelasyon katsayısı (r), en yaygın kullanılan korelasyon ölçüsüdür. İki sürekli (aralık veya oran ölçeğinde) değişken arasındaki doğrusal ilişkinin gücünü ve yönünü ölçer. Jackson'a (2015) göre Pearson r, parametrik korelasyon katsayılarının temel taşıdır.

Varsayımlar

  • Ölçek düzeyi: Her iki değişken en az aralık ölçeğinde olmalıdır
  • Doğrusallık: Değişkenler arasındaki ilişki doğrusal olmalıdır
  • Normallik: Her iki değişken yaklaşık normal dağılmalıdır (anlamlılık testi için)
  • Eş varyanslılık: Bir değişkenin değerlerine göre diğerinin varyansı sabit olmalıdır
  • Aykırı değerler: Aykırı değerlerden güçlü biçimde etkilenir

Güçlü Yönleri

Pearson r, istatistiksel gücü en yüksek olan korelasyon katsayısıdır çünkü verilerin aralık/oran ölçeğindeki tam bilgisini kullanır. Parametrik testlerin varsayımları karşılandığında, diğer korelasyon katsayılarına kıyasla daha hassas tahminler verir. Ayrıca r² değeri (belirleme katsayısı) doğrudan açıklanan varyans oranını verir.

Sınırlılıkları

Pearson r yalnızca doğrusal ilişkileri yakalar; eğrisel (curvilinear) ilişkilerde düşük veya sıfır değer verebilir. Aykırı değerlerden ciddi biçimde etkilenir. Normal dağılım varsayımının ciddi ihlallerinde güvenilirliği azalır.

Spearman Sıra Korelasyonu (ρ veya rs)

Spearman sıra korelasyon katsayısı, Pearson korelasyonunun parametrik olmayan karşılığıdır. Verilerin sıra değerlerine (rank) dönüştürülmesiyle hesaplanır. Kothari (2004), Spearman korelasyonunun sıralama ölçeğindeki veriler için tasarlandığını belirtir.

Varsayımlar

  • Ölçek düzeyi: En az sıralama (ordinal) ölçeğinde veriler gerektirir
  • Monotonik ilişki: Doğrusal olmak zorunda değildir, monoton ilişki yeterlidir (bir değişken arttıkça diğeri tutarlı biçimde artar veya azalır)
  • Normallik gerekmez: Dağılım varsayımı yoktur

Ne Zaman Kullanılmalı?

Jackson'a (2015) göre Spearman korelasyonu şu durumlarda tercih edilmelidir:

  1. Veriler sıralama ölçeğindeyse (örn., öğrenci sıralamaları, tutum ölçeği maddeleri)
  2. Sürekli veriler normal dağılmıyorsa veya güçlü çarpıklık varsa
  3. İlişki monotonik ancak doğrusal değilse
  4. Aykırı değerlerin etkisini azaltmak isteniyorsa

Pearson ile Karşılaştırma

Veriler gerçekten sürekli ve normal dağılımlı ise, Spearman korelasyonu Pearson'a kıyasla biraz daha düşük istatistiksel güce sahiptir çünkü sıra dönüşümü sırasında bilgi kaybı yaşanır. Ancak varsayım ihlallerinde Spearman daha sağlam (robust) sonuçlar verir.

Kendall Tau-b Korelasyonu (τb)

Kendall tau-b, sıralama verileri için geliştirilmiş bir başka parametrik olmayan korelasyon katsayısıdır. Spearman'dan farklı olarak, uyumlu (concordant) ve uyumsuz (discordant) çiftlerin sayısına dayanır. Cohen, Manion ve Morrison (2007), Kendall tau-b'nin özellikle küçük örneklemlerde ve bağlı sıralamaların (tied ranks) fazla olduğu durumlarda Spearman'a tercih edilmesi gerektiğini belirtir.

Varsayımlar

  • Ölçek düzeyi: En az sıralama ölçeği
  • Monotonik ilişki: Doğrusallık gerekmez
  • Bağlı sıralamalara uyum: Tau-b bağlı sıralamalar için düzeltme içerir

Spearman ile Karşılaştırma

ÖzellikSpearman ρKendall τb
Hesaplama temeliSıra farklarıUyumlu/uyumsuz çiftler
Küçük örneklemDaha az güvenilirDaha güvenilir
Bağlı sıralamalarDüzeltme gerektirirOtomatik düzeltme içerir
Değer büyüklüğüGenellikle daha yüksekGenellikle daha düşük
Güven aralığıDaha genişDaha dar ve güvenilir
Örneklem büyüklüğü hassasiyetiBüyük örneklemlerde daha iyiHer büyüklükte tutarlı

Jackson (2015), Kendall tau değerlerinin genellikle Spearman değerlerinden düşük olduğunu ve bu nedenle iki katsayının doğrudan karşılaştırılmaması gerektiğini belirtir. Aynı veri setinde Spearman ρ = .70 iken Kendall τb = .55 gibi değerler normal kabul edilir.

Point-Biserial Korelasyon (rpb)

Point-biserial korelasyon, bir doğal ikilik (dichotomous) değişken ile bir sürekli değişken arasındaki ilişkiyi ölçer. Matematiksel olarak Pearson r'nin özel bir halidir. Kothari (2004), point-biserial korelasyonun deney-kontrol grubu karşılaştırmalarında sıklıkla kullanıldığını belirtir.

Kullanım Koşulları

  • Bir değişken gerçek ikilik olmalıdır (örn., cinsiyet: kadın/erkek, tedavi: var/yok)
  • Diğer değişken sürekli ve yaklaşık normal dağılımlı olmalıdır
  • İkilik değişken 0 ve 1 olarak kodlanır

t-Testi ile İlişki

Point-biserial korelasyon ile bağımsız örneklem t-testi arasında doğrudan bir matematiksel ilişki vardır. Her iki test de aynı bilgiyi farklı formatlarda sunar. t değerinden point-biserial r hesaplanabilir: rpb = √(t² / (t² + sd)). Jackson'a (2015) göre bu dönüşüm, t-testi sonuçlarının etki büyüklüğü olarak raporlanmasında kullanılır.

Phi Katsayısı (φ)

Phi katsayısı, iki doğal ikilik değişken arasındaki ilişkiyi ölçer. Matematiksel olarak 2×2 çapraz tablolara uygulanan Pearson r'nin özel bir halidir. Cohen, Manion ve Morrison (2007), phi katsayısının eğitim araştırmalarında başarı/başarısızlık ve katılım/katılmama gibi ikilik sonuçlar arasındaki ilişkinin ölçülmesinde kullanıldığını belirtir.

Kullanım Koşulları ve Formül

Her iki değişken de doğal ikilik olmalıdır. Phi katsayısı, ki-kare değerinden de hesaplanabilir: φ = √(χ² / N). Değer aralığı -1 ile +1 arasındadır, ancak pratikte marginal dağılımların eşit olmadığı durumlarda tam +1 veya -1 değerine ulaşamayabilir.

Tetrakhorik Korelasyon

Tetrakhorik korelasyon, phi katsayısından farklı olarak iki yapay ikilik (artificially dichotomized) değişken arasındaki ilişkiyi tahmin eder. Yapay ikilik değişkenler, aslında sürekli olan ancak bir kesme noktasından ikiye ayrılmış değişkenlerdir (örn., sınav puanının geçti/kaldı olarak kodlanması). Jackson (2015), tetrakhorik korelasyonun altta yatan sürekli değişkenler arasındaki Pearson r'yi tahmin ettiğini belirtir.

Biserial Korelasyon

Biserial korelasyon, bir yapay ikilik değişken ile bir sürekli değişken arasındaki ilişkiyi tahmin eder. Point-biserial korelasyondan farkı, ikilik değişkenin doğal değil yapay olmasıdır. Biserial korelasyon, altta yatan sürekli değişken varsayımıyla Pearson r'yi tahmin eder ve bu nedenle point-biserial korelasyondan daha yüksek değerler üretir.

Eta Katsayısı (η)

Eta katsayısı, bir değişkenin diğerini doğrusal olmayan (curvilinear) biçimde ne ölçüde yordadığını gösteren bir ilişki ölçüsüdür. Pearson r yalnızca doğrusal ilişkileri ölçerken, eta hem doğrusal hem eğrisel ilişkileri yakalar. Kothari (2004), eta katsayısının ANOVA'daki eta-kare (η²) ile doğrudan ilişkili olduğunu belirtir.

Özellikleri

  • Değer aralığı 0 ile 1 arasındadır (yön bilgisi vermez)
  • η ≥ |r| her zaman geçerlidir; eğer η > |r| ise ilişki doğrusal değildir
  • η = |r| ise ilişki tamamen doğrusaldır
  • Bağımsız değişken kategorik, bağımlı değişken sürekli olduğunda kullanılır

Kapsamlı Karşılaştırma Tablosu

KatsayıDeğişken 1Değişken 2İlişki TürüVarsayımlarDeğer Aralığı
Pearson rSürekliSürekliDoğrusalNormallik, doğrusallık, eş varyanslılık-1 ile +1
Spearman ρSıralama+Sıralama+MonotonikMonotonik ilişki-1 ile +1
Kendall τbSıralama+Sıralama+MonotonikMonotonik ilişki-1 ile +1
Point-biserial rpbDoğal ikilikSürekliDoğrusalNormallik (sürekli değişken)-1 ile +1
Phi φDoğal ikilikDoğal ikilikİlişkiBeklenen frekans > 5-1 ile +1
TetrakhorikYapay ikilikYapay ikilikTahminselAltta yatan normallik-1 ile +1
BiserialYapay ikilikSürekliTahminselAltta yatan normallik-1 ile +1
Eta ηKategorikSürekliEğrisel dahilYok0 ile 1

Karar Akış Şeması: Doğru Katsayıyı Seçme

Doğru korelasyon katsayısını seçmek için şu adımlar izlenmelidir:

  1. Değişkenlerin ölçek düzeyini belirleyin: Sürekli (aralık/oran), sıralama (ordinal) veya ikilik (nominal/dichotomous)?
  2. İkilik değişkenlerin doğasını belirleyin: Doğal ikilik mi (cinsiyet) yoksa yapay ikilik mi (geçti/kaldı)?
  3. İlişkinin doğasını değerlendirin: Doğrusal mı, monotonik mi, eğrisel mi?
  4. Varsayımları kontrol edin: Normallik, doğrusallık, eş varyanslılık sağlanıyor mu?
  5. Örneklem büyüklüğünü değerlendirin: Küçük örneklemlerde Kendall tau-b tercih edilebilir

Cohen, Manion ve Morrison'a (2007) göre bu karar sürecinde en sık yapılan hata, tüm durumlarda varsayılan olarak Pearson r kullanmaktır. Sıralama verileri için Pearson r hesaplamak, sonuçları ciddi biçimde yanıltabilir.

Spearman ve Kendall Uyumsuzluğu

Aynı veri setinde Spearman ve Kendall katsayıları farklı sonuçlar verebilir. Jackson (2015), bu durumun normal olduğunu ve iki katsayının farklı mantıklarla hesaplandığını belirtir. Spearman değerleri genellikle Kendall değerlerinden yüksektir. Yaklaşık dönüşüm formülü: ρ ≈ 1.5τ - 0.5τ³ (küçük τ değerleri için ρ ≈ 1.5τ).

İki katsayı arasında anlamlılık açısından tutarsızlık varsa (biri anlamlı, diğeri değil), örneklem büyüklüğü, bağlı sıralama sayısı ve veri dağılımı gözden geçirilmelidir. Kothari (2004), bu tür durumlarda her iki sonucun raporlanmasını ve tutarsızlığın tartışılmasını önerir.

SPSS ile Korelasyon Katsayılarının Hesaplanması

Pearson ve Spearman

Analyze → Correlate → Bivariate menüsünde Pearson ve/veya Spearman seçenekleri işaretlenir. Kendall tau-b da bu menüden seçilebilir. Her üç katsayı aynı anda hesaplanarak karşılaştırılabilir.

Point-Biserial

SPSS'te point-biserial korelasyon için ayrı bir menü yoktur. İkilik değişken 0-1 olarak kodlandıktan sonra Pearson korelasyonu hesaplanır; sonuç otomatik olarak point-biserial korelasyona eşittir.

Phi Katsayısı

Analyze → Descriptive Statistics → Crosstabs menüsünde Statistics butonundan "Phi and Cramer's V" seçeneği işaretlenir. Alternatif olarak, 2×2 tablo için Pearson korelasyonu da phi katsayısını verir.

Eta Katsayısı

Analyze → Compare Means → Means menüsünde Options butonundan "Eta" ve "Eta squared" işaretlenir. Bu, bağımsız değişkenin kategorik, bağımlı değişkenin sürekli olduğu durumlarda kullanılır.

Raporlama Formatı

APA formatında korelasyon katsayılarının raporlanması şu şekilde olmalıdır:

  • Pearson: r(148) = .65, p < .001
  • Spearman: rs(148) = .62, p < .001
  • Kendall: τb = .48, p < .001
  • Point-biserial: rpb(148) = .35, p = .002
  • Phi: φ = .28, p = .015

Cohen, Manion ve Morrison (2007), raporlama sırasında neden ilgili katsayının seçildiğinin gerekçelendirilmesi gerektiğini vurgular. "Veriler sıralama ölçeğinde olduğu için Spearman sıra korelasyon katsayısı kullanılmıştır" gibi açık bir ifade, okuyucuya metodolojik tercihin bilinçli olduğunu gösterir.

Sonuç

Korelasyon katsayısı seçimi, araştırmanın metodolojik titizliğinin önemli bir göstergesidir. Jackson'ın (2015) vurguladığı gibi, değişkenlerin ölçek düzeyi, dağılım özellikleri ve ilişkinin doğası, uygun katsayının belirlenmesinde temel kriterlerdir. Pearson r en güçlü katsayı olmakla birlikte, varsayımlarının karşılanmaması durumunda Spearman veya Kendall gibi parametrik olmayan alternatifler tercih edilmelidir. İkilik değişkenler söz konusu olduğunda point-biserial, phi veya biserial korelasyonlar kullanılmalıdır. Cohen, Manion ve Morrison'un (2007) belirttiği gibi, eğitim araştırmalarında farklı ölçek düzeylerindeki verilerle çalışmak sık karşılaşılan bir durumdur ve araştırmacıların tüm korelasyon katsayılarını tanıması, doğru olanı seçmesi ve bu seçimi gerekçelendirmesi bilimsel raporlamanın temel gerekliliklerinden biridir. Kothari'nin (2004) ifade ettiği gibi, yanlış korelasyon katsayısı kullanımı, istatistiksel sonuçların geçerliliğini ciddi biçimde zayıflatabilir.

Kaynaklar

Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach (5th ed.). Cengage Learning.Kothari, C. R. (2004). Research methodology: Methods and techniques (2nd ed.). New Age International.Bhome, S. M., Jha, J. K., et al. (2013). Research methodology. Himalaya Publishing House.Creswell, J. W. (2009). Research design: Qualitative, quantitative, and mixed methods approaches (3rd ed.). SAGE.

Yorumlar (0)

Yorum yapmak için giriş yapmalısınız.