Pearson, Spearman ve Kendall Korelasyonu: Hangisini Kullanmalı?

Korelasyon analizi, iki değişken arasındaki ilişkinin yönünü ve gücünü ölçen temel istatistiksel tekniklerden biridir. Ancak farklı veri türleri ve dağılım özellikleri için farklı korelasyon katsayıları geliştirilmiştir. Araştırmacıların doğru korelasyon katsayısını seçmesi, analiz sonuçlarının geçerliliği açısından kritik öneme sahiptir. Jackson'a (2015) göre korelasyon katsayısı seçimi, değişkenlerin ölçek düzeyine, dağılım özelliklerine ve ilişkinin doğasına bağlıdır. Cohen, Manion ve Morrison (2007), eğitim araştırmalarında farklı korelasyon katsayılarının uygun kullanımının sıklıkla ihmal edildiğini ve bu durumun hatalı sonuçlara yol açabildiğini vurgular. Kothari (2004), her korelasyon katsayısının belirli varsayımlara dayandığını ve bu varsayımların ihlalinin katsayının yorumunu geçersiz kılabileceğini belirtir. Bu yazıda, en yaygın korelasyon katsayılarını karşılaştırmalı olarak inceleyecek, her birinin kullanım koşullarını ve seçim kriterlerini detaylı biçimde ele alacağız.

Pearson Çarpım-Moment Korelasyonu (r)

Pearson korelasyon katsayısı (r), en yaygın kullanılan korelasyon ölçüsüdür. İki sürekli (aralık veya oran ölçeğinde) değişken arasındaki doğrusal ilişkinin gücünü ve yönünü ölçer. Jackson'a (2015) göre Pearson r, parametrik korelasyon katsayılarının temel taşıdır.

Varsayımlar

Ölçek düzeyi: Her iki değişken en az aralık ölçeğinde olmalıdır
Doğrusallık: Değişkenler arasındaki ilişki doğrusal olmalıdır
Normallik: Her iki değişken yaklaşık normal dağılmalıdır (anlamlılık testi için)
Eş varyanslılık: Bir değişkenin değerlerine göre diğerinin varyansı sabit olmalıdır
Aykırı değerler: Aykırı değerlerden güçlü biçimde etkilenir

Güçlü Yönleri

Pearson r, istatistiksel gücü en yüksek olan korelasyon katsayısıdır çünkü verilerin aralık/oran ölçeğindeki tam bilgisini kullanır. Parametrik testlerin varsayımları karşılandığında, diğer korelasyon katsayılarına kıyasla daha hassas tahminler verir. Ayrıca r² değeri (belirleme katsayısı) doğrudan açıklanan varyans oranını verir.

Sınırlılıkları

Pearson r yalnızca doğrusal ilişkileri yakalar; eğrisel (curvilinear) ilişkilerde düşük veya sıfır değer verebilir. Aykırı değerlerden ciddi biçimde etkilenir. Normal dağılım varsayımının ciddi ihlallerinde güvenilirliği azalır.

Spearman Sıra Korelasyonu (ρ veya r_s)

Spearman sıra korelasyon katsayısı, Pearson korelasyonunun parametrik olmayan karşılığıdır. Verilerin sıra değerlerine (rank) dönüştürülmesiyle hesaplanır. Kothari (2004), Spearman korelasyonunun sıralama ölçeğindeki veriler için tasarlandığını belirtir.

Varsayımlar

Ölçek düzeyi: En az sıralama (ordinal) ölçeğinde veriler gerektirir
Monotonik ilişki: Doğrusal olmak zorunda değildir, monoton ilişki yeterlidir (bir değişken arttıkça diğeri tutarlı biçimde artar veya azalır)
Normallik gerekmez: Dağılım varsayımı yoktur

Ne Zaman Kullanılmalı?

Jackson'a (2015) göre Spearman korelasyonu şu durumlarda tercih edilmelidir:

Veriler sıralama ölçeğindeyse (örn., öğrenci sıralamaları, tutum ölçeği maddeleri)
Sürekli veriler normal dağılmıyorsa veya güçlü çarpıklık varsa
İlişki monotonik ancak doğrusal değilse
Aykırı değerlerin etkisini azaltmak isteniyorsa

Pearson ile Karşılaştırma

Veriler gerçekten sürekli ve normal dağılımlı ise, Spearman korelasyonu Pearson'a kıyasla biraz daha düşük istatistiksel güce sahiptir çünkü sıra dönüşümü sırasında bilgi kaybı yaşanır. Ancak varsayım ihlallerinde Spearman daha sağlam (robust) sonuçlar verir.

Kendall Tau-b Korelasyonu (τ_b)

Kendall tau-b, sıralama verileri için geliştirilmiş bir başka parametrik olmayan korelasyon katsayısıdır. Spearman'dan farklı olarak, uyumlu (concordant) ve uyumsuz (discordant) çiftlerin sayısına dayanır. Cohen, Manion ve Morrison (2007), Kendall tau-b'nin özellikle küçük örneklemlerde ve bağlı sıralamaların (tied ranks) fazla olduğu durumlarda Spearman'a tercih edilmesi gerektiğini belirtir.

Varsayımlar

Ölçek düzeyi: En az sıralama ölçeği
Monotonik ilişki: Doğrusallık gerekmez
Bağlı sıralamalara uyum: Tau-b bağlı sıralamalar için düzeltme içerir

Spearman ile Karşılaştırma

Özellik	Spearman ρ	Kendall τ_b
Hesaplama temeli	Sıra farkları	Uyumlu/uyumsuz çiftler
Küçük örneklem	Daha az güvenilir	Daha güvenilir
Bağlı sıralamalar	Düzeltme gerektirir	Otomatik düzeltme içerir
Değer büyüklüğü	Genellikle daha yüksek	Genellikle daha düşük
Güven aralığı	Daha geniş	Daha dar ve güvenilir
Örneklem büyüklüğü hassasiyeti	Büyük örneklemlerde daha iyi	Her büyüklükte tutarlı

Jackson (2015), Kendall tau değerlerinin genellikle Spearman değerlerinden düşük olduğunu ve bu nedenle iki katsayının doğrudan karşılaştırılmaması gerektiğini belirtir. Aynı veri setinde Spearman ρ = .70 iken Kendall τ_b = .55 gibi değerler normal kabul edilir.

Point-Biserial Korelasyon (r_pb)

Point-biserial korelasyon, bir doğal ikilik (dichotomous) değişken ile bir sürekli değişken arasındaki ilişkiyi ölçer. Matematiksel olarak Pearson r'nin özel bir halidir. Kothari (2004), point-biserial korelasyonun deney-kontrol grubu karşılaştırmalarında sıklıkla kullanıldığını belirtir.

Kullanım Koşulları

Bir değişken gerçek ikilik olmalıdır (örn., cinsiyet: kadın/erkek, tedavi: var/yok)
Diğer değişken sürekli ve yaklaşık normal dağılımlı olmalıdır
İkilik değişken 0 ve 1 olarak kodlanır

t-Testi ile İlişki

Point-biserial korelasyon ile bağımsız örneklem t-testi arasında doğrudan bir matematiksel ilişki vardır. Her iki test de aynı bilgiyi farklı formatlarda sunar. t değerinden point-biserial r hesaplanabilir: r_pb = √(t² / (t² + sd)). Jackson'a (2015) göre bu dönüşüm, t-testi sonuçlarının etki büyüklüğü olarak raporlanmasında kullanılır.

Phi Katsayısı (φ)

Phi katsayısı, iki doğal ikilik değişken arasındaki ilişkiyi ölçer. Matematiksel olarak 2×2 çapraz tablolara uygulanan Pearson r'nin özel bir halidir. Cohen, Manion ve Morrison (2007), phi katsayısının eğitim araştırmalarında başarı/başarısızlık ve katılım/katılmama gibi ikilik sonuçlar arasındaki ilişkinin ölçülmesinde kullanıldığını belirtir.

Kullanım Koşulları ve Formül

Her iki değişken de doğal ikilik olmalıdır. Phi katsayısı, ki-kare değerinden de hesaplanabilir: φ = √(χ² / N). Değer aralığı -1 ile +1 arasındadır, ancak pratikte marginal dağılımların eşit olmadığı durumlarda tam +1 veya -1 değerine ulaşamayabilir.

Tetrakhorik Korelasyon

Tetrakhorik korelasyon, phi katsayısından farklı olarak iki yapay ikilik (artificially dichotomized) değişken arasındaki ilişkiyi tahmin eder. Yapay ikilik değişkenler, aslında sürekli olan ancak bir kesme noktasından ikiye ayrılmış değişkenlerdir (örn., sınav puanının geçti/kaldı olarak kodlanması). Jackson (2015), tetrakhorik korelasyonun altta yatan sürekli değişkenler arasındaki Pearson r'yi tahmin ettiğini belirtir.

Biserial Korelasyon

Biserial korelasyon, bir yapay ikilik değişken ile bir sürekli değişken arasındaki ilişkiyi tahmin eder. Point-biserial korelasyondan farkı, ikilik değişkenin doğal değil yapay olmasıdır. Biserial korelasyon, altta yatan sürekli değişken varsayımıyla Pearson r'yi tahmin eder ve bu nedenle point-biserial korelasyondan daha yüksek değerler üretir.

Eta Katsayısı (η)

Eta katsayısı, bir değişkenin diğerini doğrusal olmayan (curvilinear) biçimde ne ölçüde yordadığını gösteren bir ilişki ölçüsüdür. Pearson r yalnızca doğrusal ilişkileri ölçerken, eta hem doğrusal hem eğrisel ilişkileri yakalar. Kothari (2004), eta katsayısının ANOVA'daki eta-kare (η²) ile doğrudan ilişkili olduğunu belirtir.

Özellikleri

Değer aralığı 0 ile 1 arasındadır (yön bilgisi vermez)
η ≥ |r| her zaman geçerlidir; eğer η > |r| ise ilişki doğrusal değildir
η = |r| ise ilişki tamamen doğrusaldır
Bağımsız değişken kategorik, bağımlı değişken sürekli olduğunda kullanılır

Kapsamlı Karşılaştırma Tablosu

Katsayı	Değişken 1	Değişken 2	İlişki Türü	Varsayımlar	Değer Aralığı
Pearson r	Sürekli	Sürekli	Doğrusal	Normallik, doğrusallık, eş varyanslılık	-1 ile +1
Spearman ρ	Sıralama+	Sıralama+	Monotonik	Monotonik ilişki	-1 ile +1
Kendall τ_b	Sıralama+	Sıralama+	Monotonik	Monotonik ilişki	-1 ile +1
Point-biserial r_pb	Doğal ikilik	Sürekli	Doğrusal	Normallik (sürekli değişken)	-1 ile +1
Phi φ	Doğal ikilik	Doğal ikilik	İlişki	Beklenen frekans > 5	-1 ile +1
Tetrakhorik	Yapay ikilik	Yapay ikilik	Tahminsel	Altta yatan normallik	-1 ile +1
Biserial	Yapay ikilik	Sürekli	Tahminsel	Altta yatan normallik	-1 ile +1
Eta η	Kategorik	Sürekli	Eğrisel dahil	Yok	0 ile 1

Karar Akış Şeması: Doğru Katsayıyı Seçme

Doğru korelasyon katsayısını seçmek için şu adımlar izlenmelidir:

Değişkenlerin ölçek düzeyini belirleyin: Sürekli (aralık/oran), sıralama (ordinal) veya ikilik (nominal/dichotomous)?
İkilik değişkenlerin doğasını belirleyin: Doğal ikilik mi (cinsiyet) yoksa yapay ikilik mi (geçti/kaldı)?
İlişkinin doğasını değerlendirin: Doğrusal mı, monotonik mi, eğrisel mi?
Varsayımları kontrol edin: Normallik, doğrusallık, eş varyanslılık sağlanıyor mu?
Örneklem büyüklüğünü değerlendirin: Küçük örneklemlerde Kendall tau-b tercih edilebilir

Cohen, Manion ve Morrison'a (2007) göre bu karar sürecinde en sık yapılan hata, tüm durumlarda varsayılan olarak Pearson r kullanmaktır. Sıralama verileri için Pearson r hesaplamak, sonuçları ciddi biçimde yanıltabilir.

Spearman ve Kendall Uyumsuzluğu

Aynı veri setinde Spearman ve Kendall katsayıları farklı sonuçlar verebilir. Jackson (2015), bu durumun normal olduğunu ve iki katsayının farklı mantıklarla hesaplandığını belirtir. Spearman değerleri genellikle Kendall değerlerinden yüksektir. Yaklaşık dönüşüm formülü: ρ ≈ 1.5τ - 0.5τ³ (küçük τ değerleri için ρ ≈ 1.5τ).

İki katsayı arasında anlamlılık açısından tutarsızlık varsa (biri anlamlı, diğeri değil), örneklem büyüklüğü, bağlı sıralama sayısı ve veri dağılımı gözden geçirilmelidir. Kothari (2004), bu tür durumlarda her iki sonucun raporlanmasını ve tutarsızlığın tartışılmasını önerir.

SPSS ile Korelasyon Katsayılarının Hesaplanması

Pearson ve Spearman

Analyze → Correlate → Bivariate menüsünde Pearson ve/veya Spearman seçenekleri işaretlenir. Kendall tau-b da bu menüden seçilebilir. Her üç katsayı aynı anda hesaplanarak karşılaştırılabilir.

Point-Biserial

SPSS'te point-biserial korelasyon için ayrı bir menü yoktur. İkilik değişken 0-1 olarak kodlandıktan sonra Pearson korelasyonu hesaplanır; sonuç otomatik olarak point-biserial korelasyona eşittir.

Phi Katsayısı

Analyze → Descriptive Statistics → Crosstabs menüsünde Statistics butonundan "Phi and Cramer's V" seçeneği işaretlenir. Alternatif olarak, 2×2 tablo için Pearson korelasyonu da phi katsayısını verir.

Eta Katsayısı

Analyze → Compare Means → Means menüsünde Options butonundan "Eta" ve "Eta squared" işaretlenir. Bu, bağımsız değişkenin kategorik, bağımlı değişkenin sürekli olduğu durumlarda kullanılır.

Raporlama Formatı

APA formatında korelasyon katsayılarının raporlanması şu şekilde olmalıdır:

Pearson: r(148) = .65, p < .001
Spearman: r_s(148) = .62, p < .001
Kendall: τ_b = .48, p < .001
Point-biserial: r_pb(148) = .35, p = .002
Phi: φ = .28, p = .015

Cohen, Manion ve Morrison (2007), raporlama sırasında neden ilgili katsayının seçildiğinin gerekçelendirilmesi gerektiğini vurgular. "Veriler sıralama ölçeğinde olduğu için Spearman sıra korelasyon katsayısı kullanılmıştır" gibi açık bir ifade, okuyucuya metodolojik tercihin bilinçli olduğunu gösterir.

Sonuç

Korelasyon katsayısı seçimi, araştırmanın metodolojik titizliğinin önemli bir göstergesidir. Jackson'ın (2015) vurguladığı gibi, değişkenlerin ölçek düzeyi, dağılım özellikleri ve ilişkinin doğası, uygun katsayının belirlenmesinde temel kriterlerdir. Pearson r en güçlü katsayı olmakla birlikte, varsayımlarının karşılanmaması durumunda Spearman veya Kendall gibi parametrik olmayan alternatifler tercih edilmelidir. İkilik değişkenler söz konusu olduğunda point-biserial, phi veya biserial korelasyonlar kullanılmalıdır. Cohen, Manion ve Morrison'un (2007) belirttiği gibi, eğitim araştırmalarında farklı ölçek düzeylerindeki verilerle çalışmak sık karşılaşılan bir durumdur ve araştırmacıların tüm korelasyon katsayılarını tanıması, doğru olanı seçmesi ve bu seçimi gerekçelendirmesi bilimsel raporlamanın temel gerekliliklerinden biridir. Kothari'nin (2004) ifade ettiği gibi, yanlış korelasyon katsayısı kullanımı, istatistiksel sonuçların geçerliliğini ciddi biçimde zayıflatabilir.

Korelasyon Katsayıları Karşılaştırması: Pearson, Spearman, Kendall ve Diğerleri

Pearson Çarpım-Moment Korelasyonu (r)

Varsayımlar

Güçlü Yönleri

Sınırlılıkları

Spearman Sıra Korelasyonu (ρ veya r_s)

Varsayımlar

Ne Zaman Kullanılmalı?

Pearson ile Karşılaştırma

Kendall Tau-b Korelasyonu (τ_b)

Varsayımlar

Spearman ile Karşılaştırma

Point-Biserial Korelasyon (r_pb)

Kullanım Koşulları

t-Testi ile İlişki

Phi Katsayısı (φ)

Kullanım Koşulları ve Formül

Tetrakhorik Korelasyon

Biserial Korelasyon

Eta Katsayısı (η)

Özellikleri

Kapsamlı Karşılaştırma Tablosu

Karar Akış Şeması: Doğru Katsayıyı Seçme

Spearman ve Kendall Uyumsuzluğu

SPSS ile Korelasyon Katsayılarının Hesaplanması

Pearson ve Spearman

Point-Biserial

Phi Katsayısı

Eta Katsayısı

Raporlama Formatı

Sonuç

Kaynaklar

Yorumlar (0)

Korelasyon Katsayıları Karşılaştırması: Pearson, Spearman, Kendall ve Diğerleri

Pearson Çarpım-Moment Korelasyonu (r)

Varsayımlar

Güçlü Yönleri

Sınırlılıkları

Spearman Sıra Korelasyonu (ρ veya rs)

Varsayımlar

Ne Zaman Kullanılmalı?

Pearson ile Karşılaştırma

Kendall Tau-b Korelasyonu (τb)

Varsayımlar

Spearman ile Karşılaştırma

Point-Biserial Korelasyon (rpb)

Kullanım Koşulları

t-Testi ile İlişki

Phi Katsayısı (φ)

Kullanım Koşulları ve Formül

Tetrakhorik Korelasyon

Biserial Korelasyon

Eta Katsayısı (η)

Özellikleri

Kapsamlı Karşılaştırma Tablosu

Karar Akış Şeması: Doğru Katsayıyı Seçme

Spearman ve Kendall Uyumsuzluğu

SPSS ile Korelasyon Katsayılarının Hesaplanması

Pearson ve Spearman

Point-Biserial

Phi Katsayısı

Eta Katsayısı

Raporlama Formatı

Sonuç

Kaynaklar

Yorumlar (0)

Spearman Sıra Korelasyonu (ρ veya r_s)

Kendall Tau-b Korelasyonu (τ_b)

Point-Biserial Korelasyon (r_pb)