Etki Büyüklüğü Ölçüleri: Cohen's d'den Odds Ratio'ya Kapsamlı Rehber
İstatistiksel anlamlılık (p değeri) onlarca yıl boyunca araştırma sonuçlarının değerlendirilmesinde tek kriter olarak kullanılmıştır. Ancak p değeri yalnızca sonucun şansa bağlı olup olmadığını test eder; etkinin pratik büyüklüğü ve önemi hakkında bilgi vermez. Büyük örneklemlerde çok küçük ve pratikte anlamsız farklar bile istatistiksel olarak anlamlı çıkabilir. Bu nedenle modern araştırma metodolojisi, p değerinin yanı sıra etki büyüklüğü ölçülerinin (effect size measures) raporlanmasını zorunlu kılmaktadır. Jackson'a (2015) göre etki büyüklüğü, bir etkinin veya ilişkinin gerçek dünyadaki anlamlılığını nicelleştiren ölçüdür. Cohen, Manion ve Morrison (2007), APA'nın 2001 yılından itibaren etki büyüklüğü raporlanmasını zorunlu tuttuğunu ve bu uygulamanın araştırma kalitesinin temel göstergesi haline geldiğini belirtir. Kothari (2004), etki büyüklüğünün örneklem büyüklüğünden bağımsız olması nedeniyle çalışmalar arası karşılaştırmayı mümkün kıldığını vurgular. Bu yazıda, tüm etki büyüklüğü ölçü ailelerini, hesaplama yöntemlerini, yorumlama kriterlerini ve raporlama formatlarını kapsamlı biçimde inceleyeceğiz.
Neden p Değeri Yeterli Değildir?
p değerinin sınırlılıklarını anlamak, etki büyüklüğünün önemini kavramanın ilk adımıdır. Jackson (2015), p değerinin şu sorunlarını vurgular:
- Örneklem büyüklüğüne bağımlılık: Yeterince büyük örneklemde (n > 10.000) pratikte anlamsız olan çok küçük farklar bile p < .05 düzeyinde anlamlı çıkar
- İkili karar: p değeri anlamlı/anlamsız ikili kararını destekler; etkinin derecesi hakkında bilgi vermez
- Çalışmalar arası karşılaştırma zorluğu: Farklı örneklem büyüklükleriyle yapılan çalışmaların p değerleri doğrudan karşılaştırılamaz
- Tekrarlanabilirlik krizi: p < .05 eşiği, yayın yanlılığı (publication bias) ve p-hacking gibi sorunlara zemin hazırlar
Cohen, Manion ve Morrison (2007), şu örneği verir: Bir eğitim müdahalesinin 10.000 kişilik örneklemde sınav puanlarını ortalama 0.5 puan artırdığı belirlenmiştir (100 üzerinden). Bu fark istatistiksel olarak anlamlı olabilir (p < .01) ancak pratikte tamamen anlamsızdır. Etki büyüklüğü bu durumu ortaya koyar.
Temel İlke: Kothari'ye (2004) göre, istatistiksel anlamlılık "bir etkinin var olup olmadığını," etki büyüklüğü ise "etkinin ne kadar büyük olduğunu" söyler. Her ikisi birlikte raporlanmalıdır.
d Ailesi: Standardize Ortalama Fark Ölçüleri
d ailesi, iki grubun ortalamaları arasındaki farkı standart sapma birimiyle ifade eden etki büyüklüğü ölçülerini içerir. Jackson'a (2015) göre d ailesi, grup karşılaştırması yapılan tüm araştırmalarda (t-testi, ANOVA) kullanılan temel etki büyüklüğü ailesidir.
Cohen's d
Cohen's d, en yaygın kullanılan standardize ortalama fark ölçüsüdür. İki grup ortalaması arasındaki farkı havuzlanmış standart sapmaya bölerek hesaplanır:
d = (M₁ - M₂) / sp
Burada sp = havuzlanmış standart sapma = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁ + n₂ - 2)]
Cohen'in (1988) önerdiği yorumlama kriterleri şunlardır:
| Cohen's d Değeri | Etki Büyüklüğü | Yorum |
|---|---|---|
| 0.20 | Küçük | Gözle zor fark edilir, ancak gerçek bir etkidir |
| 0.50 | Orta | Gözle fark edilebilir düzeyde |
| 0.80 | Büyük | Pratikte belirgin ve önemli |
Jackson (2015), bu kriterlerin genel rehber niteliğinde olduğunu ve her araştırma alanının kendi normlarını geliştirmesi gerektiğini belirtir. Eğitim araştırmalarında d = 0.40 bile pratikte anlamlı kabul edilebilir.
Hedges' g
Hedges' g, Cohen's d'nin küçük örneklem yanlılığı için düzeltilmiş versiyonudur. Cohen's d, küçük örneklemlerde (n < 20) etki büyüklüğünü hafifçe abartma eğilimindedir. Hedges' g bu yanlılığı düzeltir:
g = d × (1 - 3 / (4(n₁ + n₂) - 9))
Cohen, Manion ve Morrison (2007), meta-analiz çalışmalarında Hedges' g'nin tercih edilmesi gerektiğini belirtir; çünkü meta-analize dahil edilen çalışmaların örneklem büyüklükleri genellikle heterojendir ve küçük örneklem düzeltmesi önemlidir.
Glass' Delta (Δ)
Glass' delta, iki grup varyanslarının eşit olmadığı durumlarda kullanılır. Havuzlanmış standart sapma yerine yalnızca kontrol grubunun standart sapmasını payda olarak kullanır:
Δ = (Mdeney - Mkontrol) / skontrol
Jackson'a (2015) göre Glass' delta, müdahale çalışmalarında deney grubunun varyansının müdahaleden etkilenmiş olabileceği durumlarda tercih edilmelidir. Kontrol grubunun standart sapması, müdahaleden etkilenmemiş doğal değişkenliği yansıtır.
d Ailesi: Hangisini Ne Zaman Kullanmalı?
| Ölçü | Standart Sapma | Ne Zaman Kullanmalı? |
|---|---|---|
| Cohen's d | Havuzlanmış (her iki grup) | Varyanslar eşit, yeterli örneklem büyüklüğü |
| Hedges' g | Havuzlanmış + düzeltme | Küçük örneklem (n < 20), meta-analiz |
| Glass' Δ | Yalnızca kontrol grubu | Varyanslar eşit değil, müdahale çalışmaları |
r Ailesi: Korelasyon Tabanlı Etki Büyüklükleri
r ailesi, iki değişken arasındaki ilişkinin gücünü doğrudan korelasyon katsayısı olarak ifade eden etki büyüklüğü ölçülerini içerir. Kothari (2004), r ailesinin korelasyonel ve regresyon çalışmalarında doğal etki büyüklüğü ölçüsü olarak işlev gördüğünü belirtir.
Pearson r
Pearson r kendisi bir etki büyüklüğü ölçüsüdür. Cohen'in yorumlama kriterleri:
| r Değeri | Etki Büyüklüğü |
|---|---|
| .10 | Küçük |
| .30 | Orta |
| .50 | Büyük |
Point-Biserial r
t-testi sonuçlarından hesaplanan point-biserial r, grup karşılaştırmalarında ilişki-tabanlı etki büyüklüğü olarak kullanılır. Formül: r = √(t² / (t² + sd)).
d ve r Arası Dönüşüm
d ve r ailesi arasında dönüşüm mümkündür:
- r = d / √(d² + 4) (d'den r'ye)
- d = 2r / √(1 - r²) (r'den d'ye)
Varyans Açıklama Oranı Ailesi
Bu aile, bağımsız değişken(ler)in bağımlı değişkendeki varyansın ne kadarını açıkladığını gösteren ölçüleri içerir. Cohen, Manion ve Morrison (2007), varyans açıklama oranlarının ANOVA ve regresyon analizlerinde en sık kullanılan etki büyüklüğü ölçüleri olduğunu belirtir.
Eta-Kare (η²)
Eta-kare, ANOVA'da bağımsız değişkenin bağımlı değişkendeki toplam varyansın ne kadarını açıkladığını gösterir:
η² = SSetki / SStoplam
Yorumlama kriterleri (Cohen, 1988):
| η² Değeri | Etki Büyüklüğü |
|---|---|
| .01 | Küçük |
| .06 | Orta |
| .14 | Büyük |
Kısmi Eta-Kare (ηp²)
Kısmi eta-kare, SPSS'in ANOVA çıktısında varsayılan olarak raporladığı ölçüdür. Toplam varyans yerine, etki + hata varyansını payda olarak kullanır:
ηp² = SSetki / (SSetki + SShata)
Jackson (2015), kısmi eta-karenin çok faktörlü ANOVA tasarımlarında her bir faktörün etkisini ayrı ayrı değerlendirmek için tercih edildiğini belirtir. Tek faktörlü ANOVA'da η² ve ηp² eşittir.
Dikkat: SPSS, ANOVA çıktısında "Partial Eta Squared" başlığı altında kısmi eta-kare raporlar. Birçok araştırmacı bunu yanlışlıkla eta-kare olarak raporlar. Cohen, Manion ve Morrison (2007), bu karışıklığın akademik literatürde sıkça görüldüğünü ve araştırmacıların hangi ölçüyü raporladıklarını açıkça belirtmeleri gerektiğini vurgular.
Omega-Kare (ω²)
Omega-kare, eta-karenin popülasyon tahmini olarak daha az yanlı bir ölçüdür. Eta-kare örneklem değerine dayandığı için popülasyondaki gerçek etki büyüklüğünü hafifçe abartır. Omega-kare bu yanlılığı düzeltir:
ω² = (SSetki - dfetki × MShata) / (SStoplam + MShata)
Kothari (2004), omega-karenin özellikle küçük örneklemlerde eta-kareden önemli ölçüde düşük değerler verebildiğini ve bu nedenle daha tutucu bir tahmin sunduğunu belirtir.
R² (Belirleme Katsayısı)
R², regresyon analizinde tüm bağımsız değişkenlerin birlikte açıkladığı varyans oranını gösterir. Düzeltilmiş R² (Adjusted R²), modeldeki değişken sayısı için düzeltme uygulayarak daha doğru bir tahmin sunar:
R²adj = 1 - (1 - R²)(n - 1) / (n - k - 1)
Burada k = modeldeki bağımsız değişken sayısı
Odds Tabanlı Ölçüler
Bağımlı değişkenin kategorik (özellikle ikilik) olduğu durumlarda odds tabanlı etki büyüklüğü ölçüleri kullanılır. Bu ölçüler özellikle sağlık bilimleri ve epidemiyoloji araştırmalarında yaygındır.
Odds Ratio (OR)
Odds ratio (olasılık oranı), bir olayın bir grupta gerçekleşme olasılığının diğer gruba göre kaç kat fazla olduğunu gösterir. 2×2 tabloda:
OR = (a × d) / (b × c)
Burada a = deney grubunda olay var, b = deney grubunda olay yok, c = kontrol grubunda olay var, d = kontrol grubunda olay yok
- OR = 1: Gruplar arasında fark yok
- OR > 1: Olay deney grubunda daha olası
- OR < 1: Olay kontrol grubunda daha olası
Relative Risk (RR) - Göreceli Risk
Göreceli risk, olayın gerçekleşme olasılığının bir grupta diğerine göre kaç kat fazla olduğunu doğrudan gösterir:
RR = [a / (a + b)] / [c / (c + d)]
Jackson'a (2015) göre göreceli risk, odds ratio'dan daha sezgisel yorumlanır. RR = 2.5, "deney grubundaki bireyler kontrol grubundakilere göre 2.5 kat daha fazla olayı deneyimlemiştir" şeklinde yorumlanır.
NNT (Number Needed to Treat)
NNT (tedavi için gereken sayı), bir ek olumlu sonuç elde etmek için kaç kişinin tedavi edilmesi gerektiğini gösterir:
NNT = 1 / ARR
Burada ARR (Absolute Risk Reduction) = |Riskdeney - Riskkontrol|
NNT = 5, "bir ek olumlu sonuç için 5 kişinin tedavi edilmesi gerekir" anlamına gelir. Değer ne kadar küçükse müdahale o kadar etkilidir. Cohen, Manion ve Morrison (2007), NNT'nin klinik uygulamada en anlaşılır etki büyüklüğü ölçüsü olduğunu belirtir.
Kapsamlı Karşılaştırma Tablosu
| Ölçü | Aile | Analiz Türü | Küçük | Orta | Büyük |
|---|---|---|---|---|---|
| Cohen's d | d ailesi | t-testi, ANOVA | 0.20 | 0.50 | 0.80 |
| Hedges' g | d ailesi | t-testi (küçük n) | 0.20 | 0.50 | 0.80 |
| Glass' Δ | d ailesi | Müdahale çalışması | 0.20 | 0.50 | 0.80 |
| Pearson r | r ailesi | Korelasyon | .10 | .30 | .50 |
| η² | Varyans | ANOVA | .01 | .06 | .14 |
| ηp² | Varyans | Çok faktörlü ANOVA | .01 | .06 | .14 |
| ω² | Varyans | ANOVA (popülasyon) | .01 | .06 | .14 |
| R² | Varyans | Regresyon | .02 | .13 | .26 |
| Odds Ratio | Odds | Lojistik regresyon | 1.5 | 2.5 | 4.3 |
Etki Büyüklükleri Arası Dönüşüm
Farklı etki büyüklüğü ölçüleri birbirine dönüştürülebilir. Jackson (2015), en yaygın dönüşüm formüllerini şu şekilde özetler:
- d → r: r = d / √(d² + 4)
- r → d: d = 2r / √(1 - r²)
- d → η²: η² = d² / (d² + 4)
- η² → d: d = 2√(η² / (1 - η²))
- r → η²: η² = r²
- OR → d: d = ln(OR) × √3 / π
Bu dönüşümler, meta-analiz çalışmalarında farklı etki büyüklüğü türlerini ortak bir metriğe dönüştürmek için kullanılır.
Etki Büyüklüğü için Güven Aralıkları
Cohen, Manion ve Morrison (2007), etki büyüklüğü değerinin tek başına yeterli olmadığını ve güven aralığının mutlaka raporlanması gerektiğini vurgular. Güven aralığı, etki büyüklüğü tahmininin kesinliğini gösterir. Dar güven aralığı kesin bir tahmine, geniş güven aralığı belirsiz bir tahmine işaret eder.
Örneğin, d = 0.60, %95 GA [0.35, 0.85] ifadesi, etki büyüklüğünün orta düzeyde olduğunu ve gerçek popülasyon değerinin %95 olasılıkla 0.35 ile 0.85 arasında olduğunu gösterir. Güven aralığı sıfırı içeriyorsa, etki istatistiksel olarak anlamlı değildir.
APA Raporlama Formatı
APA 7. baskı formatında etki büyüklüklerinin raporlanması şu şekilde olmalıdır:
- t-testi: t(48) = 3.25, p = .002, d = 0.65, %95 GA [0.28, 1.02]
- ANOVA: F(2, 87) = 5.42, p = .006, ηp² = .11
- Korelasyon: r(148) = .45, p < .001, r² = .20
- Ki-kare: χ²(1) = 8.56, p = .003, φ = .28
- Regresyon: R² = .35, F(3, 96) = 17.23, p < .001
Kothari (2004), etki büyüklüğü raporlanmasında şu bilgilerin mutlaka yer alması gerektiğini belirtir: (1) kullanılan etki büyüklüğü ölçüsünün adı, (2) hesaplanan değer, (3) mümkünse güven aralığı, (4) yorumlama referans noktaları.
Meta-Analiz Bağlantısı
Etki büyüklüğü ölçüleri, meta-analiz çalışmalarının temel birimidir. Meta-analizde aynı konuda yapılmış birden fazla çalışmanın etki büyüklükleri birleştirilerek genel bir etki tahmini elde edilir. Jackson'a (2015) göre meta-analizin mümkün olması için araştırmacıların etki büyüklüklerini doğru ve tutarlı biçimde raporlaması gerekir. Bu nedenle her bireysel çalışmada etki büyüklüğü raporlanması yalnızca o çalışma için değil, bilimsel bilgi birikiminin sentezi için de kritik öneme sahiptir.
Sık Yapılan Hatalar
Etki büyüklüğü raporlamasında sıkça karşılaşılan hatalar şunlardır:
- Etki büyüklüğü raporlamamak: Yalnızca p değeriyle yetinmek, en yaygın ve en ciddi hatadır
- Yanlış ölçü seçimi: ANOVA için Cohen's d, t-testi için eta-kare kullanmak gibi uyumsuzluklar
- SPSS çıktısını yanlış okumak: Kısmi eta-kareyi eta-kare olarak raporlamak
- Cohen kriterlerini mutlak kabul etmek: Küçük/orta/büyük sınıflandırması bağlama göre değişir
- Güven aralığını ihmal etmek: Nokta tahmini tek başına yeterli değildir
- Negatif sonuçları görmezden gelmek: Küçük etki büyüklükleri de raporlanmalıdır
- Dönüşüm hatası: d, r ve η² arasında yanlış dönüşüm formülü kullanmak
Altın Kural: Cohen, Manion ve Morrison'un (2007) ifade ettiği gibi, "istatistiksel anlamlılık araştırmanın sonucu değil, başlangıç noktasıdır." Araştırma sonuçlarının gerçek değerini ortaya koyan, etki büyüklüğüdür.
Sonuç
Etki büyüklüğü ölçüleri, istatistiksel anlamlılığın ötesine geçerek bir etkinin veya ilişkinin pratik anlamlılığını nicelleştiren vazgeçilmez araçlardır. d ailesi grup farklarını, r ailesi ilişkileri, varyans açıklama oranı ailesi açıklayıcı gücü ve odds ailesi kategorik sonuçları değerlendirir. Jackson'ın (2015) vurguladığı gibi, doğru etki büyüklüğü ölçüsünün seçilmesi ve güven aralığıyla birlikte raporlanması modern araştırma metodolojisinin temel gerekliliğidir. Cohen, Manion ve Morrison'un (2007) belirttiği gibi, APA standartlarına uygun etki büyüklüğü raporlaması yalnızca bireysel çalışmaların kalitesini artırmakla kalmaz, meta-analiz yoluyla bilimsel bilgi birikiminin sentezini de mümkün kılar. Kothari'nin (2004) ifade ettiği gibi, etki büyüklüğü ölçülerinin sistematik kullanımı, araştırma sonuçlarının pratik karar alma süreçlerine entegrasyonunun temel koşuludur.
Kaynaklar
Yorumlar (0)
Yorum yapmak için giriş yapmalısınız.
