Çok Düzeyli Modelleme (HLM): Hiyerarşik Veri Analizi Rehberi

Eğitim araştırmalarında veriler genellikle iç içe geçmiş (nested) bir yapıya sahiptir: Öğrenciler sınıfların içinde, sınıflar okulların içinde, okullar ise ilçelerin veya bölgelerin içinde yer alır. Bu tür hiyerarşik veri yapılarının geleneksel istatistiksel yöntemlerle (örneğin sıradan en küçük kareler regresyonu) analiz edilmesi ciddi metodolojik sorunlara yol açar. Çok düzeyli modelleme (Hierarchical Linear Modeling - HLM), bu iç içe geçmiş yapıları dikkate alarak daha doğru ve bilgilendirici sonuçlar üreten ileri bir istatistiksel tekniktir. Cohen, Manion ve Morrison (2007), eğitim araştırmalarında hiyerarşik veri yapılarının göz ardı edilmesinin Tip I hata oranını ciddi biçimde artırdığını vurgular. Bu yazıda, çok düzeyli modellemenin temel kavramlarını, model türlerini, uygulama adımlarını ve raporlama biçimini kapsamlı olarak ele alacağız.

İç İçe Geçmiş Veri Problemi

Eğitim araştırmalarında en yaygın hiyerarşik yapı öğrenci-sınıf-okul şeklindedir. Örneğin, bir araştırmacı farklı okullardaki öğrencilerin matematik başarısını inceliyorsa, aynı sınıftaki öğrencilerin birbirinden bağımsız olmadığını kabul etmelidir. Aynı öğretmenden ders alan, aynı müfredatı takip eden ve benzer sosyoekonomik çevreden gelen öğrenciler, farklı sınıf veya okullardaki öğrencilere kıyasla birbirine daha çok benzer.

Bu durum istatistikte bağımsızlık varsayımının ihlali anlamına gelir. Jackson (2015), sıradan en küçük kareler (OLS) regresyonunun temel varsayımlarından birinin gözlemlerin birbirinden bağımsız olması olduğunu belirtir. Bu varsayım ihlal edildiğinde standart hatalar olduğundan küçük hesaplanır, bu da istatistiksel testlerin anlamlılık düzeyini yapay olarak artırır ve Tip I hata (gerçekte olmayan bir etkiyi var gibi bulma) riskini yükseltir.

OLS Regresyonunun Neden Yetersiz Kaldığı

Geleneksel OLS regresyonu, hiyerarşik verilerde üç temel sorunla karşılaşır:

Bağımsızlık ihlali: Aynı küme (sınıf, okul) içindeki gözlemler birbirine bağımlıdır; OLS bu bağımlılığı modele dahil edemez
Düzey karışıklığı (aggregation/disaggregation bias): Okul düzeyindeki değişkenleri (örneğin okul büyüklüğü) öğrenci düzeyine indirgemek veya öğrenci verilerini okul düzeyine toplamak bilgi kaybına ve yanlı tahminlere yol açar
Etkileşim gözden kaçırma: Bir değişkenin etkisinin gruplar arasında farklılaşıp farklılaşmadığını test edemez

Cohen, Manion ve Morrison (2007), bu sorunların özellikle büyük ölçekli eğitim araştırmalarında (PISA, TIMSS gibi uluslararası karşılaştırma çalışmalarında) kritik önem taşıdığını belirtir. Bu çalışmalarda öğrenciler onlarca farklı ülkedeki binlerce okulda iç içe geçmiş durumdadır.

Sınıf İçi Korelasyon Katsayısı (ICC)

Çok düzeyli modellemenin ilk adımı, verilerde gerçekten anlamlı bir kümeleme etkisinin olup olmadığını belirlemektir. Bu amaçla sınıf içi korelasyon katsayısı (Intraclass Correlation Coefficient - ICC) hesaplanır.

ICC, bağımlı değişkendeki toplam varyansın ne kadarının gruplar arası farklılıklardan kaynaklandığını gösterir. Formül şu şekildedir:

ICC = τ₀₀ / (τ₀₀ + σ²)
Burada τ₀₀ = gruplar arası varyans (düzey 2 varyansı), σ² = grup içi varyans (düzey 1 varyansı)

Örneğin, ICC = 0.25 ise bu, matematik başarısındaki toplam varyansın %25'inin okullar arası farklılıklardan, %75'inin ise öğrenciler arası bireysel farklılıklardan kaynaklandığı anlamına gelir.

ICC Değerinin Yorumlanması

ICC Değeri	Yorumlama	HLM Gerekliliği
0.00 - 0.05	Çok düşük kümeleme etkisi	HLM genellikle gereksiz, OLS yeterli olabilir
0.05 - 0.15	Orta düzeyde kümeleme etkisi	HLM önerilir
0.15 - 0.30	Yüksek kümeleme etkisi	HLM kesinlikle gerekli
0.30 ve üzeri	Çok yüksek kümeleme etkisi	HLM zorunlu, OLS sonuçları güvenilmez

Jackson (2015), eğitim araştırmalarında ICC değerlerinin genellikle 0.05 ile 0.30 arasında olduğunu ve bu aralığın çok düzeyli modellemeyi haklı kıldığını belirtir. Bazı araştırmacılar ICC > 0.05 eşik değerini, bazıları ise daha muhafazakar olarak ICC > 0.10 eşik değerini önermektedir.

Boş Model (Unconditional Model)

Çok düzeyli analiz sürecinin ilk adımı boş model (null model veya unconditional model) kurmaktır. Boş model, herhangi bir bağımsız değişken içermeyen ve yalnızca bağımlı değişkenin düzeyler arası varyans dağılımını inceleyen modeldir.

Boş modelin matematiksel ifadesi iki düzeyli bir yapıda şöyledir:

Düzey 1 (öğrenci): Y_ij = β₀j + r_ij
Düzey 2 (okul): β₀j = γ₀₀ + u₀j
Burada Y_ij = i. öğrencinin j. okuldaki puanı, β₀j = j. okulun ortalaması, γ₀₀ = genel ortalama, r_ij = öğrenci düzeyi hata terimi, u₀j = okul düzeyi hata terimi

Bu modelden elde edilen varyans bileşenleri (τ₀₀ ve σ²) kullanılarak ICC hesaplanır ve verilerde anlamlı bir hiyerarşik yapının olup olmadığı değerlendirilir.

Rastgele Kesişim Modeli (Random Intercept Model)

Boş modelden sonra ikinci adım, rastgele kesişim modeli kurmaktır. Bu modelde düzey 1 bağımsız değişkenleri (örneğin öğrencinin sosyoekonomik düzeyi) modele eklenir, ancak bu değişkenlerin etkisinin tüm gruplarda aynı olduğu varsayılır. Farklılaşmasına izin verilen tek parametre kesişim noktasıdır (intercept); yani her grubun (okulun) farklı bir ortalamaya sahip olmasına izin verilir.

Düzey 1: Y_ij = β₀j + β₁j(SES_ij) + r_ij
Düzey 2: β₀j = γ₀₀ + γ₀₁(OkulKaynakları_j) + u₀j
β₁j = γ₁₀ (sabit eğim)

Cohen, Manion ve Morrison (2007), rastgele kesişim modelinin en yaygın kullanılan çok düzeyli model olduğunu belirtir. Bu model, gruplar arası ortalama farklılıklarını açıklarken, bağımsız değişkenlerin etkisinin gruplar arasında homojen olduğunu varsayar.

Rastgele Eğim Modeli (Random Slope Model)

Rastgele eğim modeli, rastgele kesişim modelinden bir adım ileriye giderek, bağımsız değişkenlerin etkisinin de gruplar arasında farklılaşmasına izin verir. Örneğin, sosyoekonomik düzeyin matematik başarısı üzerindeki etkisi bazı okullarda güçlüyken, diğerlerinde zayıf olabilir.

Düzey 1: Y_ij = β₀j + β₁j(SES_ij) + r_ij
Düzey 2: β₀j = γ₀₀ + γ₀₁(OkulKaynakları_j) + u₀j
β₁j = γ₁₀ + u₁j (rastgele eğim)

Burada u₁j terimi, SES etkisinin okullara göre farklılaşma miktarını temsil eder. Jackson (2015), rastgele eğim modelinin teorik olarak daha gerçekçi olduğunu ancak tahmin edilmesi gereken parametre sayısını artırdığını ve yeterli örneklem büyüklüğü gerektirdiğini vurgular.

Sabit ve Rastgele Etkiler

Çok düzeyli modellemenin temel kavramlarından biri sabit etkiler (fixed effects) ile rastgele etkiler (random effects) arasındaki ayrımdır:

Özellik	Sabit Etkiler	Rastgele Etkiler
Tanım	Tüm gruplarda aynı olan parametreler	Gruplar arasında değişen parametreler
Notasyon	γ (gamma) katsayıları	u (hata) terimleri ve varyans bileşenleri
Örnek	SES'in başarıya genel etkisi (γ₁₀)	SES etkisinin okullara göre değişimi (u₁j)
Yorumlama	Belirli bir değer (nokta tahmini)	Bir dağılım (varyans tahmini)
Test	t-testi veya z-testi	Ki-kare veya olabilirlik oranı testi

Merkezleme (Centering)

Çok düzeyli modellerde bağımsız değişkenlerin merkezlenmesi kritik bir karardır. İki temel merkezleme yöntemi vardır:

Genel Ortalamaya Göre Merkezleme (Grand-Mean Centering)

Her gözlem değerinden tüm örneklemin genel ortalaması çıkarılır. Cohen, Manion ve Morrison'a (2007) göre bu yöntem, düzey 1 değişkeninin düzeyler arası etkisini korur ve düzey 2 kesişim noktasının "ortalama düzey 1 değerine sahip bir bireyin sonucu" olarak yorumlanmasını sağlar.

Grup Ortalamasına Göre Merkezleme (Group-Mean Centering)

Her gözlem değerinden kendi grubunun ortalaması çıkarılır. Bu yöntem, düzey 1 etkisini tamamen grup içi etkiye dönüştürür. Gruplar arası etki yalnızca grup ortalaması düzey 2'ye değişken olarak eklendiğinde modele dahil edilir.

Merkezleme Türü	Ne Yapar	Ne Zaman Kullanılır
Genel ortalama	Genel ortalamadan sapma; düzeyler arası etki korunur	Toplam etkiyi incelemek istediğinizde; kovaryans analizi benzeri durumlarda
Grup ortalaması	Grup ortalamasından sapma; etki tamamen grup içine ayrıştırılır	Grup içi ve gruplar arası etkileri ayrıştırmak istediğinizde; bağlamsal etki analizi
Merkezleme yok	Ham değerler kullanılır	Değişkenin doğal sıfır noktası anlamlı olduğunda (yaş, deneyim yılı)

Düzeyler Arası Etkileşim (Cross-Level Interaction)

Çok düzeyli modellemenin en güçlü yönlerinden biri düzeyler arası etkileşimleri test edebilmesidir. Bu, bir düzey 2 değişkeninin, düzey 1 değişkeni ile bağımlı değişken arasındaki ilişkiyi nasıl düzenlediğini (moderate ettiğini) gösterir.

Örneğin, "Okul kaynaklarının düzeyi, öğrencilerin sosyoekonomik durumu ile matematik başarısı arasındaki ilişkiyi etkiler mi?" sorusu bir düzeyler arası etkileşim sorusudur. Model ifadesiyle:

Düzey 2 eğim denklemi: β₁j = γ₁₀ + γ₁₁(OkulKaynakları_j) + u₁j
Burada γ₁₁, düzeyler arası etkileşim katsayısıdır. Eğer γ₁₁ anlamlı ise, SES-başarı ilişkisi okul kaynakları düzeyine göre farklılık göstermektedir.

Jackson (2015), düzeyler arası etkileşimlerin eğitim politikası açısından büyük önem taşıdığını belirtir. Örneğin, okul kaynaklarının artırılmasının özellikle düşük SES'li öğrencilerde başarıyı artırıp artırmadığı bu tür analizlerle test edilebilir.

Model Kurma Stratejisi

Çok düzeyli modeller genellikle aşamalı (step-by-step) olarak kurulur. Önerilen strateji şu adımları içerir:

Adım 1 - Boş model: Hiçbir bağımsız değişken eklenmez. ICC hesaplanır ve çok düzeyli modellemenin gerekli olup olmadığı değerlendirilir
Adım 2 - Rastgele kesişim modeli: Düzey 1 bağımsız değişkenleri sabit etkiler olarak eklenir. Eğimlerin tüm gruplarda aynı olduğu varsayılır
Adım 3 - Rastgele eğim modeli: Teorik olarak gruplar arasında farklılaşması beklenen eğimlerin rastgele olmasına izin verilir
Adım 4 - Düzey 2 değişkenleri: Grup düzeyi değişkenleri eklenerek rastgele kesişim ve eğimlerdeki varyansın açıklanması sağlanır
Adım 5 - Düzeyler arası etkileşimler: Teorik olarak anlamlı düzeyler arası etkileşimler test edilir

Cohen, Manion ve Morrison (2007), her adımda modelin uyum istatistiklerinin (deviance, AIC, BIC) karşılaştırılmasını ve yalnızca modeli anlamlı biçimde iyileştiren parametrelerin tutulmasını önerir.

Varyans Açıklama Oranı

Çok düzeyli modellerde her düzey için ayrı ayrı varyans açıklama oranı hesaplanır. Bu oran, eklenen değişkenlerin ilgili düzeydeki varyansı ne kadar azalttığını gösterir:

Pseudo R² (Düzey 1): (σ²_boş - σ²_model) / σ²_boş
Pseudo R² (Düzey 2): (τ₀₀_boş - τ₀₀_model) / τ₀₀_boş

Örneğin, düzey 2 pseudo R² = 0.40 ise bu, modele eklenen okul düzeyi değişkenlerinin okullararası varyansın %40'ını açıkladığı anlamına gelir. Jackson (2015), bu oranların OLS regresyondaki R² gibi yorumlanabileceğini ancak düzeyler arasında ayrı ayrı değerlendirilmesi gerektiğini belirtir.

Örneklem Büyüklüğü Gereksinimleri

Çok düzeyli modellemenin kritik konularından biri her düzeyde yeterli örneklem büyüklüğünün sağlanmasıdır:

Düzey	Minimum Önerilen	İdeal	Açıklama
Düzey 2 (grup sayısı)	20-30 grup	50+ grup	Grup düzeyi varyans ve regresyon katsayıları için güvenilir tahminler
Düzey 1 (grup içi birey)	5-10 birey/grup	20+ birey/grup	Grup ortalamaları ve eğimlerin güvenilir tahmini
Toplam	Parametre başına 10-20 gözlem	Daha fazla tercih edilir	Genel kural olarak parametre sayısına bağlı

Cohen, Manion ve Morrison (2007), özellikle düzey 2 örneklem büyüklüğünün kritik olduğunu vurgular. 30'dan az grup olduğunda, varyans bileşeni tahminleri ve düzey 2 standart hataları güvenilmez olabilir. Rastgele eğim modelleri ve düzeyler arası etkileşimler için daha büyük örneklemler gerekir.

Tekrarlı Ölçümlerle ANOVA Karşılaştırması

Çok düzeyli modelleme, geleneksel tekrarlı ölçümlerle ANOVA ile bazı ortak özellikler taşısa da önemli avantajlara sahiptir:

Özellik	Tekrarlı Ölçümler ANOVA	Çok Düzeyli Modelleme
Kayıp veri	Listwise deletion; eksik ölçümü olan birey tamamen çıkarılır	Maximum likelihood; mevcut tüm veriler kullanılır
Küresellik varsayımı	Gerekli (Mauchly testi)	Gerekli değil; kovaryans yapısı esnektir
Zaman aralıkları	Eşit aralıklı olmalı	Eşit olmayan aralıklar modellenebilir
Sürekli yordayıcılar	Kovaryat olarak sınırlı şekilde eklenebilir	Her düzeyde serbestçe eklenebilir
Bireysel değişim eğrileri	Modellenemez	Bireysel büyüme eğrileri tahmin edilebilir

Yazılım Seçenekleri

Çok düzeyli modelleme çeşitli istatistik yazılımlarıyla gerçekleştirilebilir:

HLM (Scientific Software International): Özellikle çok düzeyli modelleme için tasarlanmış, kullanıcı dostu arayüz, grafik çıktılar. Öğrenme eğrisi düşük ancak esnekliği sınırlı
MLwiN: Bristol Üniversitesi tarafından geliştirilmiş, MCMC tahmin destekli, çok düzeyli modelleme odaklı yazılım
R (lme4 paketi): Açık kaynak, son derece esnek. lmer() fonksiyonu ile sürekli, glmer() ile kategorik bağımlı değişkenler modellenebilir. Öğrenme eğrisi yüksek ancak reprodüktif araştırma için ideal
Mplus: Yapısal eşitlik modellemesi ile çok düzeyli modellemeyi birleştirebilir. Çok düzeyli SEM, çok düzeyli CFA gibi ileri uygulamalar için güçlü
SPSS (MIXED prosedürü): Temel çok düzeyli modeller için yeterli. Analyze > Mixed Models > Linear yoluyla erişilir. Grafiksel arayüz mevcut ancak ileri modeller için sınırlı
Stata (mixed komutu): Güçlü ve esnek çok düzeyli modelleme desteği; post-tahmin komutları ile zengin çıktı

Eğitim Araştırmasından Pratik Örnek

Bir araştırmacı, 50 okuldan toplam 2.000 öğrencinin matematik başarısını inceliyor. Araştırma soruları: (1) Matematik başarısındaki varyansın ne kadarı okullararası farklılıklardan kaynaklanmaktadır? (2) Öğrenci düzeyinde SES ve motivasyon, okul düzeyinde okul kaynakları ve öğretmen niteliği başarıyı nasıl etkiler? (3) Okul kaynaklarının düzeyi, SES-başarı ilişkisini düzenler mi?

Adım 1 - Boş model: ICC = 0.22 bulunur. Bu, matematik başarısındaki varyansın %22'sinin okullar arası farklılıklardan kaynaklandığını gösterir. HLM gereklidir.

Adım 2 - Düzey 1 değişkenleri: SES (γ₁₀ = 3.45, p < .001) ve motivasyon (γ₂₀ = 2.18, p < .01) anlamlı yordayıcılardır. Düzey 1 pseudo R² = 0.15.

Adım 3 - Rastgele eğim: SES eğiminin okullara göre anlamlı biçimde farklılaştığı bulunur (τ₁₁ = 1.85, χ² = 72.4, p < .01).

Adım 4 - Düzey 2 değişkenleri: Okul kaynakları (γ₀₁ = 4.21, p < .001) okullararası varyansı anlamlı biçimde açıklar. Düzey 2 pseudo R² = 0.38.

Adım 5 - Düzeyler arası etkileşim: Okul kaynakları × SES etkileşimi anlamlıdır (γ₁₁ = -1.12, p < .05). Bu, yüksek kaynaklı okullarda SES-başarı ilişkisinin zayıfladığını, yani okul kaynaklarının SES eşitsizliğini dengeleme potansiyeli taşıdığını gösterir.

Raporlama Formatı

Çok düzeyli modelleme sonuçlarının raporlanmasında şu unsurlar yer almalıdır:

ICC değeri ve anlamlılığı: Hiyerarşik yapının gerekçelendirilmesi
Model karşılaştırma tablosu: Her adımdaki deviance, AIC, BIC değerleri ve olabilirlik oranı testi sonuçları
Sabit etkiler tablosu: Katsayılar (γ), standart hatalar, t-değerleri ve p-değerleri
Rastgele etkiler tablosu: Varyans bileşenleri (τ ve σ²), standart sapmalar ve güven aralıkları
Varyans açıklama oranları: Her düzey için pseudo R² değerleri
Merkezleme kararları: Hangi değişkenin nasıl merkezlendiği ve gerekçesi

Örnek raporlama cümlesi: "Boş model sonuçları, matematik başarısındaki toplam varyansın %22'sinin okullar arası farklılıklardan kaynaklandığını göstermiştir (ICC = .22). Son modelde öğrenci düzeyinde SES (γ₁₀ = 3.45, SE = 0.62, p < .001) ve motivasyon (γ₂₀ = 2.18, SE = 0.78, p < .01) anlamlı yordayıcılardır. Düzeyler arası etkileşim analizi, okul kaynaklarının SES-başarı ilişkisini anlamlı biçimde düzenlediğini ortaya koymuştur (γ₁₁ = -1.12, SE = 0.45, p < .05)."

Sonuç

Çok düzeyli modelleme, iç içe geçmiş veri yapılarının doğru analizi için vazgeçilmez bir istatistiksel tekniktir. Cohen, Manion ve Morrison'un (2007) vurguladığı gibi, eğitim araştırmalarında öğrenciler doğal olarak sınıf ve okul gibi gruplar içinde kümelenmiştir ve bu kümelemeyi göz ardı etmek ciddi istatistiksel hatalara yol açar. HLM, ICC hesaplama ile başlayan, boş modelden rastgele eğim ve düzeyler arası etkileşim modellerine doğru aşamalı olarak ilerleyen sistematik bir analiz stratejisi sunar. Merkezleme kararları, örneklem büyüklüğü gereksinimleri ve varyans açıklama oranlarının dikkatle ele alınması, güvenilir sonuçlar elde etmenin ön koşuludur. Jackson'ın (2015) belirttiği gibi, çok düzeyli modelleme yalnızca istatistiksel bir teknik değil, aynı zamanda verinin doğasını daha gerçekçi biçimde yansıtan bir düşünme biçimidir.

Çok Düzeyli Modelleme (HLM): İç İçe Geçmiş Verilerin Analizi