Değerlendirme Araştırması: CIPP, Mantık Modeli ve Program Değerlendirme

Değerlendirme araştırması (evaluation research), bir programın, projenin, politikanın veya müdahalenin etkililiğini, verimliliğini ve değerini sistematik olarak belirleme sürecidir. Temel araştırmadan farklı olarak, değerlendirme araştırmasının birincil amacı evrensel bilgi üretmek değil, belirli bir programın iyileştirilmesi veya devam edip etmeyeceği hakkında karar vermeye yardımcı olmaktır. Cohen, Manion ve Morrison (2007), değerlendirme araştırmasını "belirli bir bağlamda belirli bir amaca yönelik sistematik kanıt toplama ve yorumlama süreci" olarak tanımlar. Bu yazıda, program değerlendirmenin temel kavramlarını, başlıca modellerini ve pratik uygulama adımlarını kapsamlı biçimde ele alacağız.

Değerlendirme Araştırması Nedir?

Değerlendirme araştırması, sosyal bilimler yöntemlerini kullanarak bir müdahalenin planlama, uygulama ve sonuç aşamalarını inceleme sürecidir. Creswell'e (2009) göre değerlendirme araştırması, nicel ve nitel yöntemlerin her ikisini de kullanabilen uygulamalı bir araştırma türüdür. Değerlendirme araştırmasının temel sorusu şudur: "Bu program amaçlarına ulaşıyor mu ve paydaşlarına değer katıyor mu?"

Temel Araştırma ile Değerlendirme Araştırması Arasındaki Farklar

Boyut	Temel Araştırma	Değerlendirme Araştırması
Amaç	Evrensel bilgi üretmek	Belirli bir program hakkında karar vermek
Genellenebilirlik	Geniş popülasyonlara genelleme hedeflenir	Belirli bir bağlama odaklanılır
Paydaş rolü	Genellikle sınırlıdır	Merkezi bir konumdadır
Değer yargısı	Kaçınılır	Açıkça ifade edilir
Kullanım	Literatüre katkı	Program iyileştirme ve hesap verebilirlik
Zamanlama	Araştırmacı belirler	Program döngüsüne bağlıdır

Cohen, Manion ve Morrison (2007), değerlendirme araştırmasının hem bir araştırma faaliyeti hem de bir yönetim aracı olduğunu vurgular. Bu ikili doğa, değerlendirme araştırmasını diğer araştırma türlerinden ayıran temel özelliktir.

Formatif ve Sümatif Değerlendirme

Michael Scriven (1967) tarafından önerilen bu ayrım, program değerlendirmesinin en temel sınıflandırmasıdır.

Formatif Değerlendirme

Formatif değerlendirme, bir programın geliştirilmesi ve iyileştirilmesi amacıyla uygulama sürecinde gerçekleştirilen değerlendirmedir. Cohen, Manion ve Morrison'a (2007) göre formatif değerlendirmenin temel özellikleri şunlardır:

Zamanlama: Program uygulanırken yapılır
Amaç: Programı iyileştirmek, zayıf yönleri tespit etmek
Hedef kitle: Program geliştiriciler ve uygulayıcılar
Sorular: "Program nasıl daha iyi hale getirilebilir?", "Hangi bileşenler sorunlu?"
Yöntemler: Gözlem, görüşme, pilot uygulama verileri, süreç analizi

Sümatif Değerlendirme

Sümatif değerlendirme, bir programın genel etkililiğini ve değerini belirlemek amacıyla program tamamlandıktan sonra veya belirli bir dönemin sonunda gerçekleştirilir. Temel özellikleri şunlardır:

Zamanlama: Program tamamlandıktan sonra veya dönem sonunda yapılır
Amaç: Programın devam edip etmeyeceğine karar vermek
Hedef kitle: Karar vericiler, fon sağlayıcılar, politika yapıcılar
Sorular: "Program amaçlarına ulaştı mı?", "Program sürdürülmeli mi?"
Yöntemler: Ön test-son test karşılaştırması, kontrol gruplu tasarımlar, maliyet analizi

Creswell (2009), çoğu kapsamlı değerlendirme projesinin hem formatif hem de sümatif öğeler içerdiğini belirtir. Program geliştirilirken formatif geri bildirim sağlanır, program olgunlaştıktan sonra ise sümatif değerlendirme yapılır.

Stufflebeam'in CIPP Modeli

Daniel Stufflebeam tarafından geliştirilen CIPP modeli, program değerlendirmesinin en kapsamlı ve yaygın kullanılan çerçevelerinden biridir. CIPP, dört değerlendirme boyutunun baş harflerinden oluşur: Context (Bağlam), Input (Girdi), Process (Süreç), Product (Ürün).

Bağlam Değerlendirmesi (Context Evaluation)

Bağlam değerlendirmesi, programın ihtiyaç ve koşullarını analiz eder. Cohen, Manion ve Morrison'a (2007) göre bu aşamada şu sorulara yanıt aranır:

Programın hitap ettiği ihtiyaçlar nelerdir?
Hedef kitlenin özellikleri ve gereksinimleri nelerdir?
Mevcut koşullar ve kaynaklar nelerdir?
Programın amaçları hedef kitlenin ihtiyaçlarıyla uyumlu mudur?

Girdi Değerlendirmesi (Input Evaluation)

Girdi değerlendirmesi, programın tasarımını ve kaynaklarını inceler:

Programın stratejisi ve planı uygun mudur?
Alternatif yaklaşımlar değerlendirilmiş midir?
İnsan kaynakları, bütçe ve materyal yeterli midir?
Program tasarımı araştırma kanıtlarına dayanıyor mudur?

Süreç Değerlendirmesi (Process Evaluation)

Süreç değerlendirmesi, programın uygulama kalitesini izler:

Program plana uygun olarak uygulanıyor mu?
Uygulama sürecinde hangi sorunlar yaşanıyor?
Katılımcıların programa katılım düzeyi nedir?
Program faaliyetleri zamanında ve etkili biçimde gerçekleştiriliyor mu?

Ürün Değerlendirmesi (Product Evaluation)

Ürün değerlendirmesi, programın sonuçlarını ve etkilerini ölçer:

Program amaçlarına ulaştı mı?
Hedef kitle üzerinde beklenen değişimler gerçekleşti mi?
Beklenmeyen olumlu veya olumsuz sonuçlar var mıdır?
Programın uzun vadeli etkileri nelerdir?

Creswell (2009), CIPP modelinin güçlü yönünün değerlendirmeyi tek bir noktayla sınırlamaması ve programın tüm yaşam döngüsünü kapsayan bütüncül bir çerçeve sunması olduğunu belirtir.

Mantık Modeli (Logic Model)

Mantık modeli, bir programın bileşenleri arasındaki nedensel ilişkileri görsel olarak gösteren bir şemadır. W.K. Kellogg Vakfı tarafından yaygınlaştırılan bu model, beş temel bileşenden oluşur:

Bileşen	Tanım	Örnek (Öğretmen Eğitim Programı)
Girdiler (Inputs)	Programa ayrılan kaynaklar	Bütçe, eğitimciler, materyaller, teknoloji
Faaliyetler (Activities)	Program kapsamında gerçekleştirilen eylemler	Atölye çalışmaları, mentorluk, çevrimiçi modüller
Çıktılar (Outputs)	Faaliyetlerin doğrudan ürünleri	Eğitilen öğretmen sayısı, tamamlanan modüller
Sonuçlar (Outcomes)	Kısa ve orta vadeli değişimler	Öğretmen bilgi artışı, sınıf uygulamalarında değişim
Etki (Impact)	Uzun vadeli ve geniş kapsamlı değişimler	Öğrenci başarısında artış, eğitim kalitesinde iyileşme

Cohen, Manion ve Morrison (2007), mantık modelinin değerlendirme sürecini kolaylaştırdığını çünkü hangi aşamada hangi verilerin toplanması gerektiğini açıkça gösterdiğini belirtir. Mantık modeli, formatif ve sümatif değerlendirmenin her ikisinde de kullanılabilir.

İhtiyaç Analizi (Needs Assessment)

İhtiyaç analizi, bir program tasarlanmadan önce hedef kitlenin mevcut durumu ile istenen durum arasındaki boşluğu belirleme sürecidir. Creswell'e (2009) göre ihtiyaç analizi, değerlendirme araştırmasının ilk adımıdır ve şu aşamalardan oluşur:

Mevcut durum analizi: Hedef kitlenin mevcut bilgi, beceri veya koşulları belirlenir
İstenen durum belirleme: Standartlar, beklentiler veya hedefler tanımlanır
Boşluk analizi: Mevcut ile istenen durum arasındaki fark hesaplanır
Önceliklendirme: İhtiyaçlar aciliyet ve önem sırasına göre sıralanır
Çözüm önerisi: İhtiyaçları karşılayacak program veya müdahale tasarlanır

İhtiyaç analizi için kullanılan veri toplama yöntemleri arasında anketler, odak grup görüşmeleri, mevcut veri analizi, uzman panelleri ve gözlem yer alır.

Hedeften Bağımsız Değerlendirme (Goal-Free Evaluation)

Michael Scriven tarafından önerilen hedeften bağımsız değerlendirme, geleneksel hedefe dayalı değerlendirmeye bir alternatif olarak geliştirilmiştir. Bu yaklaşımda değerlendirmeci, programın belirtilen amaçlarını bilmeden değerlendirme yapar. Cohen, Manion ve Morrison'a (2007) göre bunun gerekçesi şudur: Amaçları bilerek yapılan değerlendirmede, değerlendirmeci yalnızca bu amaçlara odaklanır ve beklenmeyen etkileri gözden kaçırabilir.

Hedeften bağımsız değerlendirmenin temel ilkeleri şunlardır:

Değerlendirmeci, programın hedeflerini önceden öğrenmez
Programın tüm etkileri, beklenen ve beklenmeyen olarak belgelenir
Değerlendirme, programın gerçekte ne yaptığına odaklanır, ne yapması gerektiğine değil
Tüketici odaklıdır: Programdan etkilenenlerin deneyimleri ön plandadır

Duyarlı Değerlendirme (Responsive Evaluation)

Robert Stake tarafından geliştirilen duyarlı değerlendirme, standart değerlendirme modellerinin paydaşların gerçek endişelerini ve sorularını yeterince ele almadığı eleştirisine dayanır. Creswell (2009), bu yaklaşımın nitel araştırma geleneklerinden beslendiğini ve doğalcı (naturalistic) bir perspektif benimsediğini belirtir.

Duyarlı değerlendirmenin temel özellikleri şunlardır:

Paydaş merkezli: Değerlendirme soruları, önceden belirlenen standartlardan değil paydaşların endişelerinden doğar
Doğalcı yöntemler: Gözlem, görüşme ve doğal ortam verileri tercih edilir
Çoklu perspektif: Farklı paydaş gruplarının bakış açıları eşit olarak temsil edilir
Sürekli etkileşim: Değerlendirmeci, süreç boyunca paydaşlarla sürekli iletişim halindedir
Esnek tasarım: Değerlendirme planı, süreçte ortaya çıkan bulgulara göre uyarlanır

Güçlendirme Değerlendirmesi (Empowerment Evaluation)

David Fetterman tarafından geliştirilen güçlendirme değerlendirmesi, program katılımcılarının kendi programlarını değerlendirme kapasitelerini geliştirmeyi hedefler. Bu yaklaşımda değerlendirmeci, dışarıdan bir uzman olarak yargıda bulunmak yerine, paydaşların kendi değerlendirme becerilerini geliştirmelerine yardımcı olan bir kolaylaştırıcı rolü üstlenir.

Cohen, Manion ve Morrison'a (2007) göre güçlendirme değerlendirmesinin temel ilkeleri şunlardır:

İyileştirme odağı: Hesap verebilirlikten çok program iyileştirmeye odaklanır
Topluluk sahipliği: Program katılımcıları değerlendirme sürecinin sahibidir
Demokratik katılım: Tüm paydaşların sesleri duyulur
Sosyal adalet: Dezavantajlı grupların güçlendirilmesi hedeflenir
Kapasite geliştirme: Katılımcılar değerlendirme becerisi kazanır

Kullanım Odaklı Değerlendirme (Utilization-Focused Evaluation)

Michael Quinn Patton tarafından geliştirilen kullanım odaklı değerlendirme, değerlendirme bulgularının gerçekten kullanılmasını sağlamayı en önemli öncelik olarak görür. Creswell (2009), pek çok değerlendirme raporunun raf süsü olarak kaldığı eleştirisinin bu yaklaşımın doğuşuna yol açtığını belirtir.

Bu yaklaşımın temel ilkeleri şunlardır:

Birincil kullanıcı belirleme: Değerlendirme bulgularını kim kullanacak? Bu kişiler sürece baştan dahil edilir
Kullanım amacı: Bulgular hangi kararları bilgilendirecek? Somut kullanım senaryoları belirlenir
Yöntem esnekliği: En "doğru" yöntem değil, en "yararlı" yöntem seçilir
Süreç kullanımı: Yalnızca bulgular değil, değerlendirme sürecinin kendisi de öğrenme fırsatı yaratır

Değerlendirmede Karma Yöntem Kullanımı

Creswell (2009), program değerlendirmesinin karma yöntem (mixed methods) araştırmanın en doğal uygulama alanlarından biri olduğunu belirtir. Değerlendirme soruları genellikle hem "ne kadar etkili?" (nicel) hem de "nasıl ve neden?" (nitel) boyutlarını içerir. Değerlendirmede karma yöntem kullanımının avantajları şunlardır:

Tamamlayıcılık: Nicel veriler programın etkisini ölçerken, nitel veriler bu etkinin nasıl ve neden gerçekleştiğini açıklar
Geçerlik: Farklı yöntemlerden elde edilen bulguların tutarlılığı, sonuçlara güveni artırır
Kapsamlılık: Programın farklı boyutları farklı yöntemlerle daha iyi yakalanır
Paydaş çeşitliliği: Farklı paydaş grupları farklı tür kanıtlara değer verir

Maliyet-Etkinlik ve Maliyet-Fayda Analizi

Program değerlendirmesinin önemli bir bileşeni, programın ekonomik değerini belirlemektir. Cohen, Manion ve Morrison (2007), iki temel ekonomik analiz türünü tanımlar:

Maliyet-Etkinlik Analizi (Cost-Effectiveness Analysis)

Bu analizde programın maliyetleri, belirli bir çıktı birimiyle karşılaştırılır. Örneğin, "bir öğrencinin başarı puanını 10 birim artırmanın maliyeti nedir?" sorusuna yanıt aranır. Farklı programlar aynı çıktı birimi üzerinden karşılaştırılabilir.

Maliyet-Fayda Analizi (Cost-Benefit Analysis)

Bu analizde hem maliyetler hem de faydalar parasal değerlere dönüştürülür. Bir eğitim programının maliyeti ile mezunlarının elde edeceği yaşam boyu gelir artışı karşılaştırılabilir. Fayda-maliyet oranı 1'in üzerindeyse program ekonomik olarak değerlidir.

Değerlendirme Modellerinin Karşılaştırması

Model	Odak	Değerlendirmecinin Rolü	Güçlü Yönü	Sınırlılığı
CIPP	Bağlam, girdi, süreç, ürün	Sistematik analist	Kapsamlı çerçeve	Zaman ve kaynak yoğun
Hedeften bağımsız	Tüm etkiler	Bağımsız gözlemci	Beklenmeyen etkileri yakalar	Odak eksikliği riski
Duyarlı	Paydaş endişeleri	Kolaylaştırıcı, dinleyici	Bağlama duyarlı	Genellenebilirlik düşük
Güçlendirme	Kapasite geliştirme	Koç, mentor	Sürdürülebilir kapasite	Nesnellik eleştirisi
Kullanım odaklı	Bulguların kullanımı	Stratejik danışman	Pratik yararlılık	Akademik titizlik riski
Mantık modeli	Nedensel zincir	Analitik tasarımcı	Görsel netlik	Doğrusal varsayım

Değerlendirme Araştırması Yürütme Adımları

Creswell (2009) ve Cohen, Manion ve Morrison'un (2007) önerileri temelinde program değerlendirmesi şu adımları izler:

Değerlendirme amacını belirleme: Formatif mi sümatif mi? Hangi kararları bilgilendirecek?
Paydaşları tanımlama: Kim etkileniyor? Kim karar veriyor? Kim bilgi istiyor?
Değerlendirme sorularını oluşturma: Paydaş endişeleri ve program hedefleriyle uyumlu sorular
Değerlendirme tasarımını belirleme: Hangi model kullanılacak? Hangi yöntemler uygun?
Veri toplama araçlarını geliştirme: Anketler, görüşme formları, gözlem protokolleri, doküman analiz çerçeveleri
Veri toplama: Sistematik ve planlı biçimde veri toplamak
Veri analizi: Nicel ve/veya nitel analiz teknikleri
Bulguları yorumlama: Değer yargıları ve öneriler
Raporlama ve iletişim: Farklı paydaş grupları için uygun formatlarda raporlama
Takip: Bulguların kullanılıp kullanılmadığını izleme

Değerlendirme Araştırması ile Eylem Araştırması Arasındaki Fark

Değerlendirme araştırması sıklıkla eylem araştırmasıyla (action research) karıştırılır. Her iki yaklaşım da uygulamaya yönelik olsa da önemli farkları vardır:

Boyut	Değerlendirme Araştırması	Eylem Araştırması
Başlatan	Genellikle dış değerlendirmeci veya fon sağlayıcı	Uygulayıcının kendisi
Odak	Programın etkililiği ve değeri	Kendi uygulamasını iyileştirme
Döngüsellik	Genellikle tek seferlik veya periyodik	Sürekli planlama-uygulama-gözlem-yansıtma döngüsü
Katılım	Paydaş katılımı değişir	Uygulayıcı merkezdedir

Paydaş Katılımı

Cohen, Manion ve Morrison (2007), başarılı bir değerlendirmenin paydaş katılımını etkin biçimde yönetmesine bağlı olduğunu vurgular. Temel paydaş grupları şunlardır:

Program geliştiriciler: Programı tasarlayan ve uygulayan kişiler
Program katılımcıları: Programdan doğrudan yararlananlar (öğrenciler, hastalar vb.)
Fon sağlayıcılar: Programa mali kaynak sağlayan kurumlar
Karar vericiler: Programın devamı hakkında karar verecek yöneticiler
Topluluk: Programdan dolaylı olarak etkilenen geniş topluluk

Pratik Örnek: Eğitim Programı Değerlendirmesi

Bir üniversitenin yeni uygulamaya koyduğu "Öğretmen Adayları İçin Dijital Yeterlilik Programı"nın CIPP modeli ile değerlendirildiğini düşünelim:

Bağlam: Öğretmen adaylarının dijital yetkinlik düzeyleri, MEB standartları ile karşılaştırılır; ihtiyaç analizi yapılır. Girdi: Programın müfredatı, eğitimci yetkinlikleri, teknolojik altyapı ve bütçe incelenir. Süreç: Uygulama sırasında gözlemler, katılımcı geri bildirimleri ve katılım verileri toplanır. Ürün: Programın sonunda dijital yetkinlik testleri, öğretmenlik uygulamasında teknoloji kullanım düzeyi ve katılımcı memnuniyeti ölçülür. Creswell'in (2009) önerdiği gibi karma yöntem kullanılarak hem nicel başarı verileri hem de nitel deneyim anlatıları toplanır.

Sonuç

Değerlendirme araştırması, sosyal programların etkililiğini ve değerini sistematik olarak belirleyen uygulamalı bir araştırma alanıdır. Stufflebeam'in CIPP modeli kapsamlı bir çerçeve sunarken, Scriven'ın hedeften bağımsız değerlendirmesi beklenmeyen etkileri yakalamaya, Stake'in duyarlı değerlendirmesi paydaş endişelerine odaklanmaya, Fetterman'ın güçlendirme değerlendirmesi katılımcı kapasitesini geliştirmeye ve Patton'ın kullanım odaklı değerlendirmesi bulguların pratikte kullanılmasını sağlamaya yöneliktir. Cohen, Manion ve Morrison'un (2007) vurguladığı gibi, hiçbir değerlendirme modeli her duruma uygun değildir; araştırmacının programın bağlamını, paydaşların ihtiyaçlarını ve değerlendirmenin amacını dikkatle analiz ederek en uygun modeli veya model kombinasyonunu seçmesi gerekmektedir. Creswell'in (2009) belirttiği gibi, değerlendirme araştırmasının nihai amacı yalnızca bilimsel bilgi üretmek değil, somut iyileştirmelere ve bilinçli kararlara katkıda bulunmaktır.

Değerlendirme Araştırması: Program Değerlendirme Modelleri ve Uygulamaları