Araştırma Yöntemleri

Değerlendirme Araştırması: Program Değerlendirme Modelleri ve Uygulamaları

PNPeda Network·12 Şubat 2026·0 görüntülenme·
Değerlendirme Araştırması: Program Değerlendirme Modelleri ve Uygulamaları

Değerlendirme araştırması (evaluation research), bir programın, projenin, politikanın veya müdahalenin etkililiğini, verimliliğini ve değerini sistematik olarak belirleme sürecidir. Temel araştırmadan farklı olarak, değerlendirme araştırmasının birincil amacı evrensel bilgi üretmek değil, belirli bir programın iyileştirilmesi veya devam edip etmeyeceği hakkında karar vermeye yardımcı olmaktır. Cohen, Manion ve Morrison (2007), değerlendirme araştırmasını "belirli bir bağlamda belirli bir amaca yönelik sistematik kanıt toplama ve yorumlama süreci" olarak tanımlar. Bu yazıda, program değerlendirmenin temel kavramlarını, başlıca modellerini ve pratik uygulama adımlarını kapsamlı biçimde ele alacağız.

Değerlendirme Araştırması Nedir?

Değerlendirme araştırması, sosyal bilimler yöntemlerini kullanarak bir müdahalenin planlama, uygulama ve sonuç aşamalarını inceleme sürecidir. Creswell'e (2009) göre değerlendirme araştırması, nicel ve nitel yöntemlerin her ikisini de kullanabilen uygulamalı bir araştırma türüdür. Değerlendirme araştırmasının temel sorusu şudur: "Bu program amaçlarına ulaşıyor mu ve paydaşlarına değer katıyor mu?"

Temel Araştırma ile Değerlendirme Araştırması Arasındaki Farklar

BoyutTemel AraştırmaDeğerlendirme Araştırması
AmaçEvrensel bilgi üretmekBelirli bir program hakkında karar vermek
GenellenebilirlikGeniş popülasyonlara genelleme hedeflenirBelirli bir bağlama odaklanılır
Paydaş rolüGenellikle sınırlıdırMerkezi bir konumdadır
Değer yargısıKaçınılırAçıkça ifade edilir
KullanımLiteratüre katkıProgram iyileştirme ve hesap verebilirlik
ZamanlamaAraştırmacı belirlerProgram döngüsüne bağlıdır

Cohen, Manion ve Morrison (2007), değerlendirme araştırmasının hem bir araştırma faaliyeti hem de bir yönetim aracı olduğunu vurgular. Bu ikili doğa, değerlendirme araştırmasını diğer araştırma türlerinden ayıran temel özelliktir.

Formatif ve Sümatif Değerlendirme

Michael Scriven (1967) tarafından önerilen bu ayrım, program değerlendirmesinin en temel sınıflandırmasıdır.

Formatif Değerlendirme

Formatif değerlendirme, bir programın geliştirilmesi ve iyileştirilmesi amacıyla uygulama sürecinde gerçekleştirilen değerlendirmedir. Cohen, Manion ve Morrison'a (2007) göre formatif değerlendirmenin temel özellikleri şunlardır:

  • Zamanlama: Program uygulanırken yapılır
  • Amaç: Programı iyileştirmek, zayıf yönleri tespit etmek
  • Hedef kitle: Program geliştiriciler ve uygulayıcılar
  • Sorular: "Program nasıl daha iyi hale getirilebilir?", "Hangi bileşenler sorunlu?"
  • Yöntemler: Gözlem, görüşme, pilot uygulama verileri, süreç analizi

Sümatif Değerlendirme

Sümatif değerlendirme, bir programın genel etkililiğini ve değerini belirlemek amacıyla program tamamlandıktan sonra veya belirli bir dönemin sonunda gerçekleştirilir. Temel özellikleri şunlardır:

  • Zamanlama: Program tamamlandıktan sonra veya dönem sonunda yapılır
  • Amaç: Programın devam edip etmeyeceğine karar vermek
  • Hedef kitle: Karar vericiler, fon sağlayıcılar, politika yapıcılar
  • Sorular: "Program amaçlarına ulaştı mı?", "Program sürdürülmeli mi?"
  • Yöntemler: Ön test-son test karşılaştırması, kontrol gruplu tasarımlar, maliyet analizi

Creswell (2009), çoğu kapsamlı değerlendirme projesinin hem formatif hem de sümatif öğeler içerdiğini belirtir. Program geliştirilirken formatif geri bildirim sağlanır, program olgunlaştıktan sonra ise sümatif değerlendirme yapılır.

Stufflebeam'in CIPP Modeli

Daniel Stufflebeam tarafından geliştirilen CIPP modeli, program değerlendirmesinin en kapsamlı ve yaygın kullanılan çerçevelerinden biridir. CIPP, dört değerlendirme boyutunun baş harflerinden oluşur: Context (Bağlam), Input (Girdi), Process (Süreç), Product (Ürün).

Bağlam Değerlendirmesi (Context Evaluation)

Bağlam değerlendirmesi, programın ihtiyaç ve koşullarını analiz eder. Cohen, Manion ve Morrison'a (2007) göre bu aşamada şu sorulara yanıt aranır:

  • Programın hitap ettiği ihtiyaçlar nelerdir?
  • Hedef kitlenin özellikleri ve gereksinimleri nelerdir?
  • Mevcut koşullar ve kaynaklar nelerdir?
  • Programın amaçları hedef kitlenin ihtiyaçlarıyla uyumlu mudur?

Girdi Değerlendirmesi (Input Evaluation)

Girdi değerlendirmesi, programın tasarımını ve kaynaklarını inceler:

  • Programın stratejisi ve planı uygun mudur?
  • Alternatif yaklaşımlar değerlendirilmiş midir?
  • İnsan kaynakları, bütçe ve materyal yeterli midir?
  • Program tasarımı araştırma kanıtlarına dayanıyor mudur?

Süreç Değerlendirmesi (Process Evaluation)

Süreç değerlendirmesi, programın uygulama kalitesini izler:

  • Program plana uygun olarak uygulanıyor mu?
  • Uygulama sürecinde hangi sorunlar yaşanıyor?
  • Katılımcıların programa katılım düzeyi nedir?
  • Program faaliyetleri zamanında ve etkili biçimde gerçekleştiriliyor mu?

Ürün Değerlendirmesi (Product Evaluation)

Ürün değerlendirmesi, programın sonuçlarını ve etkilerini ölçer:

  • Program amaçlarına ulaştı mı?
  • Hedef kitle üzerinde beklenen değişimler gerçekleşti mi?
  • Beklenmeyen olumlu veya olumsuz sonuçlar var mıdır?
  • Programın uzun vadeli etkileri nelerdir?

Creswell (2009), CIPP modelinin güçlü yönünün değerlendirmeyi tek bir noktayla sınırlamaması ve programın tüm yaşam döngüsünü kapsayan bütüncül bir çerçeve sunması olduğunu belirtir.

Mantık Modeli (Logic Model)

Mantık modeli, bir programın bileşenleri arasındaki nedensel ilişkileri görsel olarak gösteren bir şemadır. W.K. Kellogg Vakfı tarafından yaygınlaştırılan bu model, beş temel bileşenden oluşur:

BileşenTanımÖrnek (Öğretmen Eğitim Programı)
Girdiler (Inputs)Programa ayrılan kaynaklarBütçe, eğitimciler, materyaller, teknoloji
Faaliyetler (Activities)Program kapsamında gerçekleştirilen eylemlerAtölye çalışmaları, mentorluk, çevrimiçi modüller
Çıktılar (Outputs)Faaliyetlerin doğrudan ürünleriEğitilen öğretmen sayısı, tamamlanan modüller
Sonuçlar (Outcomes)Kısa ve orta vadeli değişimlerÖğretmen bilgi artışı, sınıf uygulamalarında değişim
Etki (Impact)Uzun vadeli ve geniş kapsamlı değişimlerÖğrenci başarısında artış, eğitim kalitesinde iyileşme

Cohen, Manion ve Morrison (2007), mantık modelinin değerlendirme sürecini kolaylaştırdığını çünkü hangi aşamada hangi verilerin toplanması gerektiğini açıkça gösterdiğini belirtir. Mantık modeli, formatif ve sümatif değerlendirmenin her ikisinde de kullanılabilir.

İhtiyaç Analizi (Needs Assessment)

İhtiyaç analizi, bir program tasarlanmadan önce hedef kitlenin mevcut durumu ile istenen durum arasındaki boşluğu belirleme sürecidir. Creswell'e (2009) göre ihtiyaç analizi, değerlendirme araştırmasının ilk adımıdır ve şu aşamalardan oluşur:

  1. Mevcut durum analizi: Hedef kitlenin mevcut bilgi, beceri veya koşulları belirlenir
  2. İstenen durum belirleme: Standartlar, beklentiler veya hedefler tanımlanır
  3. Boşluk analizi: Mevcut ile istenen durum arasındaki fark hesaplanır
  4. Önceliklendirme: İhtiyaçlar aciliyet ve önem sırasına göre sıralanır
  5. Çözüm önerisi: İhtiyaçları karşılayacak program veya müdahale tasarlanır

İhtiyaç analizi için kullanılan veri toplama yöntemleri arasında anketler, odak grup görüşmeleri, mevcut veri analizi, uzman panelleri ve gözlem yer alır.

Hedeften Bağımsız Değerlendirme (Goal-Free Evaluation)

Michael Scriven tarafından önerilen hedeften bağımsız değerlendirme, geleneksel hedefe dayalı değerlendirmeye bir alternatif olarak geliştirilmiştir. Bu yaklaşımda değerlendirmeci, programın belirtilen amaçlarını bilmeden değerlendirme yapar. Cohen, Manion ve Morrison'a (2007) göre bunun gerekçesi şudur: Amaçları bilerek yapılan değerlendirmede, değerlendirmeci yalnızca bu amaçlara odaklanır ve beklenmeyen etkileri gözden kaçırabilir.

Hedeften bağımsız değerlendirmenin temel ilkeleri şunlardır:

  • Değerlendirmeci, programın hedeflerini önceden öğrenmez
  • Programın tüm etkileri, beklenen ve beklenmeyen olarak belgelenir
  • Değerlendirme, programın gerçekte ne yaptığına odaklanır, ne yapması gerektiğine değil
  • Tüketici odaklıdır: Programdan etkilenenlerin deneyimleri ön plandadır

Duyarlı Değerlendirme (Responsive Evaluation)

Robert Stake tarafından geliştirilen duyarlı değerlendirme, standart değerlendirme modellerinin paydaşların gerçek endişelerini ve sorularını yeterince ele almadığı eleştirisine dayanır. Creswell (2009), bu yaklaşımın nitel araştırma geleneklerinden beslendiğini ve doğalcı (naturalistic) bir perspektif benimsediğini belirtir.

Duyarlı değerlendirmenin temel özellikleri şunlardır:

  • Paydaş merkezli: Değerlendirme soruları, önceden belirlenen standartlardan değil paydaşların endişelerinden doğar
  • Doğalcı yöntemler: Gözlem, görüşme ve doğal ortam verileri tercih edilir
  • Çoklu perspektif: Farklı paydaş gruplarının bakış açıları eşit olarak temsil edilir
  • Sürekli etkileşim: Değerlendirmeci, süreç boyunca paydaşlarla sürekli iletişim halindedir
  • Esnek tasarım: Değerlendirme planı, süreçte ortaya çıkan bulgulara göre uyarlanır

Güçlendirme Değerlendirmesi (Empowerment Evaluation)

David Fetterman tarafından geliştirilen güçlendirme değerlendirmesi, program katılımcılarının kendi programlarını değerlendirme kapasitelerini geliştirmeyi hedefler. Bu yaklaşımda değerlendirmeci, dışarıdan bir uzman olarak yargıda bulunmak yerine, paydaşların kendi değerlendirme becerilerini geliştirmelerine yardımcı olan bir kolaylaştırıcı rolü üstlenir.

Cohen, Manion ve Morrison'a (2007) göre güçlendirme değerlendirmesinin temel ilkeleri şunlardır:

  • İyileştirme odağı: Hesap verebilirlikten çok program iyileştirmeye odaklanır
  • Topluluk sahipliği: Program katılımcıları değerlendirme sürecinin sahibidir
  • Demokratik katılım: Tüm paydaşların sesleri duyulur
  • Sosyal adalet: Dezavantajlı grupların güçlendirilmesi hedeflenir
  • Kapasite geliştirme: Katılımcılar değerlendirme becerisi kazanır

Kullanım Odaklı Değerlendirme (Utilization-Focused Evaluation)

Michael Quinn Patton tarafından geliştirilen kullanım odaklı değerlendirme, değerlendirme bulgularının gerçekten kullanılmasını sağlamayı en önemli öncelik olarak görür. Creswell (2009), pek çok değerlendirme raporunun raf süsü olarak kaldığı eleştirisinin bu yaklaşımın doğuşuna yol açtığını belirtir.

Bu yaklaşımın temel ilkeleri şunlardır:

  • Birincil kullanıcı belirleme: Değerlendirme bulgularını kim kullanacak? Bu kişiler sürece baştan dahil edilir
  • Kullanım amacı: Bulgular hangi kararları bilgilendirecek? Somut kullanım senaryoları belirlenir
  • Yöntem esnekliği: En "doğru" yöntem değil, en "yararlı" yöntem seçilir
  • Süreç kullanımı: Yalnızca bulgular değil, değerlendirme sürecinin kendisi de öğrenme fırsatı yaratır

Değerlendirmede Karma Yöntem Kullanımı

Creswell (2009), program değerlendirmesinin karma yöntem (mixed methods) araştırmanın en doğal uygulama alanlarından biri olduğunu belirtir. Değerlendirme soruları genellikle hem "ne kadar etkili?" (nicel) hem de "nasıl ve neden?" (nitel) boyutlarını içerir. Değerlendirmede karma yöntem kullanımının avantajları şunlardır:

  • Tamamlayıcılık: Nicel veriler programın etkisini ölçerken, nitel veriler bu etkinin nasıl ve neden gerçekleştiğini açıklar
  • Geçerlik: Farklı yöntemlerden elde edilen bulguların tutarlılığı, sonuçlara güveni artırır
  • Kapsamlılık: Programın farklı boyutları farklı yöntemlerle daha iyi yakalanır
  • Paydaş çeşitliliği: Farklı paydaş grupları farklı tür kanıtlara değer verir

Maliyet-Etkinlik ve Maliyet-Fayda Analizi

Program değerlendirmesinin önemli bir bileşeni, programın ekonomik değerini belirlemektir. Cohen, Manion ve Morrison (2007), iki temel ekonomik analiz türünü tanımlar:

Maliyet-Etkinlik Analizi (Cost-Effectiveness Analysis)

Bu analizde programın maliyetleri, belirli bir çıktı birimiyle karşılaştırılır. Örneğin, "bir öğrencinin başarı puanını 10 birim artırmanın maliyeti nedir?" sorusuna yanıt aranır. Farklı programlar aynı çıktı birimi üzerinden karşılaştırılabilir.

Maliyet-Fayda Analizi (Cost-Benefit Analysis)

Bu analizde hem maliyetler hem de faydalar parasal değerlere dönüştürülür. Bir eğitim programının maliyeti ile mezunlarının elde edeceği yaşam boyu gelir artışı karşılaştırılabilir. Fayda-maliyet oranı 1'in üzerindeyse program ekonomik olarak değerlidir.

Değerlendirme Modellerinin Karşılaştırması

ModelOdakDeğerlendirmecinin RolüGüçlü YönüSınırlılığı
CIPPBağlam, girdi, süreç, ürünSistematik analistKapsamlı çerçeveZaman ve kaynak yoğun
Hedeften bağımsızTüm etkilerBağımsız gözlemciBeklenmeyen etkileri yakalarOdak eksikliği riski
DuyarlıPaydaş endişeleriKolaylaştırıcı, dinleyiciBağlama duyarlıGenellenebilirlik düşük
GüçlendirmeKapasite geliştirmeKoç, mentorSürdürülebilir kapasiteNesnellik eleştirisi
Kullanım odaklıBulguların kullanımıStratejik danışmanPratik yararlılıkAkademik titizlik riski
Mantık modeliNedensel zincirAnalitik tasarımcıGörsel netlikDoğrusal varsayım

Değerlendirme Araştırması Yürütme Adımları

Creswell (2009) ve Cohen, Manion ve Morrison'un (2007) önerileri temelinde program değerlendirmesi şu adımları izler:

  1. Değerlendirme amacını belirleme: Formatif mi sümatif mi? Hangi kararları bilgilendirecek?
  2. Paydaşları tanımlama: Kim etkileniyor? Kim karar veriyor? Kim bilgi istiyor?
  3. Değerlendirme sorularını oluşturma: Paydaş endişeleri ve program hedefleriyle uyumlu sorular
  4. Değerlendirme tasarımını belirleme: Hangi model kullanılacak? Hangi yöntemler uygun?
  5. Veri toplama araçlarını geliştirme: Anketler, görüşme formları, gözlem protokolleri, doküman analiz çerçeveleri
  6. Veri toplama: Sistematik ve planlı biçimde veri toplamak
  7. Veri analizi: Nicel ve/veya nitel analiz teknikleri
  8. Bulguları yorumlama: Değer yargıları ve öneriler
  9. Raporlama ve iletişim: Farklı paydaş grupları için uygun formatlarda raporlama
  10. Takip: Bulguların kullanılıp kullanılmadığını izleme

Değerlendirme Araştırması ile Eylem Araştırması Arasındaki Fark

Değerlendirme araştırması sıklıkla eylem araştırmasıyla (action research) karıştırılır. Her iki yaklaşım da uygulamaya yönelik olsa da önemli farkları vardır:

BoyutDeğerlendirme AraştırmasıEylem Araştırması
BaşlatanGenellikle dış değerlendirmeci veya fon sağlayıcıUygulayıcının kendisi
OdakProgramın etkililiği ve değeriKendi uygulamasını iyileştirme
DöngüsellikGenellikle tek seferlik veya periyodikSürekli planlama-uygulama-gözlem-yansıtma döngüsü
KatılımPaydaş katılımı değişirUygulayıcı merkezdedir

Paydaş Katılımı

Cohen, Manion ve Morrison (2007), başarılı bir değerlendirmenin paydaş katılımını etkin biçimde yönetmesine bağlı olduğunu vurgular. Temel paydaş grupları şunlardır:

  • Program geliştiriciler: Programı tasarlayan ve uygulayan kişiler
  • Program katılımcıları: Programdan doğrudan yararlananlar (öğrenciler, hastalar vb.)
  • Fon sağlayıcılar: Programa mali kaynak sağlayan kurumlar
  • Karar vericiler: Programın devamı hakkında karar verecek yöneticiler
  • Topluluk: Programdan dolaylı olarak etkilenen geniş topluluk

Pratik Örnek: Eğitim Programı Değerlendirmesi

Bir üniversitenin yeni uygulamaya koyduğu "Öğretmen Adayları İçin Dijital Yeterlilik Programı"nın CIPP modeli ile değerlendirildiğini düşünelim:

Bağlam: Öğretmen adaylarının dijital yetkinlik düzeyleri, MEB standartları ile karşılaştırılır; ihtiyaç analizi yapılır. Girdi: Programın müfredatı, eğitimci yetkinlikleri, teknolojik altyapı ve bütçe incelenir. Süreç: Uygulama sırasında gözlemler, katılımcı geri bildirimleri ve katılım verileri toplanır. Ürün: Programın sonunda dijital yetkinlik testleri, öğretmenlik uygulamasında teknoloji kullanım düzeyi ve katılımcı memnuniyeti ölçülür. Creswell'in (2009) önerdiği gibi karma yöntem kullanılarak hem nicel başarı verileri hem de nitel deneyim anlatıları toplanır.

Sonuç

Değerlendirme araştırması, sosyal programların etkililiğini ve değerini sistematik olarak belirleyen uygulamalı bir araştırma alanıdır. Stufflebeam'in CIPP modeli kapsamlı bir çerçeve sunarken, Scriven'ın hedeften bağımsız değerlendirmesi beklenmeyen etkileri yakalamaya, Stake'in duyarlı değerlendirmesi paydaş endişelerine odaklanmaya, Fetterman'ın güçlendirme değerlendirmesi katılımcı kapasitesini geliştirmeye ve Patton'ın kullanım odaklı değerlendirmesi bulguların pratikte kullanılmasını sağlamaya yöneliktir. Cohen, Manion ve Morrison'un (2007) vurguladığı gibi, hiçbir değerlendirme modeli her duruma uygun değildir; araştırmacının programın bağlamını, paydaşların ihtiyaçlarını ve değerlendirmenin amacını dikkatle analiz ederek en uygun modeli veya model kombinasyonunu seçmesi gerekmektedir. Creswell'in (2009) belirttiği gibi, değerlendirme araştırmasının nihai amacı yalnızca bilimsel bilgi üretmek değil, somut iyileştirmelere ve bilinçli kararlara katkıda bulunmaktır.

Kaynaklar

Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach (5th ed.). Cengage Learning.Cohen, L., Manion, L., & Morrison, K. (2007). Research methods in education (6th ed.). Routledge.Creswell, J. W. (2009). Research design: Qualitative, quantitative, and mixed methods approaches (3rd ed.). SAGE.Goundar, S. (2012). Research methodology and research method. Victoria University of Wellington.

Yorumlar (0)

Yorum yapmak için giriş yapmalısınız.