Araştırma Yöntemleri

Ölçme ve Ölçekleme Teknikleri: Thurstone, Guttman, Semantik Farklılık

PNPeda Network·13 Şubat 2026·0 görüntülenme·
Ölçme ve Ölçekleme Teknikleri: Thurstone, Guttman, Semantik Farklılık

Bilimsel araştırmalarda soyut kavramları ölçülebilir hale getirmek, araştırma sürecinin en kritik aşamalarından biridir. Ölçme, gözlemlenen özelliklere belirli kurallar çerçevesinde sayılar veya semboller atama işlemi olarak tanımlanır. Ölçekleme ise bu ölçme işlemini sistematik hale getiren teknik ve yöntemlerin bütününü ifade eder. Kothari'ye (2004) göre ölçekleme, "araştırmacının ilgilendiği kavramları ölçülebilir biçimde operasyonelleştirmesinin temel aracıdır." Bu yazıda, araştırmalarda yaygın olarak kullanılan ölçme düzeylerini ve ölçekleme tekniklerini kapsamlı biçimde ele alacağız.

Ölçme Düzeyleri

Stevens'ın (1946) klasik sınıflandırmasına göre ölçme düzeyleri dört kategoride ele alınır. Her düzey, farklı matematiksel işlemlere ve istatistiksel analizlere olanak tanır. Jackson (2015), araştırmacıların veri toplama aracı geliştirmeden önce ölçme düzeyini doğru biçimde belirlemesi gerektiğini vurgular.

Ölçme DüzeyiTanımÖzelliklerÖrnekUygun İstatistikler
Sınıflama (Nominal)Nesneleri kategorilere ayırmaEşitlik/farklılık belirlenir; sıralama yokturCinsiyet, medeni durum, kan grubuFrekans, mod, ki-kare
Sıralama (Ordinal)Nesneleri büyüklük sırasına koymaSıralama var; aralıklar eşit değilEğitim düzeyi, rütbe, sınıf sıralamasıMedyan, yüzdelik, Spearman korelasyon
Eşit Aralıklı (Interval)Eşit aralıklarla ölçmeSıralama ve eşit aralıklar var; mutlak sıfır yokSıcaklık (Celsius), IQ puanı, takvim yılıOrtalama, standart sapma, Pearson korelasyon
Oransal (Ratio)Gerçek sıfır noktası olan ölçmeTüm matematiksel işlemler uygulanabilirBoy, kilo, yaş, gelirGeometrik ortalama, varyasyon katsayısı

Önemli Not: Kothari'ye (2004) göre, sosyal bilimlerde kullanılan tutum ölçeklerinin (Likert, Thurstone vb.) ölçme düzeyi tartışmalıdır. Bu ölçekler genellikle ordinal düzeyde veri üretir; ancak pratikte sıklıkla eşit aralıklı (interval) gibi ele alınır ve parametrik istatistikler uygulanır. Bu uygulama, alan yazında süregelen bir tartışma konusudur.

Likert Ölçeği

Rensis Likert tarafından 1932 yılında geliştirilen bu ölçek, tutum ölçümünde en yaygın kullanılan tekniklerden biridir. Likert ölçeği, bireylerin belirli ifadelere ne ölçüde katıldıklarını derecelendirmeleri ilkesine dayanır.

Likert Ölçeği Yapısı

Tipik bir Likert ölçeği şu bileşenlerden oluşur:

  • İfade (madde): Tutumu yansıtan olumlu veya olumsuz bir cümle
  • Derecelendirme: Genellikle 5 veya 7 basamaklı bir ölçek (1 = Kesinlikle Katılmıyorum, 5 = Kesinlikle Katılıyorum)
  • Puanlama: Olumlu maddeler doğrudan, olumsuz maddeler ters kodlanarak puanlanır
  • Toplam puan: Tüm madde puanlarının toplamı veya ortalaması, bireyin tutumunu temsil eder

Likert Ölçeği Geliştirme Adımları

  1. Madde havuzu oluşturma: Ölçülmek istenen tutumla ilgili çok sayıda madde yazın (genellikle nihai ölçeğin 2-3 katı).
  2. Uzman görüşü alma: Maddeleri alan uzmanlarına inceletin ve kapsam geçerliğini sağlayın.
  3. Pilot uygulama: Madde havuzunu hedef kitleye benzer bir grupta uygulayın.
  4. Madde analizi: Madde-toplam korelasyonlarını hesaplayın; düşük korelasyonlu maddeleri çıkarın.
  5. Faktör analizi: Ölçeğin yapı geçerliğini test etmek için açımlayıcı ve doğrulayıcı faktör analizi yapın.
  6. Güvenirlik analizi: Cronbach alfa katsayısını hesaplayın (genellikle .70 ve üzeri kabul edilir).

Jackson'a (2015) göre Likert ölçeğinin en büyük avantajı, uygulaması ve puanlamasının kolay olmasıdır. Ancak tepki setleri (acquiescence bias), sosyal beğenirlik ve merkeze yığılma eğilimi gibi sınırlılıkları da göz ardı edilmemelidir.

Thurstone Eşit Görünen Aralıklar Ölçeği

Louis Leon Thurstone tarafından 1928 yılında geliştirilen bu teknik, ölçekleme tarihindeki ilk sistematik tutum ölçeği olarak kabul edilir. Kothari (2004), Thurstone ölçeğinin Likert'e kıyasla daha karmaşık bir geliştirme süreci gerektirdiğini belirtir.

Thurstone Ölçeği Geliştirme Süreci

  1. Madde yazımı: Ölçülecek tutumla ilgili çok sayıda (genellikle 100+) ifade yazılır.
  2. Yargıcı değerlendirmesi: Her ifade, çok sayıda (genellikle 50-300) yargıcı tarafından 1 (en olumsuz) ile 11 (en olumlu) arasında bir ölçekte değerlendirilir. Yargıcılar kendi tutumlarını değil, ifadenin olumlu-olumsuz derecesini belirler.
  3. Ölçek değerlerinin hesaplanması: Her ifadenin medyan değeri, o ifadenin ölçek değeri olur.
  4. Belirsiz maddelerin çıkarılması: Yarı-çeyrekler arası genişliği (Q değeri) yüksek olan, yani yargıcılar arasında tutarsızlık yaratan maddeler elenir.
  5. Nihai ölçek: 1'den 11'e kadar eşit aralıklarla dağılan yaklaşık 20-22 madde seçilir.
  6. Uygulama: Katılımcı, katıldığı maddeleri işaretler; katıldığı maddelerin ölçek değerlerinin ortalaması, bireyin tutum puanını verir.

Thurstone Ölçeğinin Özellikleri

  • Eşit aralıklı (interval) düzeyde ölçüm sağladığı kabul edilir
  • Geliştirme süreci çok uzun ve zahmetlidir
  • Yargıcıların kendi tutumlarından etkilenme riski bulunur
  • Günümüzde Likert ölçeğine kıyasla çok daha az kullanılmaktadır

Guttman Ölçeği (Scalogram Analizi)

Louis Guttman tarafından 1940'larda geliştirilen bu ölçek, birikimli (cumulative) bir yapıya sahiptir. Guttman ölçeğinde maddeler, kolaydan zora veya hafiften şiddetliye doğru sıralanır ve bir bireyin belirli bir maddeyi onaylaması, o maddeden daha kolay tüm maddeleri de onayladığı anlamına gelir.

Guttman Ölçeğinin Mantığı

Kothari'ye (2004) göre Guttman ölçeğinin temel varsayımı tek boyutluluktur: Ölçek, yalnızca tek bir boyutu ölçer ve maddeler bu boyut üzerinde hiyerarşik olarak sıralanır. Örneğin, fiziksel engellilik düzeyini ölçen bir Guttman ölçeği şöyle olabilir:

  1. Yataktan kalkabiliyorum (en kolay)
  2. Oda içinde yürüyebiliyorum
  3. Merdiven çıkabiliyorum
  4. 500 metre yürüyebiliyorum
  5. 1 kilometre koşabiliyorum (en zor)

Bu örnekte, 4. maddeyi onaylayan bir birey, mantıken 1, 2 ve 3. maddeleri de onaylıyor olmalıdır.

Tekrarlanabilirlik Katsayısı

Guttman ölçeğinin kalitesi, tekrarlanabilirlik katsayısı (coefficient of reproducibility) ile değerlendirilir. Bu katsayı, bireylerin toplam puanlarından yanıt kalıplarının ne ölçüde tahmin edilebildiğini gösterir. Genellikle .90 ve üzeri bir değer, kabul edilebilir bir Guttman ölçeği için gereklidir.

Guttman Ölçeğinin Avantaj ve Sınırlılıkları

AvantajlarSınırlılıklar
Tek boyutluluk sağlarMükemmel birikimlilik elde etmek çok zordur
Puandan yanıt kalıbı tahmin edilebilirÇok az konu gerçek bir Guttman ölçeğine uyar
Ordinalden daha güçlü ölçüm sağlarMadde geliştirme süreci karmaşıktır
Yapı geçerliği kanıtı sunarMadde sayısı genellikle sınırlı kalır

Semantik Farklılık Ölçeği (Osgood)

Charles Osgood ve arkadaşları tarafından 1957 yılında geliştirilen Semantik Farklılık (Semantic Differential) ölçeği, kavramlara yüklenen anlamları ölçmek için kullanılır. Creswell (2009), bu tekniğin özellikle tutum, algı ve imaj araştırmalarında etkili olduğunu belirtir.

Semantik Farklılık Ölçeğinin Yapısı

Bu ölçekte, bir kavram (örneğin "uzaktan eğitim") birbirine zıt sıfat çiftleri arasında değerlendirilir. Genellikle 7 basamaklı bir ölçek kullanılır:

Örnek:

1234567
İyiKötü
GüçlüZayıf
HızlıYavaş
AktifPasif

Osgood'un Üç Temel Boyutu

Osgood'un kapsamlı çalışmaları, anlamın üç temel boyutta organize olduğunu ortaya koymuştur:

  • Değerlendirme (Evaluation): İyi-kötü, güzel-çirkin, temiz-kirli
  • Güç/Potansiyel (Potency): Güçlü-zayıf, büyük-küçük, ağır-hafif
  • Etkinlik (Activity): Hızlı-yavaş, aktif-pasif, sıcak-soğuk

Semantik Farklılık Ölçeğinin Avantajları

  • Farklı kavramlar arasında doğrudan karşılaştırma yapılabilir
  • Kültürler arası çalışmalarda kullanılabilir
  • Hem bireysel hem de grup düzeyinde analiz yapılabilir
  • Uygulaması hızlı ve kolaydır
  • Profil analizi ve anlam haritaları oluşturulabilir

Diğer Ölçekleme Teknikleri

Derecelendirme Ölçekleri (Rating Scales)

Jackson'a (2015) göre derecelendirme ölçekleri, en basit ve en yaygın kullanılan ölçme araçlarıdır. Sayısal derecelendirme (1-10 arası puanlama), grafik derecelendirme (bir çizgi üzerinde işaretleme) ve açıklayıcı derecelendirme (zayıf, orta, iyi gibi kategoriler) biçimlerinde uygulanabilir.

Karşılaştırmalı Ölçekleme Teknikleri

  • İkili karşılaştırma (Paired Comparison): Nesneler ikişerli olarak karşılaştırılır ve her çiftte biri tercih edilir.
  • Sıralama (Rank Order): Nesneler en çoktan en aza doğru sıralanır.
  • Sabit toplam (Constant Sum): Belirli bir puan (örneğin 100) nesneler arasında dağıtılır.
  • Q-Sort: Çok sayıda ifade, zorunlu normal dağılıma göre sıralanır.

Ölçekleme Tekniklerinin Karşılaştırması

ÖzellikLikertThurstoneGuttmanSemantik Farklılık
Geliştirme kolaylığıKolayÇok zorZorOrta
Uygulama kolaylığıKolayKolayKolayKolay
Ölçme düzeyiOrdinal (tartışmalı)IntervalOrdinal+Interval
Tek boyutlulukGaranti değilGaranti değilGarantiÇok boyutlu
Kullanım yaygınlığıÇok yaygınAzAzOrta
Tepki formatıKatılma derecesiKatılıyorum/katılmıyorumEvet/hayırZıt sıfat çiftleri
PuanlamaToplam/ortalamaOnaylanan maddelerin ortalamasıOnaylanan en zor maddeBoyut ortalamaları

Ölçeklerin Güvenirlik ve Geçerliği

Hangi ölçekleme tekniği kullanılırsa kullanılsın, geliştirilen ölçeğin güvenirlik ve geçerlik kanıtlarının sunulması zorunludur. Creswell (2009), araştırma raporlarında bu kanıtların ayrıntılı biçimde raporlanması gerektiğini belirtir.

Güvenirlik Türleri

  • İç tutarlılık: Cronbach alfa, Kuder-Richardson formülleri
  • Test-tekrar test: Aynı ölçeğin farklı zamanlarda uygulanması
  • Eşdeğer formlar: Paralel formların tutarlılığı
  • Yarıya bölme: Ölçeğin iki yarısının tutarlılığı

Geçerlik Türleri

  • Kapsam geçerliği: Uzman görüşüyle değerlendirilen içerik uygunluğu
  • Yapı geçerliği: Faktör analizi ile test edilen kuramsal yapı
  • Ölçüt geçerliği: Eşzamanlı veya yordama geçerliği; dış ölçütlerle karşılaştırma
  • Görünüş geçerliği: Ölçeğin ölçmesi gerekeni ölçüyor gibi görünmesi

Ölçek Geliştirme İçin Pratik Öneriler

  1. Amaçla başlayın: Neyi ölçmek istediğinizi net biçimde tanımlayın ve kavramsal çerçeveyi oluşturun.
  2. Uygun tekniği seçin: Araştırma sorunuza ve kavramın doğasına en uygun ölçekleme tekniğini belirleyin.
  3. Geniş madde havuzu oluşturun: Nihai ölçeğin en az 2-3 katı madde yazın.
  4. Uzman görüşü alın: En az 5-7 alan uzmanından kapsam geçerliği değerlendirmesi isteyin.
  5. Pilot uygulama yapın: Hedef kitleye benzer bir grupta ön test yapın.
  6. İstatistiksel analiz uygulayın: Madde analizi, faktör analizi ve güvenirlik analizi yapın.
  7. Revize edin: Analiz sonuçlarına göre zayıf maddeleri çıkarın veya düzenleyin.
  8. Raporlayın: Ölçek geliştirme sürecini ve psikometrik özelliklerini ayrıntılı biçimde raporlayın.

Sonuç

Ölçme ve ölçekleme teknikleri, bilimsel araştırmanın temel yapı taşlarından biridir. Kothari'nin (2004) vurguladığı gibi, soyut kavramları güvenilir ve geçerli biçimde ölçmek, araştırma bulgularının kalitesini doğrudan etkiler. Likert ölçeği pratikliği nedeniyle en yaygın kullanılan teknik olmaya devam etse de, Thurstone, Guttman ve Semantik Farklılık ölçekleri farklı araştırma bağlamlarında değerli alternatifler sunar. Jackson'ın (2015) belirttiği gibi, araştırmacının ölçekleme tekniklerinin güçlü ve zayıf yönlerini bilerek bilinçli bir tercih yapması, araştırma kalitesinin temel güvencesidir.

Kaynaklar

Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach (5th ed.). Cengage Learning.Kothari, C. R. (2004). Research methodology: Methods and techniques (2nd ed.). New Age International.Creswell, J. W. (2009). Research design: Qualitative, quantitative, and mixed methods approaches (3rd ed.). SAGE.

Yorumlar (0)

Yorum yapmak için giriş yapmalısınız.